醫學統計學范例6篇

前言:中文期刊網精心挑選了醫學統計學范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

醫學統計學

醫學統計學范文1

關鍵詞:生物信息學醫學統計學課堂教學

生物信息學融合了生物技術、計算機技術、數學和統計學的大量方法,已逐漸成為發現生命過程中所蘊涵知識的一門重要學科。其基本問題主要包括:DNA分析、蛋白質結構分析、分子進化。醫學統計學作為醫科院校的基礎課程之一,長期以來其理論和方法就廣泛應用于臨床醫學、基礎醫學的各類研究中。隨著生物新技術的誕生,在推動生物信息學發展的同時,醫學研究對象也由宏觀的病人、生物組織拓展到微觀的基因領域,所面對的實驗數據在性質和結構上也都有所不同,這對醫學統計學的應用提出了新的更高的要求。

目前,醫學統計學的很多原理和方法已成功地應用于這些新研究之中,并在此基礎之上有了新的發展和改進。如概率分布的知識與序列相似性分析、蛋白質分類等技術密切相關;方差分析、非參數檢驗方法經改進和結合后在基因表達數據的前期分析中發揮了較好的作用;而聚類分析、判別分析、相關分析這些大家所熟知的統計學方法更是在基因分類和調控網絡的建立中得到了廣泛的應用。在進行醫學統計學課堂教學時加入生物信息學方面的應用實例,不僅可以使學員了解本學科研究的前沿和醫學、生物信息學研究的新發展,還可以提高學員對于醫學統計學理論學習的興趣,掌握先進的生物實驗數據分析方法,提高今后從事醫學科研的能力。下面,本文在回顧醫學統計學授課主要內容的基礎上,就醫學和生物信息學中的可能應用舉例如下:

一、概率分布

概率分布(probabilitydistribution)是醫學統計學中多種統計分析方法的理論基礎。授課內容一般包括:二項分布、Possion分布、正態分布、t分布、F分布等。

借助概率分布常??梢詭椭覀兞私馍笜说奶卣?、醫學現象的發生規律等等。例如,臨床檢驗中計量實驗室指標的參考值范圍就是依據正態分布和t分布的原理計算得到;許多醫學試驗的“陽性”結果服從二項分布,因此它被廣泛用于化學毒性的生物鑒定、樣本中某疾病陽性率的區間估計等;而一定人群中諸如遺傳缺陷、癌癥等發病率很低的非傳染性疾病患病數或死亡數的分布,單位面積(或容積)內細菌數的分布等都服從Poisson分布,我們就可以借助Poisson分布的原理定量地對上述現象進行研究。

在生物信息學中概率分布也有一定應用。例如,Poisson分布可以用于基因(蛋白質)序列的相似性分析。被研究者廣泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速將研究者提交的蛋白質(或DNA)數據與公開數據庫進行相似性序列比對。對于序列a和b,BLAST發現的高得分匹配區稱為HSPs。而HSP得分超過閾值t的概率P(H(a,b)>t)可以依據Poisson分布的性質計算得到。

二、假設檢驗

假設檢驗(hypothesis)是醫學統計學中統計推斷部分的重要內容。假設檢驗根據反證法和小概率原理,首先依據資料性質和所需解決的問題,建立檢驗假設;在假設該檢驗假設成立的前提下,采用適當的檢驗方法,根據樣本算得相應的檢驗統計量;最后,依據概率分布的特點和算得的檢驗統計量的大小來判斷是否支持所建立的檢驗假設,進而推斷總體上該假設是否成立。其基本方法包括:u檢驗、t檢驗、方差分析(ANOVA)和非參數檢驗方法。

假設檢驗為醫學研究提供了一種很好的由樣本推斷總體的方法。例如,隨機抽取某市一定年齡段中100名兒童,將其平均身高(樣本均數)與該年齡段兒童應有的標準平均身高(總體均數)做u檢驗,其檢驗結果可以幫助我們推斷出該市該年齡段兒童身高是否與標準身高一致,為了解該市該年齡段兒童的生長發育水平提供參考。又如,醫學中常??梢圆捎胻檢驗、秩和檢驗比較兩種藥物的療效有無差別;用2檢驗比較不同治療方法的有效率是否相同等等。

這些假設檢驗的方法在生物實驗資料的分析前期應用較多,但由于研究目的和資料性質不同,一般會對某些方法進行適當調整和結合。

例如,基于基因芯片實驗數據尋找差異表達基因的問題?;蛐酒╣enechip)是近年來實驗分子生物學的技術突破之一,它允許研究者在一次實驗中獲得成千上萬條基因在設定實驗條件下的表達數據。為了從這海量的數據中尋找有意義的信息,在對基因表達數據進行分析的過程中,找到那些在若干實驗組中表達水平有明顯差異的基因是比較基礎和前期的方法。這些基因常常被稱為“差異表達基因”,或者“顯著性基因”。如果將不同實驗條件下某條基因表達水平的重復測量數據看作一個樣本,尋找差異表達基因的問題其實就可以采用假設檢驗方法加以解決。

如果表達數據服從正態分布,可以采用t-檢驗(或者方差分析)比較兩樣本(或多樣本)平均表達水平的差異。

但是,由于表達數據很難滿足正態性假定,目前常用的方法基于非參數檢驗的思想,并對其進行了改進。該方法分為兩步:首先,選擇一個統計量對基因排秩,用秩代替表達值本身;其次,為排秩統計量選擇一個判別值,在其之上的值判定為差異顯著。常用的排秩統計量有:任一特定基因在重復序列中表達水平M值的均值;考慮到基因在不同序列上變異程度的統計量,其中,s是M的標準差;以及用經驗Bayes方法修正后的t-統計量:,修正值a由M的方差s2的均數和標準差估計得到。

三、一些高級統計方法在基因研究中的應用

(一)聚類分析

聚類分析(clusteringanalysis)是按照“物以類聚”的原則,根據聚類對象的某些性質與特征,運用統計分析的方法,將聚類對象比較相似或相近的歸并為同一類。使得各類內的差異相對較小,類與類間的差異相對較大1。聚類分析作為一種探索性的統計分析方法,其基本內容包括:相似性度量方法、系統聚類法(HierarchicalClustering)、K-means聚類法、SOM方法等。

聚類分析可以幫助我們解決醫學中諸如:人的體型分類,某種疾病從發生、發展到治愈不同階段的劃分,青少年生長發育分期的確定等問題。

近年來隨著基因表達譜數據的不斷積累,聚類分析已成為發掘基因信息的有效工具。在基因表達研究中,一項主要的任務是從基因表達數據中識別出基因的共同表達模式,由此將基因分成不同的種類,以便更為深入地了解其生物功能及關聯性。這種探索完全未知的數據特征的方法就是聚類分析,生物信息學中又稱為無監督的分析(UnsupervisedAnalysis)。常用方法是利用基因表達數據對基因(樣本)進行聚類,將具有相同表達模式的基因(樣本)聚為一類,根據聚類結果通過已知基因(樣本)的功能去認識那些未知功能的基因。對于基因表達數據而言,系統聚類法易于使用、應用廣泛,其結果——系統樹圖能提供一個可視化的數據結構,直觀具體,便于理解。而在幾種相似性的計算方法中,平均聯接法(AverageLinkageClustering)一般能給出較為合理的聚類結果2。

(二)判別分析

判別分析(discriminantanalysis)是根據觀測到的某些指標的數據對所研究的對象建立判別函數,并進行分類的一種多元統計分析方法。它與聚類分析都是研究分類問題,所不同的是判別分析是在已知分類的前提下,判定觀察對象的歸屬3。其基本方法包括:Fisher線性判別(FLD)、最鄰近分類法(k-NearestNeighborClassifiers)、分類樹算法(ClassificationTreeAlgorithm),人工神經網絡(ANNs)和支持向量機(SVMs)。

判別分析常用于臨床輔助鑒別診斷,計量診斷學就是以判別分析為主要基礎迅速發展起來的一門科學。如臨床醫生根據患者的主訴、體征及檢查結果作出診斷;根據各種癥狀的嚴重程度預測病人的預后或進行某些治療方法的療效評估;以及流行病學中某些疾病的早期預報,環境污染程度的堅定及環保措施、勞保措施的效果評估等。

在生物信息學針對基因的研究工作中,由于借助了精確的生物實驗,研究者通常能得到基因(樣本)的準確分類,如,基因的功能類、樣本歸結于疾病(正常)狀態等等。當利用了這些分類信息時,就可以采用判別分析的方法對基因進行分類,生物信息學中又稱為有監督的分析(SupervisedAnalysis)。例如,基因表達數據分析中,對于已經過濾的基因,前三種方法的應用較為簡單。而支持向量機(SVMs)和人工神經網絡(ANNs)是兩種較新,但很有應用前景的方法。

(三)相關分析

相關分析(correlationanalysis)是醫學統計學中研究兩變量間關系的重要方法。它借助相關系數來衡量兩變量之間的關系是否存在、關系的強弱,以及相互影響的方向。其基本內容包括:線性相關系數、秩相關系數、相關系數的檢驗、典型相關分析等。

我們常??梢越柚嚓P分析判斷研究者所感興趣的兩個醫學現象之間是否存在聯系。例如,采用秩相關分析我們發現某種食物中黃曲霉毒素相對含量與肝癌死亡率間存在正相關關系;采用線性相關方法發現中年女性體重與血壓之間具有非常密切的正相關關系等等。

生物信息學中可以利用相關分析建立基因調控網絡。如果將兩個不同的基因在不同實驗條件下的表達看作是兩個變量,相關分析所研究的正是兩者之間的調控關系。如采用線性相關系數進行兩基因關系的分析時,其大小反應了基因調控關系的強弱,符號則反應了兩基因是協同關系(相關系數為正),還是抑制關系(相關系數為負)。

四、意義

醫學統計學范文2

關鍵詞:醫學院校 統計學教學

統計學作為醫藥衛生類學生的一門必修的基礎課程,針對不同的學生群體,教師應當采用不同的教學方法。醫學院校應以實踐為主,強調學生學有所用,在分析醫學院校統計學教學的一些特點以及應該采用的教學方法進行實踐教學。

1. 教學用通俗簡潔的語言

醫學統計學是一門對醫學臨床實踐進行調查、分析和研究,找出醫學科學發展規律,并在此基礎上做出預測或決策的學科。它作為醫藥衛生類基礎課程之一,一直被學生認為是枯燥而難學的課程。傳統的教學過于注重統計指標的計算統計理論的演繹,使學生深陷繁復的計算中,對于如何運用統計方法和統計工具解決實際問題則講得很少。教師在授課過程中一般都基于統計學基本概念的闡述和統計公式的推導,使用的語言都非常專業化、學術化。語言一定要簡潔、通俗,只有這樣才符合學生的實際情況,而且這種語言形式要貫穿講課的始終,不管是講授統計思想、統計概念還是講授統計公式,都可以把內容具體化,刪繁就簡,挑選重點有代表性地著重講解,而沒有必要針對對每一個公式都推導演算,可以通過不斷地舉實例來說明統計概念的意義,能使學生活學活用。教師在上課過程中應該多用些提問句、疑問句,引導學生發現問題、提出問題,培養學生提問問題的能力。教師還要和學生互動, 一起探討問題、解決問題,這樣可以激發學生的學習積極性,提高教學效率。所以教師在講課時要與學生熟知或學過的課程聯系,更加便于他們理解、掌握所學的統計學知識,并且能把所學過的知識融會貫通其學科之中。

2.案例教學

案例教學就是教師通過分析案例,激發學生參與討論、分析,讓學生從自己的親身體驗中理解理論知識。

2.1準備工作

要做好準備工作,就是精心選擇適當的臨床案例。所謂的適當是指:一要和所講述的理論知識聯系密切;二要難度適中,但要有綜合性,不能只針對某個具體定義而編寫,因為案例太容易就沒有挑戰性,不深入討論就學不到東西,太難就會讓一部分學生知難而退,不參與討論;三是盡量選擇學生感興趣的題材,所選的案例必須是真實發生過的事件,而不能是一個虛構的故事。

2.2課堂教學

要組織好案例教學的課堂教學。教師的角色需要發生變化,要從教師的角色轉化為一個普通學生,讓自己參與其中,充分調動學生的積極性、主動性和自覺性,放手讓學生自由討論。當學生提出問題時,不要直接作答,而是引導學生互答問題和辯論,讓學生通過討論、分析,自覺地運用所學的理論知識,自覺地歸納總結。

2.3課后總結

還要注意在案例課結束以后,要讓同學們寫總結,把課上所運用的理論知識,在討論中領悟到的知識點,以及自己歸納總結的知識書面化,只有這樣才能達到好的教學效果。

3.多媒體教學

利用多媒體教學就可以把授課重點轉向過去傳統教學顧及不到但實際上更加重要的方面,即從過去主要針對統計學概念和方法的理解轉向使學生深入理解和掌握各種統計方法的實際應用。

3.1多媒體技術教學使內容形象生動

多媒體教學可以內容變得生動、形象、具體。能使學生的注意力很快集中到課堂的教學目標中去,并使學生的學習狀態由被動變為主動,使學生們在輕松愉悅的氛圍中學到知識。

3.2多媒體技術教學更能加深學生的記憶

由于多媒體教學具有聲色兼備的優勢,我們可以通過播放視頻,向學生講述各種臨床實踐及數據統計,這樣即加深了印象也做到了了解,比起枯燥的講解,多媒體更有助于學生記憶。

3.3多媒體技術教學提高課堂教學效率顯著

多媒體教學具有大容量的特點,通過圖片、視頻使學生在課堂有限的45分鐘內,接觸到大量的知識,能夠打破教育的時空界限,拉近了學生與臨床實踐及數據統計之間的距離,即減輕了教師的勞動強度,又節省了教學時間,起到了事半功倍的效果。

3.4多媒體技術教學應用

在教學實踐中,還可以選擇一些分析軟件,例如Excel辦公軟件。Excel 是《計算機文化基礎知識》中的一部分,醫學院校的課程普遍把《計算機文化基礎知識》這門課程安排在大一上學期, 而《醫學統計學》這門專業基礎課則安排在大一下學期或大二開設。所以在學習《醫學統計學》時,學生都已對Excel的使用比較熟悉,在具體授課時教師只需把其中的統計分析功能介紹給學生,再演示一些實例,學生一般很快就能掌握,另外,還可以通過讓學生操作來檢查教學效果。

4.實踐訓練

教師還要充分利臨床實訓基地,讓學生真正地接觸現實,了解所學的知識在實際工作中的運用。還可以就具體問題,模擬問卷調查,從得到的調查數據里運用統計知識、統計方法進行分析,得出結論。例如:在教學過程中組織過學生就生活費的花費問題做過調查,在具體調查過程中考查學生都是用了哪些統計方法,效果很好。

參考文獻:

[1]張海燕.多媒體課堂教學設計探析[J].沈陽教育學院學報,2008,(6):95-97.

[2]劉仿.談多媒體教學中的利與弊[J].河南水利與南水北調,2007,(8):59.

[3]彭玲玲.多媒體在高校教學中應用的利與弊[J].黑龍江教育,2006,(2):157-158.

醫學統計學范文3

1.1單因素方差分析(ANOVA)兩兩比較誤用獨立樣本t檢驗單因素方差分析設計3組以上的均數比較,如果總體比較有差異,需進行兩兩比較,一般用SNK法或LSD法。但部分研究者卻將資料進行拆分,應用獨立樣本t檢驗進行兩兩比較,導致第Ⅰ類統計學錯誤發生率(假陽性率)增加,從而掉進了一個常見的“統計陷阱”,使所得結論可信度大大降低甚至得出錯誤結論。SNK法與LSD法雖然并非等價,實質是一致的。SNK法一般用于經方差分析結果具有統計學意義時才決定進行的兩兩事后比較,而LSD法可用于方差分析不足以具有統計學意義時也能進行兩兩比較[1]。比較兩種方法在SPSS的輸出結果形式,SNK是“分堆”比較,一目了然,對于組別數較多的研究更為好用,但沒有具體P值,而LSD是在進行“兩兩”比較時,能給出具體的P值。

1.2兩兩比較時檢驗水準的重新調定χ2檢驗或秩和檢驗3組以上整體比較有差異時,需應用分割法進行兩兩比較,這時檢驗水準應由原0.05調定為0.0167,否則會增加第Ⅰ類統計學錯誤的發生率。特別當P值處于0.0167~0.05時,按照P<0.0167的標準,差異無統計學意義,而按照P<0.05的標準,卻有意義,與事實相悖,出現假陽性,很容易得出錯誤結論。這種分割法有時很保守,當行列表資料分組多且為有序時可用Mantel-Haenszel卡方檢驗,也稱線性趨勢檢驗(testforlineartrend)或定序檢驗(Linear-by-Lineartest)[2]。統計路徑:用SPSS進行計數資料的趨勢檢驗,在輸出結果中讀取線性關聯檢驗統計量(Linear-by-LinearAssociation,LLA),如P<0.05可得出隨著病種級別的升高,檢測指標逐漸升高的趨勢。

1.3臨床診斷試驗中的統計學方法應用在臨床診斷試驗研究中,經常選取單項計量指標或者聯合計量指標以診斷某種疾病,若僅用初級統計學方法如t檢驗、單因素方差分析等往往不能有效挖掘信息,此時應采用受試者工作特征曲線(ROC)對檢測結果進行分析評價。ROC曲線分析基本原理是通過診斷界點的移動[3],獲得多對靈敏度和誤診率(1-特異度),以靈敏度為縱軸、誤診率為橫軸,連接各點繪制曲線,然后計算曲線下的面積,面積越大診斷價值越高。ROC曲線很直觀,能根據敏感性與特異性之和最大化原則自動產生最有效的診斷臨界點。具體路徑可以參考相關統計專著[3]。統計學處理一般描述為:采用SPSS(版次)統計軟件分析數據,對單項及聯合檢測結果作圖繪成ROC曲線,計算曲線下面積(AUC)和標準誤,其中聯合檢測結果變量即預測概率由Logistic回歸產生(也可以用判別分析得出)。計量資料應用-x±s表示,運用獨立樣本t檢驗及單因素方差分析,兩兩比較采用SNK及LSD法,計數資料采用χ2檢驗。檢驗水準為0.05。具體內容可據情而定。

1.4重復測量資料的方差分析誤用拆分文件的t檢驗或方差分析如研究共設3組,每位患者在3個時間點均查某項血指標,部分作者在處理此類數據時,常誤將縱向(同一時間點3組的比較)與橫向(同組3個時間點的比較)數據均應用拆分文件的t檢驗或單因素方差分析來處理,結果導致統計學第Ⅰ類錯誤發生。此組數據實質是重復測量資料,應采用重復測量資料的方差分析。SPSS中的統計路徑:數據-分析-一般線性模型-重復度量。研究者可以參考相關書籍進行處理[3]。

1.52×2析因設計及析因方差分析實驗是2×2析因設計時,分組有兩個因素,A與B,故分組為A、B、O、A+B,這個設計在析因設計研究中很常用,但常會出現分組設計正確,卻沒有用析因設計方差分析。析因設計與單因素方差分析不同[4],它不但能分析治療效果中處理因素的單獨效應和主效應,還能分析因素間的交互效應,并能提高檢驗效能。非統計專業的研究者進行析因分析可能稍有難度,可參考相關統計學書籍提供的統計步驟進行此類分析[3]。

1.6Meta分析Meta分析是循證醫學系統評價常用的方法[5],應用時需注意統計學處理中計數資料采用比值比(OR)作為效應變量。具體路徑:先進行異質性檢驗,當P>0.05時,認為同質,選擇固定模型;P≤0.05時,不同質,此時可采用敏感性分析或分層分析等異質性處理,使之達到同質后再選擇固定模型;若采用異質性處理仍未達到同質,則采用隨機模型,以上統計路徑均需交代清楚。Meta分析的結果是以“森林樹”體現的,審校中我們經常遇到作者繪制的“森林樹”左上角“文獻、對比、結果名稱”等內容顯示為“?”,這是由于部分版本的RevMan軟件不能輸入中文,此時可以考慮省去,或用Photo-shop軟件添加相應中文。Meta分析作為一種高級統計方法,專業性要求較高,作者可參考循證醫學類權威雜志上的文章格式,如《中國循證醫學雜志》中“論著•二次研究”欄目的循證文章。

2科技論文中統計學處理的相關表述

2.1資料與方法中具體統計路徑的描述“統計學處理”的內容常位于論文資料與方法的最后一段,一般來說包括統計軟件名稱及版次、統計描述、統計方法、檢驗標準等內容,亦可細致交待每個表格的具體統計方法。經典例子如下,“統計學處理:采用SPSS(版次)統計軟件分析數據。計量資料用均數±標準差表示,采用單因素方差分析,兩兩比較采用SNK法及LSD法。檢驗水準為0.05”。上述內容包括了大致的統計方法,即具體的統計路徑。此部分內容,沒有絕對統一的規定[6]。常見的問題有:統計學方法描述不全、內容過于簡單、存在粘貼抄寫痕跡等。如部分論文的統計學處理中提及“以α=0.05為檢驗水準,P<0.05為差異有統計學意義”這句話,這在統計學上實質是一個重復句,保留其一即可。

醫學統計學范文4

一、樣本與總體

前面已提及,醫學研究中實際觀測或調查的一部分個體稱為樣本,研究對象的全部稱為總體。如作水質檢驗時從井水或河水中采的水樣,臨床化驗中從病人身上采的血液或其它活體組織標本,是樣本;而整個一口井或一條河的某一段所有的水,某病人全身所有的血液或某個組織器官,則是總體。這類總體是具體存在的,但另有些總體卻是假想的,只是理論上存在的一個范圍。例如試驗某一治療流感新藥的療效,最初接受治療的一批流感患者,不論數量多少,都只是一個樣本。若該藥療效得到肯定,從而加以推廣,那么此后凡在相同條件下接受該藥治療的所有流感患者,都屬于這個總體。可是當初試用時,這個總體還并不存在,是假想的。

總體包含的觀察單位通常是大量的甚至是無限的,在實際工作中,一般不可能或不必要對每個觀察單位逐一進行研究。我們只能從中抽取一部分觀察單位加以實際觀察或調查研究,根據對這一部分觀察單位的觀察研究結果,再去推論和估計總體情況。如上述某新藥治療流感例子,試驗治療的只是少數有限的病人,而結論卻要推廣到全體,得出一個該藥對所有流感患者之療效的規律性的認識。所以說,觀察樣本的目的在于推論總體,這就是樣本與總體的辯證關系。

為了使樣本能夠正確反映總體情況,對總體要有明確的規定;總體內所有觀察單位必須是同質的;在抽取樣本的過程中,必須遵守隨機化原則;樣本的觀察單位還要有足夠的數量。

二、概率

又稱機率,是用以描述某事件發生的可能性大小的一個數值。

在自然界和人類社會中,存在著兩類不同的現象:①在一定條件下,肯定發生的事件叫做必然事件,肯定不發生的事件叫做不可能事件。如在適當溫度濕度下經一定時間孵化,正常受精雞蛋必然會孵出小雞來,而石頭是不可能孵出小雞來的。必然事件與不可能事件雖然形式相反,但兩者在發生某種結果與否都是確定的,故統稱確定性現象。②在基本條件不變的情況下,可能發生的結果有多種,究竟發生哪種結果,事先不能肯定,這類現象叫做隨機現象。隨機現象的表現結果稱為隨機事件。如任意拋擲一枚硬幣,可能徽花向上也可能幣值向上,拋擲前不能肯定,這是一個隨機現象,而結果出現“徵花向上”則是一個隨機事件。

(一)古典概率 是最簡單的隨機現象的概率計算。這類隨機現象具有兩個特征:①在觀察或試驗中它的全部可能結果只有有限個,譬如為n個,記為E1,E2,…,En,而且這些事件是兩兩互不相容的,即任何兩個事件不能同時發生;②事件E1,E2,…,En的發生或出現是等可能的,即它們發生的概率都一樣。古典概率的大部分問題都能形象地用摸球模型來描述。有利于直觀地理解概率論的許多基本概念;而且它有著多方面的重要應用,例如工業產品的抽樣檢查等。

(二)統計概率 上述“事件”是指不能再進行分解或不能由其它事件構成的基本事件。在實際工作中,基本事件的發生并不總是等可能的,而且有時為無窮多個。這樣就有必要把古典概率的定義加以推廣,從事后經驗的角度來理解概率的意義。實踐證明,雖然個別隨機事件在某次試驗或觀察中可以出現也可以不出現,但在大量重復試驗中它卻呈現出明顯的規律性。假設在相同條件下,獨立地重復做n次試驗,某隨機事件A在n次試驗中出現了m次,則比值m/n稱為隨機事件A在n次試驗中出現的頻率。當試驗重復很多次時,隨機事件A的頻率m/n就會在某個固定的常數P附近擺動,而且n愈大擺動的幅度愈小。這種規律性稱之為統計規律性。頻率的穩定性說明隨機事件發生的可能性大小是隨機事件本身固有的、不隨人們意志為轉移的客觀屬性,所以在醫學科研中,當n充分大時,就以頻率作為概率的近似值,記住P(A)即

由此可見,頻率是就樣本而言的,而概率總是從總體的意義上說的。這樣,概率就為預計某一事件發生的可能性大小,提供了衡量的尺度。

例如:某病患者40名,用某療法治療后,其中35人痊愈,治愈者占治療人數的35/40,這是頻率。因為數量少,這個頻率可能波動較大。假如經過長期的大量觀察,比如數百、數千例,得到治愈率為70%,我們就可以說,該療法治愈某病的概率近似值為70%。

又如:某院婦產科在一個月內出生嬰兒30名,其中男嬰18名,占新生兒數的18/30,這叫頻率。大量統計表明,人口中男女的比例基本上是1:1。這是個較穩定的常數,即概率的近似值。于是,在嬰兒分娩前,我們就可用它作為尺度,預計是男的概率為1/2(0.5或50%),是女的概率也為1/2(0.5或50%)。

通過以上討論,可以知道:如果某事件是必然事件,則有m=n,所以必然事件的概率等于1;如果某事件是不可能事件,則有m=0,所以不可能事件的概率等于0;如果某事件是隨機事件,則有0

三、隨機變量

簡單地說,是指隨機事件的數量表現。例如一批注入某種毒物的動物,在一定時間內死亡的只數;某地若干名男性健康成人中,每人血紅蛋白量的測定值;等等。另有一些現象并不直接表現為數量,例如人口的男女性別、試驗結果的陽性或陰性等,但我們可以規定男性為1,女性為0,則非數量標志也可以用數量來表示。這些例子中所提到的量,盡管它們的具體內容是各式各樣的,但從數學觀點來看,它們表現了同一種情況,這就是每個變量都可以隨機地取得不同的數值,而在進行試驗或測量之前,我們要預言這個變量將取得某個確定的數值是不可能的。

按照隨機變量可能取得的值,可以把它們分為兩種基本類型:①離散型隨機變量,即在一定區間內變量取值為有限個,或數值可以一一列舉出來。例如某地區某年人口的出生數、死亡數,某藥治療某病病人的有效數、無效數等。②連續型隨機變量,即在一定區間內變量取值有無限人’或數值無法一一列舉出來。例如某地區男性健康成人的身長值、體重值,一批傳染性肝炎患者的血清轉氨酶測定值等。

四、誤差

誤差是指實際觀察值與客觀真值之差、樣本指標與總體指標之差。誤差可分為系統誤差和隨機誤差。

(一)系統誤差 在實際觀測過程中,由于儀器未校正、測量者感官的某種障礙、醫生掌握療效標準偏高或偏低等原因,使觀察值不是分散在真值兩側,而是有方向性、系統性或周期性地偏離真值。這類誤差可以通過實驗設計和技術措施來消除或使之減弱,但不能靠概率統計辦法來消除或減弱。

(二)隨機誤差 或稱偶然誤差,是指排除了系統誤差后尚存的誤差。它受多種因素的影響,使觀察值不按方向性和系統性而隨機地變化。隨機誤差服從正態分布,可以用概率統計方法處理。

在隨機誤差中,最重要的是抽樣誤差。我們從同一總體中隨機抽取若干個大小相同的樣本,各樣本平均數(或率)之間會有所不同。這些樣本間的差異,同時反映了樣本與總體間的差異。它是由于從總體中抽取樣本才出現的誤差,統計上稱為抽樣誤差(或抽樣波動)。抽樣誤差在醫學生物實驗中最主要的來源是個體的變異。所以這是一種難以控制的、不可避免的誤差。但抽樣誤差是有一定規律的。研究和運用抽樣誤差的規律’是根據樣本估計總體時所必須領會的基本概念之一,也是醫學統計學的重要內容之一。

隨機誤差中還包括重復誤差。它是由于對同一受試對象或檢樣采用同一方法重復測定時所出現的誤差。如用天平稱同一個燒杯的重量,重復測定多次,其結果會有某些波動??刂浦貜驼`差的手段主要是改進測定方法,提高操作者的熟練程度。重復是摸清實驗誤差大小的手段,以便分析和減少實驗誤差。

五、假設檢驗

亦稱顯著性檢驗,其基本原理是先對總體的特征作出某種假設,然后通過抽樣研究的統計推理,對此假設應該被拒絕還是接受作出推斷。

醫學統計學范文5

1資料與方法

1.1一般資料在學期開始前,由學校教務處通過“本科教務系統”把各個班的教學任務分配給任課老師(本課題的研究者之一),研究者在被分配到的班上開展調查研究。因此,理論上各個班級均有相同的概率納入本研究。本研究樣本為2013級臨床專業某班醫學生,共86名學生,其中男46名,女40名。

1.2教學方式改進方法本研究所采用的教學方法與學生課程成績考核制度相關聯,以增加學生配合新教學方法的積極性。課程成績考核辦法為:平時成績與期末考試成績各占50%。其中,平時成績包括:完成作業的認真程度(40%)+主動分享(10%)+參與“翻轉課堂”實踐(50%)。完成作業的認真程度中包含有對預習任務的考查,主動分享則包括了課堂主動發言及課程中心論壇參與。

1.2.1改革考核方式,培養學生主動預習與思考的習慣本研究通過在學生課后作業中加入預習內容來促進學生養成預習的習慣。對學生完成作業認真程度的考查包含有對預習作業完成情況的考查,此部分成績占平時成績的40%。通過增加預習作業占期末成績的比重來激勵學生預習,從而培養學生養成課前預習與思考的習慣。為了使該方法能夠得以實際應用,本研究在課程開始時便與學生溝通成績考核方式,強調了預習工作的重要性,并且設計了符合學生學習能力的預習作業。

1.2.2改進教學方法,培養學生抽象思維與科研思維能力本研究創新性地應用了PBL學習法[1-2],即“以問題為導向的學習方法”來鼓勵學生參與課堂學習。在引導學生學習的過程中,以問題為載體,鼓勵學生以單獨或小組合作的形式去探究和解決問題,在這個過程中,學生們步步深入,逐步發掘問題背后所隱含的信息,從而獲得知識,其科學思維方式也得到鍛煉。

在開展PBL教學法時利用了“四川大學課程中心”醫學統計學論壇,鼓勵同學們在論壇上提問并勇于提出個人見解供大家探討。另外,同學們也可以在論壇里跟帖討論。該論壇建立后,同學們將課后產生的問題以發帖的形式在論壇進行提問,大家紛紛在復習課程內容、查閱相關資料后在論壇進行相互討論。從論壇訪問量可看出該方法初有成效,同學們對該方法參與度較高。例如:

動物疫病監測主要是在指定時間內,對動物疫病的發生、流行以及分布等因素進行調查。同時,對所采集的樣本采用國家規定的標準方法進行疫病的診斷,使我國動物防疫人員能了解該疫病的發生、流行趨勢以及變化規律。當防疫人員了解這些信息資料后,就能提出相應的解決對策。在動物疫病防控工作中,動物疫病監測極其關鍵,只有相關部門切實提高動物疫病的監測水平,才能為后期的疫病防治工作打下基礎。

同學乙回答:“我個人覺得系統誤差能不能被消除不是一個絕對的概念,我們可以通過很多手段來降低系統誤差,當系統誤差被降到極小極小時可以認為系統誤差已被消除。類似于9≈1這種情況?!?/p>

同學丙回答:“系統誤差不能完全避免。”

在同學們針對問題進行復習、查閱資料后,老師在論壇為大家做出了解答

1.2.3實施翻轉課堂,提高學生團隊協作能力與解決實際問題的能力本研究通過設計“翻轉課堂”課程實踐[3],其目的一方面為提高學生團隊協作能力,另一方面為培養學生統計思維和科研能力,同時也以科研課題為導向,引導同學們更深入地理解統計學知識,提高學習的積極性,改善學習態度。該實踐提供3個板塊的課題:“教學相長”、“牛刀初試”和“腦洞大開”,分別側重于知識理解、知識運用和創新能力。在學期開始時將全班同學分成若干組,每組同學可根據自己的興趣愛好和學習情況確定一個研究課題,并指定一位課外專家作為顧問,根據課外專家指導開展研究。每周的理論課和實習課結束后,由授課老師和助教回答學生的問題并作指導。每組同學分別在課程中期及結束時進行課題的中期匯報和結題報告,展示研究成果。

例如:某一小組以“成都市噪音污染與心血管疾病相關性究方案設計”為題,以某專家為顧問進行翻轉課堂課程實踐,在文獻閱讀、研究目的和內容的確定等研究過程后,在指導老師指導下設計了成都市社區噪音與心血管患病率相關性的調查表,完成了方案設計。通過參與此次課程實踐,學生在結題報告中得出總結“本課題范圍大,要求嚴,難度高。從這次的方案設計過程中,我們認識到團體協作和交流的重要性,團體內分工明確,與其他團隊共同交流學習,能夠更有效率地完成工作。另外,對橫斷面研究的過程和思路有了一個更為明確的了解,這為我們將來進行其他的臨床研究打下了基礎。最重要的是,從本次的方案設計中,我們對于統計學和流行病學的知識有了更為深刻的理解,能夠初步將所學到的書本知識應用于科學研究,如設計科學合理的問卷并能進行統計分析、推斷?!庇纱丝梢娡ㄟ^開展“翻轉課堂”課程實踐,學生不僅意識到團隊協作能力的重要性,也在實踐過程中鍛煉了團隊協作能力;另一方面,學生在統計思維和科研能力方面均有所進步。

1.3教學方式效果評估方法

1.3.1問卷調查法本研究在借鑒已開發的學習效果評價量表[4]的基礎上改進設計了學生自評調查量表,在課程開始前和課程結束時分別對學習《醫學統計學》的學生開展問卷調查,對學習態度、學習能力、知識掌握情況、合作技能4個維度做出評估。經信效度檢驗[5],問卷的Cronbach′sα為0.896,表明內部一致性較好。

1.3.2學習效果客觀評價主要指標包括4個方面,分別是(1)網絡課程中心的使用情況:課程中心的登陸人次數、附件的下載量和發帖留言量;(2)“翻轉課堂”9個科研小組課題完成情況;(3)學期前、后行學生自評調查量表調查;(4)開放題關鍵詞分析結果。

1.4統計學處理采用SPSS20.0軟件分析數據,計量資料用width=38,height=17,dpi=110表示,比較采用t檢驗,計數資料用頻數表示,以P<0.05為差異有統計學意義。

2結果

2.1課程參與情況在課堂討論過程中,大部分學生都積極主動地參與討論,思維活躍,邏輯清晰。在網絡課程中心使用方面,課程中心的登陸人次數共計1896次、表1為互動欄目中的論壇版塊的部分內容。

2.2“翻轉課堂”完成情況學生積極參與實踐,每個小組都在課程結束時完成了科研內容,在期末結題匯報時順利展示了一個學期的科研成果,并撰寫了結題報告。

2.3學生自評調查量表調查結果

表1課程中心論壇部分帖子展示

width=733,height=176,dpi=110

2.3.1學期前、后學生自評調查量表各維度自評分比較學期前、后兩次調查結果比較分析顯示,課程結束時學習態度、學習能力、知識掌握情況及合作技能4個維度的自評分平均值較課程開始時有所提高,差異有統計學意義(P<0.05,P<0.01)。見表2。

表2課程前后自評量表各維度得分比較width=41,height=17,dpi=110分)

width=369,height=129,dpi=110

2.3.2開放題關鍵詞分析結果為了對教學方式的改進效果做更深入的分析,學生自評調查量表采用了定性與定量相結合方式,將問卷第5題設計為開放問題,問題如下:“你覺得今后的教學應該如何改進?”。對86份問卷整理后,對關鍵詞提取并做了頻次的統計,見圖1。從圖1可以看到,超過50%的同學對《醫學統計學》教學方式改進的感受較好,并認為課程安排能夠有效調動學習的積極性。另外,對此次教學改革的意見和建議中,反饋頻次較多的有以下幾點:“增加上機操作”“增加習題的講解”“作業中增加SPSS讀圖題”“課堂中增加隨機抽講”,以及“進一步改進翻轉課堂”等。

width=324,height=220,dpi=110

圖1開放題關鍵詞頻數分析

3討論

本研究顯示,在教學方式改進之后,學生在學習態度、學習能力、知識掌握情況、合作技能4個維度均有所改善,表明本研究所做的教學方式的改進和探討,有效改善了教學效果,提高了學生學習興趣,學習態度與團隊協作能力,更重要的是培養了學生的科學思維方式。

3.1改善了學生的學習態度在學期開始前的調查中,醫學生對于學習態度部分的自評分是4個維度中最低的。對此,一方面,本研究采用在作業中加入下一次課程內容、增加平時成績占比的方法。課程開始前、課程結束后學習態度的自評分差異有統計學意義(P<0.05),可以認為此項方法在提高學生課堂積極性,改善學生學習態度方面是有效的。另一方面,從作業完成質量(作業上交的及時率、每次作業的成績)上可以看出,課前預習可以加深同學對知識的掌握程度,在一定程度上解決了《醫學統計學》“學生學習累”的問題。本研究采用PBL教學模式,鼓勵學生參與課堂內容。在這個過程中,學生們步步深入,逐步發掘問題背后所隱含的信息,從而獲得知識。從課程中心的訪問量可以充分表明此模式的應用調動了學生積極性、激發了同學的探索欲、做到了讓學生學以致用。

醫學統計學范文6

關鍵詞:大數據;醫學統計學;教學

Suggestions on Medicostatistics Teaching in the Age of Biomedical Big Data

Li Shenghui Xu Zhiwei Zheng Zhijie

(School of Public Health affiliated with Shanghai Jiaotong University,Shanghai 200027,China)

Abstract:With the development of electronization, informatization, digitalization, and intelligentization in residents’ health records management system, along with the increasing accumulation of biomedical research data, a large amount of biomedical data (Big data) has been and will be generated. Consequently, there is an increasing need to better understand and mine the data to further knowledge on health management stratege and health policy making. This article discusses the challenges of big data on statistical theory and methods, furthermore, attempts to give some suggestions on how to adjust medicostatistics teaching strategy in the age of biomedical big data.

Key words:big data;medicostatistics;teaching

所謂大數據(Big Data),是指具有4V特征且用目前的管理、處理技術手段難以進行有效管理和分析的數據。4V的含義是數據量大(Volume Big),數據量級擴大至PB以及ZB級別;數據產生、輸入和處理快速化(Velocity Fast);數據結構和類型多樣化(Variable Type)及數據價值密度低(Value LowDensity)。大數據的目的是將數據轉化為知識,探索數據的產生機制和過程,進行預測和政策制定。隨著醫學健康檔案“電子化、信息化、數字化、智能化”的管理,隨著物聯網在醫學健康領域的應用,醫療、護理、康復、保健工作流程中產生的數據存儲量呈指數增長。如何有效地利用這些海量信息為健康管理、臨床治療、醫院決策及衛生政策制定提供支持,是大數據時代醫學信息化帶來的挑戰。美國國家衛生研究院(NIH)為此特設立生物醫學大數據研究中心及專項基金。在我國,科技部、國家自然科學基金委、國家社會科學基金委陸續醞釀和啟動了“大數據的處理與應用”系列重大研究項目。

統計是一門數據科學,醫學統計學是關于醫學健康數據的收集、整理、分析和解釋的方法論學科。“大數據”處理對統計學的發展提出了新的命題,如何將“醫學信息大數據”處理技術融入相關統計學課程教學以促進現代醫學信息分析技術的發展?本了相關的分析,并提出應該思考的一些問題。

一、大數據對統計學原理和方法提出的挑戰

1.統計數據產生由“問題導向”到“數據驅動”

目前,統計數據的產生主要是基于所要研究的問題而主動進行的“數據收集”,落腳點在于如何獲取數據。在大數據時代,海量數據隨處可得,由數據驅動而進行問題研究將非常普遍。那么,獲得數據的關鍵點不在于如何獲得,而在于如何識別與選擇。由“問題導向”產生的結構數據是經過嚴格抽樣設計獲取的,具有系統誤差小、總體代表性好的優勢,但是信息量有限,且數據獲取周期長。大數據流環境下,海量數據中有價值的數據可能并不多,即數據的價值密度低,且難以避免和判斷數據獲取的誤差和偏倚。在很多情況下,統計數據不需進行抽取,而是“數據樣本即總體”;同時,也要研究如何從源源不斷的數據中抽取足以滿足統計目的和精度的樣本,這需要研究新的序貫性和動態性的抽樣方法。

2.數據格式和結構復雜多樣化

目前統計數據都是結構化數據,如疾病空間分布和時間序列數據等,可使用二維表格表示,可以方便地被常規統計軟件讀取和進行分析。在大數據背景下,除少量數據具有結構化特征外,更多的是半結構和非結構化數據,如各種格式的文檔、圖片、網頁、圖像、音頻和視頻等。目前,這些半結構和非結構化的大數據僅能做到初步的實時業務應用。如在研究氣候變化與人類健康相關的命題時,需要處理龐大的氣象數據,而80%以上的氣象數據均為非結構化的大數據,如何將這些非結構化的大數據做到降維、分解和長時間序列儲存無疑是統計學面臨的新命題。

3.大數據的整合及跨庫分析方法亟待建立

傳統上,數據集的合并和拆分都是利用關系數據庫技術,如共同的編碼或關鍵字進行操作。在大數據環境,很多數據集不再有標識個體的關鍵字,關系數據庫鏈接方法不再適用,需要探討利用數據庫之間的重疊項目來結合不用的數據庫。此外,還可以改變分析思路,如直接利用局部數據進行推斷,然后整合這些數據集的統計結論。

4.大數據對于統計學核心理論的沖擊

一個新生事物的出現將必定導致傳統理論和技術的變革。大數據對傳統統計學原理和方法的沖擊是劃時代的。傳統的統計學方法和理論立足于應用抽樣技術在總體中抽取小樣本進行分析,通過樣本統計量推斷總體的參數和性質。在大數據背景下,我們更關心的不是數據量的大小,而是數據所蘊含的信息量及信息的識別和選擇。因此,大數據的預處理如數據清洗、糾偏完全跳出了傳統小樣本研究的范疇。同時,大數據充滿了各種隨機的、非隨機的誤差和偏倚,很難滿足小樣本數據精度和分布的要求。在大數據時代,需要進一步拓展統計思維,豐富現有統計學的理論和方法,賦予統計學新的生命力。

二、在大數據時代對統計學教學的幾點思考

《“十二五”時期統計發展和改革規劃綱要》中明確提出,“建立現代統計體系就是建立以現代信息技術為支撐的統計系統”。根據這個綱要,計算機技術、互聯網系統、多媒體等現代信息技術在統計技術中將發揮更重要的作用。在醫學信息大數據時代背景下,醫學統計學教育是否能夠與時俱進,迎接大數據帶來的機遇與挑戰?為此,筆者談幾點思考:

1.補充和加強數學基礎和計算機應用課程

在大數據背景的沖擊下,統計學教育首先要面臨兩大沖擊。一是大數據背景下的統計模型將會跳出原有的傳統統計模型框架,需要更廣泛的學習一些數學概念,如拓撲、幾何和隨機場,這些數學知識將會在龐大數據分析的背景下扮演重要的角色。二是算法和計算機上的實現是傳統教育面對的更大挑戰,大數據環境下的數據是海量的,同時又是結構化、半結構化、非結構化的混合數據,處理這些技術需要先進的計算機技術平臺。在大數據和信息化的時代背景下,在目前醫學生的通識教育中,是否應該加強數學基礎及計算機應用等相關課程的教育?值得思考。

2.滲透大數據基本知識和統計思維

統計思維的培養,是提高學生處理數據和運用數據分析實際問題能力的重要一環。在大數據時代,并非所有的醫學健康問題都通過大數據方式去處理,基于小樣本的分析仍然是最基本和最有效的實現方式。因此,傳統統計學基礎和原理仍然為醫學統計學教育的核心和重點。與此同時,結合大數據技術的特點,對統計學的基本知識進行拓展教育,有計劃地將大數據的統計分析思維滲透在教學工作中。將大數據的基礎知識,如數據來源、數據結構和格式、收集和篩選,在教學中進行適當補充。引導學生將已有的統計學基本原理和方法運用到大數據處理中。

3.擴充實驗教學內容,夯實基本軟件操作

統計學是一門處理數據的方法學科,重在應用。因此,在系統統計原理教學的基礎上,更加側重實踐性和應用性的訓練。在目前的統計學教學中,學生普遍比較缺乏的不能將醫學實際問題正確的轉化為統計學問題,不能根據資料根據資料的設計類型、性質和分析目的靈活選用合適的統計分析方法。通過綜合性的實際案例,將醫學科研中的實際問題納入教學,使學生虛擬的置身于科研一線,去感受和完成科學研究中的統計學應用。大數據時代,數據、資料的產生方式發生了很大變化,因此,需要增加部分大數據方面的數據、資料收集和整理方法的訓練內容。大數據背景下,數據中除了一些結構性數據外,更多的是半結構和非結構化數據,很難用傳統的二維數據表顯示方式予以直觀化。因此,除了目前常用的統計圖、統計表外,還應該逐步補充一些比較復雜的數據透視化技術方面的教學,如探索性可視化描述工具、Tableau、TIBCO和QlinkView以及敘事可視化工具等。

在大數據時代,在統計學的教與學中,不應要求死記有關概念、定理和計算公式,而應加強統計學基礎性原理與知識的教學,凸出統計學理論與方法的應用性,建立起大數據統計思維。學習統計學是為了應用和解決實際問題。對教師來說,教好醫學統計學的標志是教會學生運用統計思維思考問題和選擇合適的統計方法解決實際健康決策及健康管理問題。對學生來說,學好統計學的標志是建立統計思維,能夠以問題為導向,在統計思想的引導下,選擇合適或最優的統計方法,或者通過創新統計方法,有效地解決實際問題。

參考文獻:

[1]Fan J,Han F,Liu H.Challenges of Big DataAnalysis[J].Natl Sci Rev,2014 Jun,1(2):293-314.

[2]Ohno-Machado L.NIH'sBig Data to Knowledge initiative and the advancement of biomedical informatics[J]. J Am Med Inform Assoc,2014 Mar-Apr,21(2):193.

[3]Margolis R,Derr L,Dunn M,Huerta M,Larkin J,Sheehan J,Guyer M,Green ED.The National Institutes of Health's Big Data to Knowledge(BD2K)initiative:capitalizing on biomedical big data[J].J Am Med Inform Assoc,2014 Nov,21(6):957-8.

[4]Zhang Z.Big data and clinical research:focusing on the area of critical care medicine in mainland China[J].Quant Imaging Med Surg,2014 Oct,4(5):426-9.

[5]耿直.大數據時代統計學面臨的機遇與挑戰[J].統計研究,2014,31(1):1-9.

[6]Kaplan RM,Chambers DA,Glasgow RE.Big data and large sample size:a cautionary note on the potential for bias [J]. Clin Transl Sci.2014 Aug,7(4):342-6.

[7]沈文海.氣象數據的“大數據應用”淺析――<大數據時代>思維變革的適用性探討[J].中國信息化,2014,6(235):20-31.

[8]張學敏.大數據時代的數據分析[J].探索與觀察,2014,8(16):5.

基金項目:上海市高校一流學科建設(公共衛生與預防醫學);上海市公共衛生優秀學科帶頭人培養計劃(編號:GWDTR2012

亚洲精品一二三区-久久