武漢大學醫(yī)學統(tǒng)計學串講講義演示文檔

上傳人：1**

文檔編號：359924

上傳時間：2018-06-28

格式：PPT

頁數：540

大?。?.58MB

《武漢大學醫(yī)學統(tǒng)計學串講講義演示文檔》由會員分享，可在線閱讀，更多相關《武漢大學醫(yī)學統(tǒng)計學串講講義演示文檔（540頁珍藏版）》請在裝配圖網上搜索。

.,醫(yī)學統(tǒng)計學武漢大學,.,第一部分緒論,.,,,,,,一、什么是統(tǒng)計學? What’s statistics?,是一門關于收集、整理和分析（統(tǒng)計）數據的科學。醫(yī)學統(tǒng)計學是統(tǒng)計學方法在醫(yī)學中的運用。醫(yī)學研究中觀測結果多為隨機事件，通過統(tǒng)計學方法可以揭示其內在規(guī)律。,.,（1）設計： design （2）收集資料 collection of data （3）整理資料 sorting data （4）分析資料 analysis of data,二、統(tǒng)計工作的基本步驟,1）專業(yè)設計 2）統(tǒng)計設計,1）統(tǒng)計報表 2）醫(yī)療衛(wèi)生工作記錄 3）專題調查和實驗,1）對數據檢查、核對 2）按分析要求分組、匯總,1）統(tǒng)計描述 2）統(tǒng)計推斷,.,用定量方法測定得到，有大小之分，有度量衡單位。,三、統(tǒng)計資料類型,（一）計量資料 measurement data,.,將觀察單位按屬性或類型分組計數所得的資料。分為：1、二項分類資料； 2、多項分類資料。,（二）計數資料 enumeration count data,.,.,（三）等級資料 ranked ordinal data,將觀察單位按某屬性不同程度分組計數所得的資料。,.,例：測得一群人Hb值（g/dL），此資料為計量資料；按正常和異常分為兩組，此時資料為計數資料；按量的多少分為: 16 (Hb增高)。此時資料為等級資料。,資料間的相互轉化,.,四、統(tǒng)計學的基本概念,（一）同質與變異,同質（homogeneity）指各觀察指標受相同因素影響的部分。,變異（variation) 在同質的基礎上個體間的差異。,.,例某地某年用隨機抽樣方法檢查了140名健康成年男子的紅細胞數（1012/L），檢測結果如下表：,觀察指標的同質部分：“某地某年健康成年男子” 觀察指標的變異部分：各個體間紅細胞數間的差異,.,醫(yī)學統(tǒng)計學的基本概念,（二）總體與樣本（population & sample),總體：是根據研究目的所確定的同質觀察單位（某種變量值）的全體。 1）有限總體（有時間、空間限制）例研究2008年溫州市肝癌死亡率。 2）無限總體例研究某藥對高血壓病的療效。樣本：從總體中隨機抽取一部分個體所組成的集合。,.,醫(yī)學統(tǒng)計學的基本概念,（三）隨機抽樣,1.單純隨機抽樣 2.系統(tǒng)（機械）隨機抽樣 3.整群隨機抽樣 4.分層隨機抽樣,從總體中隨機抽取部分個體的過程。（總體中每一個觀察單位均有同等的機會被抽取到）隨機抽樣是樣本客觀反映總體情況的前提。隨機抽樣方法：,.,單純隨機抽樣,即先將調查總體的全部觀察單位編號，再隨機抽取部分觀察單位組成樣本。,例：欲了解某單位職工HBsAg陽性率，該單位有職工1000人，試按單純隨機抽樣法，抽取一例數為100的樣本。,.,系統(tǒng)隨機抽樣,又稱等距抽樣或機械抽樣，即先將總體的觀察單位按某一順序號等分成n個部分，再從第一部分隨機抽第k號觀察單位，依次用相等間隔，機械地從每一部分各抽一個觀察單位組成樣本。,例：欲了解某單位職工HBsAg陽性率，該單位有職工1000人，試按系統(tǒng)抽樣法，抽取一例數為100的樣本。,.,整群隨機抽樣,先將總體劃分為n個群，每個群包括若干觀察單位，再隨機抽取k個群，并將被抽取的各個群的全部觀察單位組成樣本。,例：某校有80個班級，各班學生50人，現用錫克氏試驗調查該校學生白喉易感率，隨機抽查了8個班的全部學生。,.,分層隨機抽樣,按有關影響因素把觀察對象分成若干層次，然后將同一層次的觀察對象進行隨機抽取。,例：欲了解某地人群HBsAg陽性率情況，按年齡段、職業(yè)、性別等因素分層后進行抽樣。,.,醫(yī)學統(tǒng)計學的基本概念,（四）誤差主要有：粗差、系統(tǒng)誤差、隨機誤差（如測量誤差、抽樣誤差等）,問題：某中醫(yī)師對某方劑進行改良，改良后的方劑治療某病患者30例，有效率為80%，原方劑治療30例，有效率為60%，問兩者有效率有無差別？,抽樣誤差：抽樣引起的總體參數與樣本統(tǒng)計量之間sampling error 的差別。,.,醫(yī)學統(tǒng)計學的基本概念,（五）參數與統(tǒng)計量 (parameter & statistic) 參數：統(tǒng)計量：檢驗統(tǒng)計量：,總體的特征量，如總體均數、總體標準差等。樣本的統(tǒng)計指標如樣本均數、標準差等。用于統(tǒng)計檢驗的樣本指標。如 t、u、x2、F 等,.,均表示某事件發(fā)生可能性大小的量。,（六）頻率和概率,但：頻率為變量，fn(A) =m/n 概率P(A)為常數。若n足夠大， fn(A) ≈P(A),?小概率事件 P(A) ? 0.05 “小概率事件一次是不太可能發(fā)生的”,醫(yī)學統(tǒng)計學的基本概念,第二部分計量資料的統(tǒng)計描述,.,第一節(jié) 計量資料的統(tǒng)計描述,一、計量資料的頻數表二、集中趨勢的描述三、離散程度的描述,.,,1、頻數表的編制 2、頻數分布的特征 3、頻數分布的類型 4、頻數表的用途,,一、計量資料的頻數表,.,例某地用隨機抽樣方法檢查了140名成年男子的紅細胞數，檢測結果如下表：,,.,(1)求全距或極差(R),(2)定組段和組距(i),1. 頻數表的編制,.,(3)列出頻數表,某地140名正常男子紅細胞數的頻數表,.,2. 頻數分布的特征,(1)集中趨勢 (2)離散趨勢,.,(1)對稱分布其中一種常見的類型為正態(tài)分布. (2)偏態(tài)分布有正偏態(tài)、負偏態(tài)之分.,3. 頻數分布的類型,.,4. 頻數表的用途 (1)了解資料的分布類型. (2)發(fā)現異常值. (3)在頻數表的基礎上計算有關指標。,.,1、算術均數 μ ，X 2、幾何均數 G 3、中位數 M,,二、集中趨勢的描述,.,概念: 數值的平均. 計算: 1)直接法:,例2.1 求某地140名正常成年男子紅細胞數均值為,,,1. 均數（mean) μ ，X,2)加權法:,,應用: 對稱分布，尤其是正態(tài)分布.,.,概念：指一組數據的倍數平均。計算：(1)直接法：,2. 幾何均數 ( geometric mean, G ),,.,例：5份血清的抗體效價為1：10，1：100，1：1000，1：10000，1：100000，求其平均效價。,或者： 1：10，1：100，1：1000，1：10000，1：100000的指數部分為：-1，-2，-3，-4，-5，其平均值為-3，故G =10-3=1：1000,.,（2）加權法：,.,何謂對數正態(tài)分布？某資料由變量值 X1，X2，…… Xn組成，已知其分布呈偏態(tài)。若每個變量值取對數，如Y1=lgX1，Y2=lgX2，…… Yn=lgXn，且Y1，Y2，…… Yn呈正態(tài)分布。此時，,將對數值還原為原始數值，則：,?應用: (1)變量值呈倍數關系 (2)對數正態(tài)分布,.,3. 中位數 M,概念：是一組由小到大按順序排列的觀察值中位次居中的數值。計算：(1)直接法: n為奇數時,,n為偶數時,,某病患者9人發(fā)病潛伏期為2,3,3,3,4,5,6,9,16天, 求中位數。若在第20天又發(fā)現1例患者，則其中位數為：,3. 中位數 (median M),.,利用百分位數計算公式進行計算. 百分位數(PX)是一種位置指標, 。中位數是一個特定的百分位數，即M= P50 。,(2)頻數表法：,.,百分位數計算公式：,.,百分位數計算公式：,M,.,M,.,.,.,.,應用：（1）偏態(tài)分布資料；（2）資料分布一端或兩端有未確定值。,.,.,三、離散程度的描述,例：三組同性別、同年齡兒童的體重（Kg）如下，分析其集中趨勢與離散趨勢。甲組：26 28 30 32 34 均數：X=30 Kg 乙組：24 27 30 33 36 均數：X=30 Kg 丙組：26 29 30 31 34 均數：X=30 Kg,,,,,三、離散趨勢的描述,.,描述離散程度的常用指標,1、全距（極差）（R） 2、四分位數間距（QR） 3、方差（?2 S2）和標準差（?、S） 4、變異系數（CV）,.,反映一組同質觀察值個體差異的范圍。 R甲=8； R乙=12； R丙=8。缺點（1）不能反映組內其它觀察值的變異度。（2）樣本含量越大，則全距可能也越大。,1. 全距（極差）,.,即P75－P25 四分位數可看作是一組同質觀察值居中的50%變量值的變異范圍。,2. 四分位數間距（quartile range, QR）,.,不受極值影響，較穩(wěn)定。,與全距比較有何優(yōu)點？,應用：（1）偏態(tài)分布；（2）資料一端或兩端有未確定值。,.,.,變量值的離散程度可看作是各個變量值距離中心點（均數）的遠近問題。用算式表示： ??x??? 但： ??x???=0 則求： ??x???2 （離均差平方和） ??x???2 大小與變異度有關外，還與變量值個數（N）有關。故：,3. 方差（?2 S2）和標準差（?、S） (variance & standard deviation),.,為了用原單位表示，開方即：,標準差或方差越大，說明個體差異越大，則均數的代表性越差。,.,實際工作中經常得到的是樣本資料，總體均數?是不知道的，只能用樣本均數來估計總體均數，這樣：用 ??x?x?2 代替 ??x???2 n 代替 N 但這樣算得結果常比真實?低。,因此，統(tǒng)計學家提出用 n - 1 來校正。,,.,即：樣本標準差（S）,S2 稱為 —— 樣本方差,.,,式中n-1稱為自由度，用希臘字母　? (ju:psilen)表示。自由度的概念：是指隨機變量能自由取值的個數。例：X+Y+Z=10 ? = 2 又例：,當樣本均數一定時，隨機變量可以自由取值的變量值個數只能是n - 1 個。,.,計算： 1）不分組資料：,例：三組同性別、同年齡兒童的體重（Kg）如下，分析其集中趨勢與離散趨勢。甲組：26 28 30 32 34 均數：X=30 Kg 乙組：24 27 30 33 36 均數：X=30 Kg 丙組：26 29 30 31 34 均數：X=30 Kg,計算得：S甲=3.16，S乙=4.74，S丙=2.92,,,,.,2）分組資料：,計算得：S = 0.38（×1012/ L）,.,?應用: 對稱分布，尤其是正態(tài)分布,.,,?應用:（1）比較單位不同的幾組資料的變異程度 ?。?）比較均數相差懸殊的幾組資料的變異程度,4. 變異系數（CV）,.,例2.9 某地調查110名18歲男大學生，其身高均數為172.73cm，標準差為4.09cm；其體重均數為55.04kg，標準差為4.10kg，試比較兩者變異度。,,某衛(wèi)生防疫站對30名麻疹易感兒童經氣溶膠免疫一個月后,測得其血凝抑制抗體滴度資料如下,試計算其平均滴度抗體滴度 1:8 1:16 1:32 1:64 1:128 1:256 1:512 例數 2 6 5 10 4 2 1,.,某市1974年為了解該地居民發(fā)汞的基礎水平, 為汞污染的環(huán)境監(jiān)測積累資料, 調查了留住該市一年以上, 無明顯肝、腎疾病，無汞作業(yè)接觸史的居民238 人的發(fā)汞含量如下:,用何種指標說明本資料的集中位置和變異程度較好？并計算之；,.,某檢驗師測定了10名正常成年鋼鐵工人的血紅蛋白值(g/dl)和紅細胞數(萬/mm3)如下,試比較這兩個檢測項目的結果哪個變異性大?,血紅蛋白(g/dL) 13.0 13.6 14.0 14.5 14.6 14.7 15.2 15.5 15.8 16.0 血細胞數(萬/mm3) 510 515 517 518 520 522 524 525 528 530,.,第二部分數值變量的描述性統(tǒng)計,統(tǒng)計圖表；統(tǒng)計指標。,.,第一節(jié) 頻數分布一. 編制頻數表的步驟,求極差 R=84-57cm=27（次/分）劃分組段確定組數：較大樣本時，一般取10組左右。確定組距：極差/組數=27/10=2.7≈3（次/分）確定各組段的上下限：上限=下限+組距統(tǒng)計各組段內的數據頻數，編制頻數表,.,表2.1 130名健康成年男子脈搏（次/分）的頻數分布表,,脈搏組段（1）,頻數（2）,頻率（%）（3）,累計頻數（4）,累計頻率（%）（5）,,56~ 59~ 62~ 65~ 68~ 71~ 74~ 77~ 80~ 83~85 合計,,2 5 12 15 25 26 19 15 10 1 130,1.54 3.85 9.23 11.54 19.23 20.00 14.62 11.54 7.69 0.77,2 7 19 34 59 85 104 119 129 130,1.54 5.38 14.62 26.15 45.38 65.38 80.00 91.54 99.23 100.00,.,二. 頻數表的用途,可以揭示資料的分布類型和分布特征，以便于選用相應的統(tǒng)計分析方法。便于進一步計算指標和統(tǒng)計處理。便于發(fā)現某些特大或特小的可疑值。,.,第二節(jié) 集中趨勢的描述,三種平均數算術均數幾何均數中位數。,.,（一）算術均數（x）,簡稱均數，適合于表達呈正態(tài)分布資料的平均水平。直接法： X=,,,X1+···+Xn,,n,=,?X,,n,例2-2：X,,=,81+70+66+···+69,,13,=71.69（次/分）,.,,加權法 X=,,?fX,,?f,例： X=,,57?2+60?5+63?12+···+84 ?1,,130,=71.12（次/分）,.,（二）幾何均數（G）,適用于原始數據分布不對稱，但經對數轉換后呈對稱分布的資料。 G= n X1X2···Xn G=lg-1（）,,,,,?lgX,,n,G=lg-1（）,?f lgX,,?f,.,例：40名麻疹易感兒童接種麻疹疫苗后一個月，測其血凝抑制抗體滴度，結果如表所示，求幾何均數。,,抗體滴度,人數 f,滴度倒數 X,lgX,,1：4 1：8 1：16 1：32 1：64 1：128 1：256 1：512,1 4 5 8 11 6 4 1,4 8 16 32 64 128 256 512,0.6021 0.9031 1.2041 1.5051 1.8061 2.1072 2.4082 2.7093,,G′=lg-1（,,?f lgX,,n,）=lg-1（1 ?0.6021+4 ?0.9031+ ··· +1 ?2.7093）,,40,.,=lg-1（,,40,67.1282,）,=48,G=1：48,.,（三）中位數（M）,適合于表達偏態(tài)資料、或分布不明的資料的平均水平，尤其適合于表達只知數據的個數、但部分較大或較小數據的具體數值未準確知道的資料的平均水平。,.,對于原始數據和頻數分布表資料，分別用下列兩式計算中位數。,M=,,（X n/2+X（n/2+1））/2,（n為偶數）,X（n+1）/2,（n為奇數）,M = LM +,iM,,fM,（,n,,2,?fL ）,,其中， LM ：中位數所在組下限； iM ：中位數所在組的組距； fM ：中位數所在組的頻數； ?fL ：中位數所在組前一組的累計頻數。,.,例2-4 表2.3 107正常人的尿鉛含量（?g/L）的中位數計算表,,含量（ ?g/L ）（1）,頻數f （2）,累計頻數 ?f （3）,累計頻率 % （4）,,0~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 合計,14 22 29 18 15 6 1 2 107,14 36 65 83 98 104 105 107,13.08 33.64 60.75 77.57 91.59 97.20 98.13 100.00,,,M=8+ (107/2 - 36) = 10.41(?g/L),4,,29,.,第三節(jié) 離散程度的描述,例：設有三組同年齡、同性別兒童體重（kg）數據如下：甲組 26 28 30 32 34 乙組 24 27 30 33 36 丙組 26 29 30 31 34,.,描述離散程度的指標：極差、四分位數間距、方差、標準差、變異系數。,.,一. 極差（全距，R）,為一組同質觀察值中最大值與最小值之差。甲組 R=34-26=8 乙組 R=36-24=12 甲組數據分布較乙組集中。,.,優(yōu)點：計算簡單缺點： 1.沒有充分利用樣本信息，只考慮最大值與最小值之差異，不能反映組內其它觀察值的變異度。 2.樣本含量越大，抽到較大或較小觀察值的可能性越大，則極差可能越大，因此，樣本含量懸殊時不宜用極差比較分布的離散度。所以，一般不用極差來反映離散程度。,.,二. 四分位數間距（Q） 1.分位數的概念分位數是一種位置指標，一個特定的分位數將任何一個頻數曲線下的面積分為兩部分。第1四分位數記作Q1，第2、第3四分位數，分別記作Q2、Q3；第1百分位數，記作P1。同理，還有第2、第3、 ···、第99百分位數，分別記作P2、P3、 ···、P99。顯然，Q1=P25、Q2=P50=M、Q3=P75,.,2.百分位數的計算公式對連續(xù)型變量頻數表資料，按下式計算第X百分位數PX： PX=LX+,iX,,fX,（nX%,,?fL ）,,其中， LX ：第X百分位數所在組下限； iX ：第X百分位數所在組的組距； fX ：第X百分位數所在組的頻數； ?fL ：第X百分位數所在組前一組的累計頻數。,.,例某地200例正常成人血鉛含量的頻數分布如表所示，請計算出血鉛含量的95%正常值范圍。 200例正常成人血鉛含量的頻數分布表,,血鉛含量頻數累計頻數（?mol/L）（1）（2）,,0~ 0.24~ 0.48~ 0.72~ 0.97~ 1.21~ 1.45~ 1.69~ 1.93~ 2.17~ 2.42~ 2.66~ 2.90~3.14,6 48 43 36 28 13 14 4 4 1 2 0 1,6 54 97 133 161 174 188 192 196 197 199 199 200,,解：即求P95。 nX%=200×95%=190 P95 =1.69+ （190-188）,0.24,,4,=1.81 （?mol/L）,故某地正常人血鉛含量95%的單側正常值范圍的上限為 1.81 （?mol/L）。,.,,3.四分位數間距（Q） Q=P75-P25 Q=QU-QL 優(yōu)缺點：用四分位數間距作為描述數據分布離散程度的指標，比極差穩(wěn)定，但仍未考慮到每個數據的大小，常用于描述偏態(tài)頻數分布以及分布的一端或兩端無確切數值資料的離散程度。,.,?2=,?（X-?）2,,N,S2=,?（X-X）2,,,n - 1,n - 1稱為自由度,三.方差,.,? =,?（X-?）2,,N,,,,S=,?（X-X）2,,,n - 1,,,,直接法； s=,?X2-（ ?X）2/n,由于?（X-X）2 =?X2-（ ?X）2/n，所以,,n - 1,,,,加權法： s= ?fX2-（ ?fX）2/?f,,?f - 1,,,,,,四.標準差,.,五. 變異系數（CV）,CV=,S,,X,,?100%,1.用于比較度量衡單位不同的多組資料的變異度。 2.比較均數相差懸殊的多組資料的變異度。,.,一. 正態(tài)分布的概念和特征,正態(tài)分布的圖形：正態(tài)分布的密度函數： f（X）=,1,,,? 2?,,,,e,-（X-?）2,,2 ?2,-?100，故可以用標準正態(tài)分布代替t分布，u0.10=1.64 即該地12歲男孩平均身高的90％可信區(qū)間為：141.77～143.57(cm)，可認為該地12歲男孩平均身高在141.77～143.57(cm)之間。,,,,.,,.,兩均數之差的區(qū)間估計,設兩樣本之樣本含量、均數和方差分別為：n1,n2，,和s12, s22，根據數理統(tǒng)計結果：,,服從自由度為?=n1+n2-2的t分布。,,,.,例4.3 某醫(yī)生研究轉鐵蛋白對病毒性肝炎診斷的臨床意義，測得12名正常人和15名病毒性肝炎患者血清轉鐵蛋白含量，結果如下，試估計正常人和患者的轉鐵蛋白含量均數之差的95％可信區(qū)間。,,,,.,,根據資料算得：,s12=10.382 s22=14.392,,,自由度為?=n1+n2-2=12+15-2=25、?＝0.05的t界值為：t0.05,25=2.060,(271.8917－235.2067 ) ? 2.060 ? 4.95 = 26.48 ～ 46.88,兩組均數之差的95％可信區(qū)間為：,可以認為病毒性肝炎患者的血清轉鐵蛋白含量較正常人平均低36.68，其95％CI為26.48~46.88。,.,率的可信區(qū)間,與均數一樣，率也存在抽樣誤差 ,率的標準差又稱率的標準誤為：,率的抽樣誤差,,.,率的分布,★當總體率?＜0.5時為正偏態(tài)， ★當?＞0.5時為負偏態(tài)， ★當?=0.5時為對稱分布。 ★只有當n較大、率?和(1-?)都不太小時，例如n?和n(1-?)均大于5時，率的抽樣分布近似于正態(tài)分布。,.,總體率?的區(qū)間估計,正態(tài)近似法查表法,.,正態(tài)近似法,條件: 樣本例數n足夠大，且樣本率p和(1-p)都不太小時，即np和n(1-p)均大于5時，樣本率p 的抽樣分布近似正態(tài)分布,,,( , ),總體率?的可信區(qū)間：,.,例從某地人群中隨機抽取144人，檢查乙型肝炎表面抗原攜帶狀況，陽性率為9.20％，求該地人群的乙型肝炎表面抗原陽性率的95％可信區(qū)間。,n =144，p=9.20％,,95％可信限為：9.20%±1.96×2.41% 即該地人群的乙型肝炎表面抗原陽性率的95％可信區(qū)間為：4.48%～13.92%。,.,查表法,例4.5 有人調查29名非吸毒婦女，出獄時有1名HIV(人免疫缺陷病毒)陽性，求陽性率95％可信區(qū)間?,直接查附表6.2,在行n=29, 列x=1交叉處0.1～17.8即為陽性率95％可信區(qū)間．,.,正確理解可信區(qū)間的涵義(一),可信區(qū)間一旦形成，它要么包含總體參數，要么不包含總體參數，二者必居其一，無概率可言。所謂95％的可信度是針對可信區(qū)間的構建方法而言的。以均數的可信區(qū)間為例，其涵義是：如果重復100次抽樣，每次樣本含量均為n，每個樣本均按構建可信區(qū)間，則在此100個可信區(qū)間內，理論上有95個包含總體均數，而有5個不包含總體均數。,,,.,正確理解可信區(qū)間的涵義(二),在區(qū)間估計中，總體參數雖未知，但卻是固定的值（且只有一個），而不是隨機變量值。,.,,,圖4.1 100個來自N(0,1)的樣本所估計的可信區(qū)間示意,.,可信區(qū)間與參考值范圍的區(qū)別,可信區(qū)間用于估計總體參數，總體參數只有一個。參考值范圍用于估計變量值的分布范圍，變量值可能很多甚至無限。 95%的可信區(qū)間中的95%是可信度，即所求可信區(qū)間包含總體參數的可信程度為95% 95%的參考值范圍中的95%是一個比例，即所求參考值范圍包含了95%的正常人。,,.,第五部分假設檢驗,第一節(jié) 假設檢驗的意義第二節(jié) 假設檢驗的思路第三節(jié) 假設檢驗的步驟第四節(jié) 假設檢驗的正確應用第五節(jié) 假設檢驗的幾個相關問題,.,總體Α是100例正常成年男子的血紅蛋白(單位：g/L)，從中隨機抽取樣本a1 和樣本 a2 ；總體B是另外100例正常成年男子的紅細胞數，從中隨機抽取樣本b ；三個樣本的含量均為10例，有關數值如下：,.,在知道A和B總體的參數時,a1-a2,a1-b1,.,假如事先不知道A和B是不是同一個總體,a1-b1,？,.,例6.1 測得25例某病女性患者的血紅蛋白(Hb)，其均數為150(g/L)，標準差為16.5(g/L)。而該地正常成年女性的Hb均數為132(g/L)。問該病女性患者的Hb含量是否與正常女性Hb含量不同？,.,？,目的：推斷病人的平均血紅蛋白(未知總體均數?)與正常女性的平均血紅蛋白(已知總體均數?0)間有無差別 μ = μ0,.,手頭樣本對應的未知總體均數μ等于已知總體均數μ0 除抽樣誤差外，,已知:,，差別僅僅是由于抽樣誤差所致；,病人與正常人存在本質上的差異,.,一、假設檢驗的意義,分辨一個樣本是否屬于某特定總體分辨兩個（或兩個以上）樣本是否分別屬于兩個不同的總體，并對總體作出適當的結論,.,二、假設檢驗的基本思想,“反證法”的思想先根據研究目的建立假設，從H0假設出發(fā)，先假設它是正確的，再分析樣本提供的信息是否與H0有較大矛盾，即是否支持H0，若樣本信息不支持H0，便拒絕之并接受H1,否則不拒絕H0 。,.,檢驗假設(null hypothesis)，記為H0 H0：?＝132，病人與正常人的平均血紅蛋白含量相等；備擇假設(alternative hypothesis)，記為H1 H1：?≠132，病人與正常人的平均血紅蛋白含量不等。,（一）建立假設,.,其中H0假設比較單純、明確，在H0 下若能弄清抽樣誤差的分布規(guī)律，便有規(guī)律可循。而H1假設包含的情況比較復雜。因此，我們著重考察樣本信息是否支持H0假設（因為單憑一份樣本資料不可能去證明哪個假設是正確的，哪一個不正確）。,.,設定檢驗水準的目的就是確定拒絕假設H0時的最大允許誤差。醫(yī)學研究中一般取?=0.05 。檢驗水準實際上確定了小概率事件的判斷標準。,（二）確定檢驗水準?,.,（三）選定檢驗方法計算檢驗統(tǒng)計量(計算樣本與總體的偏離),統(tǒng)計量t表示，在標準誤的尺度下，樣本均數與總體均數?0的偏離。這種偏離稱為標準t離差。,.,根據抽樣誤差理論，在H0假設前提下，統(tǒng)計量t服從自由度為n-1的t分布，即t值在0的附近的可能性大，遠離0的可能性小，離0越遠可能性越小。 t值越小，越利于H0假設 t值越大，越不利于H0假設,.,（四）結論(根據小概率原理作出推斷),在H0成立的前提下出現現有差別或更大差別的可能性P(| t | ≥5.4545) 小于0.05，是小概率事件，即現有樣本信息不支持H0。抉擇的標準為：當P≤? 時，拒絕H0，接受H1 當P＞? 時，不拒絕H0 本例P＜0.05，按? =0.05的水準，拒絕H0，接受H1，差別有統(tǒng)計學意義。認為該病女性患者的Hb含量高于正常女性的Hb含量。,,,.,.,-2.064,2.064,0,? =24,0.025,,0.025,,t0.05,24=2.064 P =P ( |t| ≥2.064 )=0.05,P=P(|t|≥5.4545)<0.05,,.,假設檢驗的意義,得到關于總體的結論如本例假設檢驗的意義在于分辨手頭樣本所代表的未知總體和已知總體是否為同一總體，換句話說，即分辨手頭樣本是否為已知總體的一個隨機樣本。,.,三、假設檢驗的基本步驟,建立假設確定檢驗水準計算檢驗統(tǒng)計量計算概率P 結論當P≤? 時，拒絕H0，接受H1，差別有統(tǒng)計學意義。當P＞? 時，不拒絕H0，差別尚無統(tǒng)計學意義。不論，拒絕拒絕H0，還是不拒絕H0都可能范錯誤。,.,建立假設 (在假設的前提下有規(guī)律可循),首先確定單、雙側零假設(null hypothesis)，記為H0 H0：?＝132，病人與正常人的平均血紅蛋白含量相等；備擇假設(alternative hypothesis)，記為H1 雙側檢驗 H1：?≠132，病人與正常人的平均血紅蛋白含量不等。單側檢驗,.,確定檢驗水準? (確定最大允許誤差),設定檢驗水準的目的就是確定拒絕假設H0時的最大允許誤差。醫(yī)學研究中一般取?=0.05 。檢驗水準實際上確定了小概率事件的判斷標準。,.,選定檢驗方法計算檢驗統(tǒng)計量(計算樣本與總體的偏離),根據資料的類型、研究目的和設計情況選擇適合的統(tǒng)計方法，計算相應的統(tǒng)計量，如t值、F值、值等。,.,結論(根據小概率原理作出推斷),在H0成立的前提下出現現有差別或更大差別的可能性，判斷結果。抉擇的標準為：當P≤? 時，拒絕H0，接受H1 當P＞? 時，不拒絕H0,.,第六部分　定量資料的分析,第一節(jié)　樣本均數與總體均數的比較第二節(jié)　兩樣本均數比較的t檢驗第三節(jié) t檢驗的正確應用第四節(jié) 多個均數的比較第五節(jié) 方差齊性檢驗第六節(jié) 方差分析的正確應用,(the Analysis of Quantitative Data),.,t 檢驗（t-test）,英國統(tǒng)計學W.S.Gosset (1908)導出了樣本均數的確切分布，即 t分布。 t分布的發(fā)現使小樣本的統(tǒng)計推斷成為可能，因而它被認為是統(tǒng)計學發(fā)展史上的里程碑之一。以t分布為基礎的檢驗稱為t檢驗。,.,一、樣本均數與總體均數的比較(one sample t-test),目的: 推斷該樣本是否來自某已知總體；樣本均數代表的總體均數?與?0是否相等。總體均數?0一般為理論值、標準值或經大量觀察所得并為人們接受的公認值、習慣值。實例分析：以例6.1為例介紹,.,解決思路：區(qū)間估計判斷樣本信息估計的總體均數?之可信區(qū)間是否覆蓋已知的總體均數?0？若不覆蓋，則可推斷該樣本并非來自已知均數的總體。假設檢驗先假設? 等于?0，再判斷樣本提供的信息是否支持這種假設，若不支持，則可推斷該樣本并非來自已知均數的總體。,.,H0：?＝132，病人與正常人的平均血紅蛋白含量相等； H1：?≠132，病人與正常人的平均血紅蛋白含量不等。 ?=0.05,按? =0.05的水準，拒絕H0，接受H1，差別有統(tǒng)計學意義。認為該病女性患者的Hb含量高于正常女性的Hb含量。,∵t>t0.05,24=2.064 ∴ P <0.05,.,二、配對設計 t 檢驗(paired design t-test),配對設計使用條件：當個體間的差異不均勻時，將差異較小的個體配成對子，分別給予不同的處理，以保證兩組間的均衡可比性。,.,（一）配對設計的形式,自身配對同一對象接受兩種處理，如同一標本用兩種方法進行檢驗，同一患者接受兩種處理方法；同一對象處理前后。異體配對將條件相近的實驗對象配對，并分別給予兩種處理。,.,若兩處理因素的效應無差別，差值d的總體均數?d應該為0，故可將該檢驗理解為樣本均數與總體均數?d =0的比較配對t檢驗的實質就是檢驗樣本差值的總體均數是否為0。,（二）基本思想,.,例6.2 現用兩種測量肺活量的儀器對12名婦女測得最大呼氣率(PEER)(L/min)，資料如表6.1，問兩種方法的檢測結果有無差別?,.,按? = n-1=12-1=11查t值表，得t0.20,11=1.363，t0.10,11=1.796，t0.10,11＞t＞t0.20,11，則0.20＞P＞0.10，差別無統(tǒng)計學意義，尚不能認為兩種儀器檢查的結果不同。,,H0：?d＝0，兩儀器檢驗結果相同； H1：?d≠0，兩儀器檢驗結果不同。,雙側? =0.05。,已知　n=12,差值標準差,.,例6.3 某醫(yī)生研究腦缺氧對腦組織中生化指標的影響，將乳豬按出生體重配成7對，一組為對照組，一組為腦缺氧模型組。試比較兩組豬腦組織鈣泵的含量有無差別。,.,H0：?d＝0，即兩組乳豬腦組織鈣泵含量相等； H1：?d＞0，即對照組乳豬腦組織鈣泵含量高于實驗組。單側? =0.05。,按?= n-1=7-1=6查t界值表，得單側t0.05,6=1.943，t＞t0.05,6，則P＜0.05，差別有統(tǒng)計學意義，可以認為腦缺氧可造成鈣泵含量的降低。,.,（三）兩樣本均數比較的t檢驗 (independent samples t-test),有些研究的設計既不能自身配對，也不便異體配對，而只能把獨立的兩組相互比較。例如手術組與非手術組、新藥組與對照組。目的：在于推斷兩個樣本所代表的兩總體均數?1和?2是否相等。,.,,,.,例6.4 某醫(yī)生研究轉鐵蛋白對病毒性肝炎診斷的臨床意義，測得12名正常人和15名病毒性肝炎患者血清轉鐵蛋白含量(?g/dl)，結果見例4.3。問患者和正常人轉鐵蛋白含量是否有差異?,.,H0 ：?1＝?2，正常人與病毒性肝炎患者的轉鐵蛋白含量相等； H1 ：?1≠?2 ，正常人與病毒性肝炎患者的轉鐵蛋白含量不等。雙側? =0.05,,,,s12=10.382　　s22=14.392,?=n1＋n2－2=12＋15－2=25,按自由度25查附表2，t界值表得t0.001,25=3.725，t＞t0.001,25，P＜0.001，差別有統(tǒng)計學意義，可以認為病毒性肝炎患者的轉鐵蛋白含量較低。,.,在兩個樣本均數比較時，若兩組樣本含量都很大，可用u檢驗，其計算公式為：,u為標準正態(tài)離差，按正態(tài)分布界定P值并作出結論。,.,例6.5 某市于1973年和1993抽查部分12歲男童對其發(fā)育情況進行評估，其中身高的有關資料如下，試比較這兩個年度12歲男童身高均數有無差別。1973 年：n1=120 =139.9cm s1=7.5cm；1993 年：n2=153 =143.7cm s2=6.3cm。,H0 ：?1＝?2，即該市兩個年度12歲男童平均身高相等； H1 ：?1≠?2，即該市兩個年度12歲男童平均身高不等。雙側? =0.05。,P＜0.01，差別有統(tǒng)計學意義，可認為該市1993年12歲男童平均身高比1973年高。,.,(四)假設檢驗中需注意的幾個問題,1.建立假設 “假設”是對總體特征的表述 H0與H1并非并列，而是以H0為主 H0與H1的表述隨資料性質、分析目的和檢驗方法而定。,.,(四)假設檢驗中需注意的幾個問題,2.驗證假設各種檢驗方法都以統(tǒng)計量的分布為依據檢驗統(tǒng)計量與H0密切相關：H0條件下產生了檢驗統(tǒng)計量t的概率分布反證法推理：在H0條件下，抽得現有樣本統(tǒng)計量的概率(P)很小，就認為樣本數據與H0假設有矛盾，且這種矛盾不能用抽樣誤差來解釋，所以可認為該樣本來自H1假設，則接收H1；反之……。,.,3.判斷水準? 必須事先確定，一般取0.05。,(四)假設檢驗中需注意的幾個問題,4. 正確理解P值 P值是決策的依據 P≤0.05 及其意義：首先P不指H0成立之可能，而是指從H0假設總體中隨機抽到差別至少等于現有差別的機會。,.,5. Significant 的本義及假設檢驗結果的表述 Significant的本義是“有意義的”、“非偶然的”,(四)假設檢驗中需注意的幾個問題,前輩學者曾將Significance譯作“顯著性”，或Significant譯作“顯著的”，因而假設檢驗也習慣上被稱作“顯著性檢驗”，已延用至今,.,(四)假設檢驗中需注意的幾個問題,6.第一類錯誤與第二類錯誤假設檢驗結論拒絕H0，接受H1 不拒絕H0 H0真實第一類錯誤(? ) 正確推斷(1－?) H0不真實正確推斷(1－?) 第二類錯誤(?) 統(tǒng)計學上規(guī)定：H0真實時被拒絕為第一類錯誤(又稱Ⅰ型錯誤，type Ⅰerror)，H0不真實時不拒絕為第二類錯誤(又稱Ⅱ型錯誤，type Ⅱ error)。,.,第一類錯誤和第一類錯誤的關系,.,6.檢驗的功效,實際應用假設檢驗時，當P ≤? 而拒絕H0接受H1，要注意第一類錯誤出現；當P ＞? 而不拒絕H0，要注意第二類錯誤的出現。尤其是，第二類錯誤率? 表示失去對真實的H1作出肯定結論之概率，故1－? 就是對真實的H1作出肯定結論之概率，常被用來表達某假設檢驗方法的檢驗的功效(power of a test)，國內學者稱它為把握度：假設檢驗對真實的H1作肯定結論之把握程度。 `,.,7.雙側檢驗與單側檢驗,檢驗假設的寫法不同：,.,選用雙側檢驗與單側檢驗：原則上依據資料的性質來選擇。若比較甲、乙兩種方法孰優(yōu)，這里含有甲優(yōu)于乙和乙優(yōu)于甲兩種可能的結果，而且研究者只要求分出優(yōu)劣，故應選用雙側檢驗，若甲是從乙改進而得，已知如此改進可能有效，也可能無效，但不可能改進后反不如前，故應選用單側檢驗。不要無把握時誤用單側檢驗，也不可在條件具備時錯過正當使用的機會。,.,8. t檢驗的正確應用,(1)資料的代表性與可比性所謂代表性是指該樣本從相應總體中經隨機抽樣獲得，能夠代表總體的特征；所謂可比性是指各對比組間除了要比較的主要因素外，其它影響結果的因素應盡可能相同或相近為了保證資料的可比性，必須要有嚴密的實驗設計，保證樣本隨機抽取于同質總體，這是假設檢驗得以正確應用的前提。,.,8. t檢驗的正確應用,(2)應用t檢驗對兩樣本均數進行比較時，要求原始數據滿足如下三個條件：獨立性(independence) 正態(tài)性(normality)：方差齊性(homogeneity)：,.,8. t檢驗的正確應用,(3) t檢驗與u檢驗公式查表與n關系計算精度 t 較復雜需無關精確 u 簡單否 n較大近似 *思考：同一資料，t 檢驗有統(tǒng)計學意義，u檢驗一定有統(tǒng)計學意義？ t檢驗有統(tǒng)計學意義，u檢驗不一定有統(tǒng)計學意義？,

下載提示(請認真閱讀)

1.請仔細閱讀文檔，確保文檔完整性，對于不預覽、不比對內容而直接下載帶來的問題本站不予受理。
2.下載的文檔，不會出現我們的網址水印。
3、該文檔所得收入（下載+內容+預覽）歸上傳者、原創(chuàng)作者；如果您是本文檔原作者，請點此認領！既往收益都歸您。

同意并開始全文預覽

文檔包含非法信息？點此舉報后獲取現金獎勵！

文檔加載中……請稍候！
如果長時間未打開，您也可以點擊刷新試試。

下載文檔到電腦，查找使用更方便

10 積分

還剩頁未讀，繼續(xù)閱讀

舉報

版權申訴 word格式文檔無特別注明外均可編輯修改；預覽文檔經過壓縮，下載后原文更清晰！ 立即下載

配套講稿：: 如PPT文件的首頁顯示word圖標，表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
特殊限制：: 部分文檔作品中含有的國旗、國徽等圖片，僅作為作品整體效果示例展示，禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
關鍵詞：: 武漢大學醫(yī)學統(tǒng)計學串講講義演示文檔

溫馨提示:
1: 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 裝配圖網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

裝配圖網所有資源均是用戶自行上傳分享，僅供網友學習交流，未經上傳用戶書面授權，請勿作他用。

關于本文

本文標題：武漢大學醫(yī)學統(tǒng)計學串講講義演示文檔
鏈接地址：http://appdesigncorp.com/p-359924.html

相關資源更多

正為您匹配相似的精品文檔

相關搜索

武漢大學 醫(yī)學 統(tǒng)計學 串講講義演示文檔

關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

備案號:蜀ICP備2024067431號-1 川公網安備51140202000466號

本站為文檔C2C交易模式，即用戶上傳的文檔直接被用戶下載，本站只是中間服務平臺，本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對上載內容本身不做任何修改或編輯。若文檔所含內容侵犯了您的版權或隱私，請立即通知裝配圖網，我們立即給予刪除！

武漢大學醫(yī)學統(tǒng)計學串講講義演示文檔

最新文檔