醫(yī)學(xué)統(tǒng)計學(xué)孫振球第十八章判別分析.ppt
第十八章 判別分析,Discriminant Analysis,Content,Fisher discriminant analysis Maximum likelihood method Bayes formula discriminant analysis Bayes discriminant analysis Stepwise discriminant analysis,講述內(nèi)容,第一節(jié) Fisher判別 第二節(jié) 最大似然判別法 第三節(jié) Bayes公式判別法 第四節(jié) Bayes判別 第五節(jié) 逐步判別 第六節(jié) 判別分析中應(yīng)注意的問題,目的:作出以多個判別指標(biāo)判別個體分類的判別函數(shù)或概率公式。 資料:個體分兩類或多類,判別指標(biāo)全部為數(shù)值變量或全部為分類變量。 用途:解釋和預(yù)報(主要用于計量診斷)。 分類(經(jīng)典): Fisher判別和Bayes判別。,1. 計量資料判別分析。目的是作出以定量指標(biāo)判別個體屬性分類或等級的判別函數(shù)。,按資料類型分:,2. 計數(shù)資料判別分析。目的是作出以定性或等 級指標(biāo)判別個體屬性分類或等級的概率公式。,按方法名分,1. Fisher判別 2. 最大似然判別法 3. Bayes公式判別法 4. Bayes判別 5. 逐步判別,第一節(jié)Fisher判別,適用于指標(biāo)為定量指標(biāo)的兩類判別(或多類判別),1. Fisher判別的原理,一、兩類判別,例18-1 收集了22例某病患者的三個指標(biāo)(X1,X2,X3)的資料列于表18-1,其中前期患者(A)類12例,晚期患者(B)類10例。試作判別分析。,表18-1 22例患者三項指標(biāo)觀察結(jié)果(Zc=-0.147),表18-2 變量的均數(shù)及類間均值差,(1)計算變量的類均數(shù)及類間均值差Dj,計算結(jié)果列于表18-2。,(2)計算合并協(xié)方差矩陣: 按公式(18-4),例如:,代入公式(18-3)得,得到合并協(xié)方差陣,二、判別效果的評價 用誤判概率P衡量,回顧性誤判概率估計往往夸大判別效果。,第二節(jié) 最大似然判別法(優(yōu)度法),適用于指標(biāo)為定性指標(biāo)的兩類判別或多類判別。,資料:個體分兩類或多類,判別指標(biāo)全部為定性或等級 資料。 原理:用獨立事件的概率乘法定理得到判別對象歸屬某 類的概率。,2.判別規(guī)則,3.最大似然判別法的應(yīng)用,例18-2 有人試用7個指標(biāo)對4種類型的闌尾炎作鑒別診斷,收集的5668例完整、確診的病史資料歸納于表18-3。,表18-3 5668例不同型闌尾炎病例的癥狀發(fā)生頻率(%),如某病例昨晚開始出現(xiàn)右下腹痛、嘔吐等癥狀,大便正常。經(jīng)檢查,右下腹部壓痛,肌性防御(+)、壓跳痛(+),體溫36.6,白細(xì)胞23.7109/L。,根據(jù)表18-3得,第三節(jié) Bayes公式判別法,適用于指標(biāo)為定性指標(biāo)的兩類判別或多類判別。,資料:個體分兩類或多類,判別指標(biāo)全部為定性 或等級資料。 原理:條件概率+事前概率(各病型或病種的總 體構(gòu)成比),判別規(guī)則:,舉例說明:例18-3,對例18-2中給出的待判病有,利用公式(18-8)計算得,注意:,第四節(jié) Bayes判別,適用于指標(biāo)為定量指標(biāo)的多類判別(也可用于兩類判別),先驗概率確定:1. 等概率(有選擇性偏倚); 2. 頻率估計。 判別規(guī)則:歸屬最大Yg 類。 應(yīng)用:快速、正確。,資料:個體分G類,判別指標(biāo)定量。 原理:Bayes準(zhǔn)則。,結(jié)果: G 個判別函數(shù),例18-4 欲用4個指標(biāo)鑒別3類疾病,現(xiàn)收集17例完整、確診的資料,見表18-4。試建立判別Bayes函數(shù)。,Bayes判別函數(shù),判別效果評價:誤判概率 (回顧性估計,見表18-6)。誤判概率的刀切法估計為 。,第五節(jié) 逐步判別,目的:選取具有判別效果的指標(biāo)建立判別函數(shù)。 應(yīng)用: 只適用于Bayes判別。,原理:Wilks統(tǒng)計量 ,F(xiàn) 檢驗。,例18-5 利用表18-4的數(shù)據(jù)作逐步Bayes判別。,Bayes判別函數(shù):,判別效果評價,誤判概率為1/17=5.88%(回顧性估計,見表18-8)。誤判概率的刀切法估計17.6%。與例18-4比較,變量篩選后,盡管判別指標(biāo)由4個減為2個,判別效能卻提高了。由此可見,判別指標(biāo)并不是越多越好。,第六節(jié) 判別分析中應(yīng)注意的問題,謝謝大家!,