《講判別分析》PPT課件.ppt

上傳人:w****2 文檔編號(hào):15621426 上傳時(shí)間:2020-08-25 格式:PPT 頁(yè)數(shù):38 大小:1.11MB
收藏 版權(quán)申訴 舉報(bào) 下載
《講判別分析》PPT課件.ppt_第1頁(yè)
第1頁(yè) / 共38頁(yè)
《講判別分析》PPT課件.ppt_第2頁(yè)
第2頁(yè) / 共38頁(yè)
《講判別分析》PPT課件.ppt_第3頁(yè)
第3頁(yè) / 共38頁(yè)

下載文檔到電腦,查找使用更方便

9.9 積分

下載資源

還剩頁(yè)未讀,繼續(xù)閱讀

資源描述:

《《講判別分析》PPT課件.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《《講判別分析》PPT課件.ppt(38頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1、判別分析,判別分析是判別樣品所屬類型的一種統(tǒng)計(jì)方法:,判別分析應(yīng)用十分廣泛,在生產(chǎn)、科研和日常生活中經(jīng)常需要根據(jù)觀測(cè)到的數(shù)據(jù)資料,對(duì)所研究的對(duì)象進(jìn)行分類。 在經(jīng)濟(jì)學(xué)中,根據(jù)人均國(guó)民收入、人均工農(nóng)業(yè)產(chǎn)值、人均消費(fèi)水平等多種指標(biāo)來(lái)判定一個(gè)國(guó)家的經(jīng)濟(jì)發(fā)展程度所屬類型; 在市場(chǎng)預(yù)測(cè)中,根據(jù)以往調(diào)查所得的種種指標(biāo),判別下季度產(chǎn)品是暢銷、平常或滯銷; 在地質(zhì)勘探中,根據(jù)巖石標(biāo)本的多種特性來(lái)判別地層的地質(zhì)年代,由采樣分析出的多種成份來(lái)判別此地是有礦或無(wú)礦,是銅礦或鐵礦等; 在油田開(kāi)發(fā)中,根據(jù)鉆井的電測(cè)或化驗(yàn)數(shù)據(jù),判別是否遇到油層、水層、干層或油水混合層; 在農(nóng)林害蟲(chóng)預(yù)報(bào)中,根據(jù)以往的蟲(chóng)情、多種氣象因子來(lái)判別

2、一個(gè)月后的蟲(chóng)情是大發(fā)生、中發(fā)生或正常; 在醫(yī)療診斷中,根據(jù)某人多種體檢指標(biāo)(如體溫、血壓、白血球等)來(lái)判別此人是有病還是無(wú)病。總之,在實(shí)際問(wèn)題中需要判別的問(wèn)題幾乎到處可見(jiàn)。,判別分析與聚類分析的區(qū)別,聚類分析和判別分析有相似的之處,都是起到分類的作用。 但是,判別分析是已知分類然后總結(jié)出判別規(guī)則,是一種有指導(dǎo)的學(xué)習(xí)。即:判別分析是在已知研究對(duì)象分成若干類型(或組別)并已取得各種類型的一批已知樣品的觀測(cè)數(shù)據(jù),在此基礎(chǔ)上根據(jù)某些準(zhǔn)則建立判別式,然后對(duì)未知類型的樣品進(jìn)行判別分類。 而聚類分析則是有了一批給定樣品,而要?jiǎng)澐值念愋褪孪炔⒉恢溃踔吝B分成幾類也不知道,希望用某種方法把觀測(cè)進(jìn)行合理的分類,

3、使得同一類的觀測(cè)比較接近,不同類的觀測(cè)相差較多,這是無(wú)指導(dǎo)的學(xué)習(xí)。,正因?yàn)槿绱?,判別分析和聚類分析往往聯(lián)合起來(lái)使用,例如判別分析是要求先知道各類總體情況才能判斷新樣品的歸類,當(dāng)總體分類不清楚時(shí),可先用聚類分析對(duì)原來(lái)的一批樣品進(jìn)行分類,然后再用判別分析建立判別式以對(duì)新樣品進(jìn)行判別。 判別分析的目的是對(duì)已知分類的數(shù)據(jù)建立由數(shù)值指標(biāo)構(gòu)成的分類規(guī)則,然后把這樣的規(guī)則應(yīng)用到未知分類的樣品去分類。 例如,我們有了患胃炎的病人和健康人的一些化驗(yàn)指標(biāo),就可以從這些化驗(yàn)指標(biāo)發(fā)現(xiàn)兩類人的區(qū)別,把這種區(qū)別表示為一個(gè)判別公式,然后對(duì)懷疑患胃炎的人就可以根據(jù)其化驗(yàn)指標(biāo)用判別公式診斷。,判別分析內(nèi)容:,判別分析按判別的組

4、數(shù)來(lái)區(qū)分,有兩組判別分析和多組判別分析; 按區(qū)分不同總體的所用的數(shù)學(xué)模型來(lái)分,有線性判別和非線性判別; 按判別時(shí)所處理的變量方法不同,有逐步判別和序貫判別等。 判別分析可以從不同角度提出問(wèn)題,因此有不同的判別準(zhǔn)則, 如馬氏距離最小準(zhǔn)則、Fisher準(zhǔn)則、平均損失最小準(zhǔn)則、最小平方準(zhǔn)則、最大似然準(zhǔn)則、最大概率準(zhǔn)則等等, 按判別準(zhǔn)則的不同又提出多種判別方法。本章僅介紹四種常用的判別方法即距離判別法、Fisher判別法、Bayes判別法和逐步判別法。,距離判別法,基本思想:首先根據(jù)已知分類的數(shù)據(jù),分別計(jì)算各類的重心即分組(類)的均值,判別準(zhǔn)則是對(duì)任給的一次觀測(cè),若它與第i類的重心距離最近,就認(rèn)為它來(lái)

5、自第i類。 距離判別法,對(duì)各類(或總體)的分布,并無(wú)特定的要求。,1、 兩個(gè)總體的距離判別法,設(shè)有兩個(gè)總體(或稱兩類)G1、G2,從第一個(gè)總體中抽取n1個(gè)樣品,從第二個(gè)總體中抽取n2個(gè)樣品,每個(gè)樣品測(cè)量p個(gè)指標(biāo)如下表:,今任取一個(gè)樣品,實(shí)測(cè)指標(biāo)值為 X(x1,xp),問(wèn)X應(yīng)判歸為哪一類?,解:首先計(jì)算X到G1、G2總體的距離,分別記為D(X,G1)和D(X,G2),按距離最近準(zhǔn)則判別歸類,則可寫(xiě)成:,如果距離定義采用歐氏距離,則可計(jì)算出,然后比較D(X,G1)和D(X,G2)大小,按距離最近準(zhǔn)則判別歸類。,下面用馬氏距離對(duì)上述準(zhǔn)則做較詳細(xì)討論,分別為:G1、G2的均值向量和協(xié)差陣。如果距離定義

6、采用馬氏距離即: 這時(shí)判別準(zhǔn)則可分以下兩種情況給出:,2、多個(gè)總體的距離判別法,例1:人文發(fā)展指數(shù)是聯(lián)合國(guó)開(kāi)發(fā)計(jì)劃署于1990年5月發(fā)表的第一份人類發(fā)展報(bào)告中公布的。該報(bào)告建議,目前對(duì)人文發(fā)展的衡量應(yīng)當(dāng)以人生的三大要素為重點(diǎn),衡量人生三大要素的指示指標(biāo)分別采用出生時(shí)的預(yù)期壽命、成人識(shí)字率和實(shí)際人均GDP,將以上三個(gè)指示指標(biāo)的數(shù)值合成為一個(gè)復(fù)合指數(shù),即為人文發(fā)展指數(shù)。資料來(lái)源:UNDP人類發(fā)展報(bào)告1995年。 今從1995年世界各國(guó)人文發(fā)展指數(shù)的排序中,選取高發(fā)展水平、中等發(fā)展水平的國(guó)家各五個(gè)作為兩組樣品,另選四個(gè)國(guó)家作為待判樣品作距離判別分析。,用SAS實(shí)現(xiàn)的判別分析實(shí)例,解:A盆地和B盆地看

7、做兩個(gè)不同的總體,并假定兩總體協(xié)差陣相等本例中變量個(gè)數(shù)p4,兩類總體各有5個(gè)訓(xùn)練樣品 (nln25),另有8個(gè)待判樣品下面用SASSTAT軟件中的 DISCRIM過(guò)程進(jìn)行判別歸類 以下SAS程序首先生成SAS數(shù)據(jù)集D6ll,然后調(diào)用 DISCRIM過(guò)程對(duì)含鉀和不含鉀的A,B兩類盆地的10個(gè)樣品特征測(cè)量值用距離判別的方法,建立線性判別函數(shù),并對(duì)已知類別的 樣品和待判樣品進(jìn)行判別歸類 輸出611至輸出613是SAS程序輸出的部分結(jié)果,誤判概率,下面的Bayes判別法則是將誤判概率、誤判造成的損失以及各個(gè)總體出現(xiàn)的先驗(yàn)概率結(jié)合起來(lái)建立的一種判別規(guī)則。,貝葉斯判別 距離判別法是利用所給樣品到各個(gè)總體的

8、距離的遠(yuǎn)近來(lái)判斷其歸屬。這種方法計(jì)算簡(jiǎn)單,且可不涉及分布的類型,因此,適用面較廣。但這種方法未考慮各個(gè)總體各自出現(xiàn)的可能性(概率)大小,同時(shí)也未涉及誤判之后造成的損失如何,這當(dāng)然不夠合理。 下面用一個(gè)地震預(yù)報(bào)的例子來(lái)說(shuō)明這個(gè)問(wèn)題。,例:設(shè)根據(jù)歷史上若干次發(fā)生地震和無(wú)震時(shí)的p項(xiàng)觀測(cè)結(jié)果(如地下水中氡的含量、地磁強(qiáng)度、井下水位高度)已經(jīng)估計(jì)出有震總體Gl與無(wú)震總體G2的有關(guān)參數(shù)。 現(xiàn)在要根據(jù)當(dāng)前觀測(cè)到的p項(xiàng)指標(biāo)來(lái)判斷所獲得的樣品是屬于G1還是G2。即是預(yù)報(bào)“明天有震”或“明天無(wú)震”。若簡(jiǎn)單地用樣品到G1和G2的距離來(lái)預(yù)報(bào)就不夠妥當(dāng)了。 首先,在全年的365天中有感地震是較少的,破壞性地震更是罕見(jiàn)的

9、。如果考慮到這個(gè)因素,在沒(méi)有特大的異常時(shí)就應(yīng)該預(yù)報(bào)“無(wú)震“,這樣較為穩(wěn)妥。這是由于歷史上的先驗(yàn)知識(shí)告訴我們:“有震”與“無(wú)震“這兩個(gè)總體本身各自出現(xiàn)的概率相差懸殊,在難以判斷時(shí),應(yīng)優(yōu)先判為出現(xiàn)的概率較大的那個(gè)總體。 其次,誤判有兩種:“有震”報(bào)為“無(wú)震是“漏報(bào)”;“無(wú)震”報(bào)為“有震”,是“虛報(bào)”。二者皆可能造成損失,但損失卻會(huì)很不相同?!奥﹫?bào)”會(huì)使人民在毫無(wú)準(zhǔn)備的情況下,面臨巨大災(zāi)難,會(huì)造成大量傷亡;而“虛報(bào)”則造成生產(chǎn)停頓,人心不安,有時(shí)的損失也不亞于“漏報(bào)”造成的損失. 這個(gè)例子是說(shuō),判斷一個(gè)樣品屬于哪一個(gè)總體時(shí),既要考慮各個(gè)總體各自出現(xiàn)的概率的大小,還應(yīng)考慮到錯(cuò)報(bào)造成的損失情況,最后才能決定樣品的歸屬?;谝陨峡紤],貝葉斯學(xué)派提出了另一種判別方法習(xí)慣上稱為Bayes判別法。,

展開(kāi)閱讀全文
溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!