歡迎來到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁 裝配圖網(wǎng) > 資源分類 > PPT文檔下載  

模式識別_第四章_概率分類法PPT課件

  • 資源ID:4107915       資源大小:3.77MB        全文頁數(shù):116頁
  • 資源格式: PPT        下載積分:40積分
快捷下載 游客一鍵下載
會員登錄下載
微信登錄下載
三方登錄下載: 微信開放平臺登錄 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要40積分
郵箱/手機:
溫馨提示:
用戶名和密碼都是您填寫的郵箱或者手機號,方便查詢和重復(fù)下載(系統(tǒng)自動生成)
支付方式: 支付寶    微信支付   
驗證碼:   換一換

 
賬號:
密碼:
驗證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網(wǎng)頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無水印,預(yù)覽文檔經(jīng)過壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標(biāo)題沒有明確說明有答案則都視為沒有答案,請知曉。

模式識別_第四章_概率分類法PPT課件

第4章基于統(tǒng)計決策的概率分類法 4 1研究對象及相關(guān)概率4 2貝葉斯決策4 3貝葉斯分類器的錯誤率4 4聶曼 皮爾遜決策4 5概率密度函數(shù)的參數(shù)估計4 6概率密度函數(shù)的非參數(shù)估計4 7后驗概率密度分類的勢函數(shù)方法 第4章基于統(tǒng)計決策的概率分類法 獲取模式的觀察值時 有二種情況 確定性事件 事物間有確定的因果關(guān)系 第三章內(nèi)容 隨機事件 事物間沒有確定的因果關(guān)系 觀察到的特征具有統(tǒng)計特性 是一個隨機向量 只能利用模式集的統(tǒng)計特性進行分類 使分類器發(fā)生分類錯誤的概率最小 1 兩類研究對象 2 相關(guān)概率 1 概率的定義 設(shè) 是隨機試驗的基本空間 所有可能的實驗結(jié)果或基本事件的全體構(gòu)成的集合 也稱樣本空間 A為隨機事件 P A 為定義在所有隨機事件組成的集合上的實函數(shù) 若P A 滿足 4 1研究對象及相關(guān)概率 3 對于兩兩互斥的事件A1 A2 有 1 對任一事件A有 0 P A 1 2 P 1 事件的全體 則稱函數(shù)P A 為事件A的概率 設(shè)A B是兩個隨機事件 且P B 0 則稱 為事件B發(fā)生的條件下事件A發(fā)生的條件概率 3 條件概率定義 1 不可能事件V的概率為零 即P V 0 2 概率的性質(zhì) 4 1 1 概率乘法公式 如果P B 0 則聯(lián)合概率P AB P B P A B P A P B A P BA 3 貝葉斯公式 在全概率公式的條件下 若P B 0 則將 4 2 4 3 式代入 4 1 式中 有 4 4 4 條件概率的三個重要公式 則對任一事件B有 2 全概率公式 設(shè)事件A1 A2 An 兩兩互斥 且 4 2 4 3 今后的分類中常用到類概率密度p X i i類的條件概率密度函數(shù) 通常也稱為 i的似然函數(shù) 設(shè)隨機樣本向量X 相關(guān)的三個概率 2 后驗概率P i X 相對于先驗概率而言 指收到數(shù)據(jù)X 一批樣本 后 根據(jù)這批樣本提供的信息統(tǒng)計出的 i類出現(xiàn)的概率 表示X屬于 i類的概率 5 模式識別中的三個概率 1 先驗概率P i 根據(jù)以前的知識和經(jīng)驗得出的 i類樣本出現(xiàn)的概率 與現(xiàn)在無關(guān) 3 條件概率P X i 已知屬于 i類的樣本X 發(fā)生某種事件的概率 例對一批得病患者進行一項化驗 結(jié)果為陽性的概率為95 1代表得病人群 則X化驗為陽性的事件可表示為 P 2 X 表示試驗呈陽性的人中 實際沒有病的人的概率 若用某種方法檢測是否患有某病 假設(shè)X表示 試驗反應(yīng)呈陽性 則 例如 一個2類問題 1診斷為患有某病 2診斷為無病 P 2 表示該地區(qū)人無此病的概率 則 P 1 表示某地區(qū)的人患有此病的概率 P X 2 表示無病的人群做該試驗時反應(yīng)呈陽性 顯示有病 的概率 值低 高 值低 高 P X 1 表示患病人群做該試驗時反應(yīng)呈陽性的概率 P 1 X 表示試驗呈陽性的人中 實際確實有病的人的概率 通過統(tǒng)計資料得到 4 三者關(guān)系 根據(jù) 4 4 貝葉斯公式有 4 5 M 類別數(shù) 2 決策規(guī)則 4 2 1最小錯誤率貝葉斯決策 討論模式集的分類 目的是確定X屬于那一類 所以要看X來自哪類的概率大 在下列三種概率中 先驗概率P i 類 條件 概率密度p X i 后驗概率P i X 采用哪種概率進行分類最合理 1 問題分析 后驗概率P i X 4 2貝葉斯決策 設(shè)有M類模式 4 6 最小錯誤率貝葉斯決策規(guī)則 雖然后驗概率P i X 可以提供有效的分類信息 但先驗概率P i 和類概率密度函數(shù)p X i 從統(tǒng)計資料中容易獲得 故用Bayes公式 將后驗概率轉(zhuǎn)化為類概率密度函數(shù)和先驗概率的表示 由 可知 分母與i無關(guān) 即與分類無關(guān) 故分類規(guī)則又可表示為 4 7 幾種等價形式 對兩類問題 4 7 式相當(dāng)于 可改寫為 統(tǒng)計學(xué)中稱l12 X 為似然比 為似然比閾值 對 4 8 式取自然對數(shù) 有 4 7 4 8 4 9 都是最小錯誤率貝葉斯決策規(guī)則的等價形式 例4 1假定在細胞識別中 病變細胞的先驗概率和正常細胞的先驗概率分別為 現(xiàn)有一待識別細胞 其觀察值為X 從類條件概率密度發(fā)布曲線上查得 試對細胞X進行分類 解 方法1 通過后驗概率計算 方法2 利用先驗概率和類概率密度計算 是正常細胞 4 2 2最小風(fēng)險貝葉斯決策 1 風(fēng)險的概念 自動滅火系統(tǒng) 疾病診斷 不同的錯判造成的損失不同 因此風(fēng)險不同 兩者緊密相連 考慮到對某一類的錯判要比對另一類的錯判更為關(guān)鍵 把最小錯誤率的貝葉斯判決做一些修改 提出了 條件平均風(fēng)險 的概念 對M類問題 如果觀察樣本X被判定屬于 i類 則條件平均風(fēng)險ri X 指將X判為屬于 i類時造成的平均損失 2 決策規(guī)則 式中 i 分類判決后指定的判別號 j 樣本實際屬于的類別號 Lij 將自然屬性是 j類的樣本決策為 i類時的是非代價 即損失函數(shù) 每個X都按條件平均風(fēng)險最小決策 則總的條件平均風(fēng)險也最小 總的條件平均風(fēng)險稱為平均風(fēng)險 條件平均風(fēng)險與平均風(fēng)險的區(qū)別 1 多類情況 設(shè)有M類 對于任一X對應(yīng)M個條件平均風(fēng)險 對每個X有M種可能的類別劃分 X被判決為每一類的條件平均風(fēng)險分別為r1 X r2 X rM X 決策規(guī)則 i 1 2 M 用先驗概率和條件概率的形式 p X 對所有類別一樣 不提供分類信息 i 1 2 M 決策規(guī)則為 2 兩類情況 對樣本X 當(dāng)X被判為 2類時 4 15 4 16 由 4 15 式 決策規(guī)則 為閾值 計算 計算 定義損失函數(shù)Lij 判別步驟 類概率密度函數(shù)p X i 也稱 i的似然函數(shù) 解 計算和得 例4 2在細胞識別中 病變細胞和正常細胞的先驗概率分別為 現(xiàn)有一待識別細胞 觀察值為X 從類概率密度分布曲線上查得 損失函數(shù)分別為L11 0 L21 10 L22 0 L12 1 按最小風(fēng)險貝葉斯決策分類 為病變細胞 損失函數(shù)為特殊情況 3 0 1 損失最小風(fēng)險貝葉斯決策 1 多類情況 0 1 情況下 可改寫成 最小錯誤率貝葉斯決策 2 兩類情況 決策規(guī)則為 或從式 4 20 導(dǎo)出似然比形式 式中 決策規(guī)則 類似地 Lij X 的確定 根據(jù)錯誤造成損失的嚴重程度 及專家經(jīng)驗確定 4 2 3正態(tài)分布模式的貝葉斯決策 許多實際的數(shù)據(jù)集 均值附近分布較多的樣本 距均值點越遠 樣本分布越少 此時正態(tài)分布 高斯分布 是一種合理的近似 正態(tài)分布概率模型的優(yōu)點 物理上的合理性 數(shù)學(xué)上的簡單性 圖中為某大學(xué)男大學(xué)生的身高數(shù)據(jù) 紅線是擬合的密度曲線 可見 其身高應(yīng)服從正態(tài)分布 1 相關(guān)知識概述 1 二次型 二次型中的矩陣A是一個對稱矩陣 即 含義 是一個二次齊次多項式 3 單變量 一維 的正態(tài)分布 密度函數(shù)定義為 曲線如圖示 1 0 5 0 1 1 2 一維正態(tài)曲線的性質(zhì) 2 曲線關(guān)于直線x 對稱 3 當(dāng)x 時 曲線位于最高點 4 當(dāng)x 時 曲線上升 當(dāng)x 時 曲線下降 并且當(dāng)曲線向左 右兩邊無限延伸時 以x軸為漸近線 向它無限靠近 1 曲線在x軸的上方 與x軸不相交 5 一定時 曲線的形狀由 確定 越大 曲線越 矮胖 表示總體的分布越分散 越小 曲線越 瘦高 表示總體的分布越集中 4 3 規(guī)則 即 絕大部分樣本都落在了均值 附近 3 的范圍內(nèi) 因此正態(tài)密度曲線完全可由均值和方差來確定 常簡記為 p x 5 多變量 n維 正態(tài)隨機向量 密度函數(shù)定義為 式中 C 協(xié)方差矩陣C的行列式 多維正態(tài)密度函數(shù)完全由它的均值M和協(xié)方差矩陣C所確定 簡記為 p X N M C 為協(xié)方差矩陣 是對稱正定矩陣 獨立元素有個 以二維正態(tài)密度函數(shù)為例 等高線 等密度線 投影到x1ox2面上為橢圓 從原點O到點M的向量為均值M 橢圓的位置 由均值向量M決定 橢圓的形狀 由協(xié)方差矩陣C決定 協(xié)方差矩陣Ci 反映樣本分布區(qū)域的形狀 均值向量Mi 表明了區(qū)域中心的位置 2 正態(tài)分布的最小錯誤率貝葉斯決策規(guī)則 1 多類情況 具有M種模式類別的多變量正態(tài)密度函數(shù)為 前面介紹的Bayes方法事先必須求出p X i P i 而當(dāng)p X i 呈正態(tài)分布時 只需要知道M和C即可 每一類模式的分布密度函數(shù)都完全被其均值向量Mi和協(xié)方差矩陣Ci所規(guī)定 其定義為 對正態(tài)密度函數(shù) 為了方便計算 取對數(shù) 對數(shù)是單調(diào)遞增函數(shù) 取對數(shù)后仍有相對應(yīng)的分類性能 最小錯誤率Bayes決策中 i類的判別函數(shù)為 去掉與i無關(guān)的項 得判別函數(shù) 正態(tài)分布的最小錯誤率Bayes決策的判別函數(shù) 4 25 di X 為超二次曲面 可見對正態(tài)分布模式的Bayes分類器 兩類模式之間用一個二次判別界面分開 就可以求得最優(yōu)的分類效果 判決規(guī)則同前 2 兩類問題 2 當(dāng)C1 C2 C時 由式 4 25 有 由此導(dǎo)出判別界面為 為X的線性函數(shù) 是一超平面 當(dāng)為二維時 判別界面為一直線 如圖4 4所示 4 28 兩類相同 抵消 展開相同 合并 判別界面如圖4 5所示 圖4 5C1 C2 I且先驗概率相等 例4 3設(shè)在三維特征空間里 有兩類正態(tài)分布模式 每類各有4個樣本 分別為 其均值向量和協(xié)方差矩陣可用下式估計 4 30 4 31 式中 Ni為類別 i中模式的數(shù)目 Xij代表在第i類中的第j個模式 兩類的先驗概率 試確定兩類之間的判別界面 解 經(jīng)計算有 因協(xié)方差矩陣相等 故 4 28 為其判別式 由于 圖中畫出判別平面的一部分 以上排完 4 3貝葉斯分類器的錯誤率 4 3 1錯誤率的概念 錯誤率 將應(yīng)屬于某一類的模式錯分到其他類中的概率 是衡量分類器性能優(yōu)劣的重要參數(shù) 定義為 表示n重積分 即整個n維模式空間上的積分 式中 是X的條件錯誤概率 平均錯誤率 錯誤率的計算或估計方法 按理論公式計算 計算錯誤率上界 實驗估計 設(shè)R1為 1類的判決區(qū) R2為 2類的判決區(qū) 分類中可能會發(fā)生兩種錯誤 將來自 1類的模式錯分到R2中去 將來自 2類的模式錯分到R1中去 錯誤率為兩種錯誤之和 4 3 2錯誤率分析 1 兩類問題的錯誤率 一維情況圖示 4 33 4 33 兩類問題的最小錯誤率貝葉斯決策規(guī)則 用后驗概率密度表示為 用先驗概率和類概率密度函數(shù)表示為 或 判別界面為 兩類問題最小錯誤率貝葉斯決策中錯誤率P e X 為 4 33 令 則 在最小錯誤率貝葉斯決策中 判別界面位于兩曲線的交點處 即 可以看出這個錯誤率是所有錯誤率中最小的 圖中三角形的面積減小到0 但總錯誤概率不可能為零 通常需要考慮總錯誤概率 僅使一類樣本的錯誤概率最小是沒有意義的 因為這時另一類的錯誤概率可能很大 其他情況下的錯誤率 設(shè)共有M類 當(dāng)判決時 當(dāng)X判為任何一類時 都存在這樣一個可能的錯誤 故 2 多類情況錯誤率 總錯誤率為 正確分類概率 則 錯誤率 簡化計算 假定 4 3 3正態(tài)分布貝葉斯決策的錯誤率計算 1 正態(tài)分布的對數(shù)似然比 設(shè) 對數(shù)似然比決策規(guī)則 若 則 令 有 由正態(tài)分布概率密度函數(shù) 有 h X 是X的線性函數(shù) 故h X 是正態(tài)分布的一維隨機變量 計算錯誤率較為方便 2 對數(shù)似然比的概率分布 均值 方差 1和 2間的馬氏距離平方 圖4 9對數(shù)似然比h X 的概率分布 3 正態(tài)分布最小錯誤率貝葉斯決策的錯誤率 兩類問題最小錯誤率貝葉斯決策的錯誤率 其中 令 若 則 計算結(jié)果通過查標(biāo)準正態(tài)分布表求得 圖4 10錯誤率與馬氏距離的關(guān)系 P e 隨著的增大而單調(diào)遞減 只要兩類模式的馬氏距離足夠大 錯誤率就可以減到足夠小 4 3 4錯誤率的估計 1 已設(shè)計好分類器時錯誤率的估計 1 先驗概率未知 隨機抽樣 N 隨機抽取的樣本數(shù) k 錯分樣本數(shù) 2 先驗概率已知 選擇性抽樣 分別從 1類和 2類中抽取出N1和N2個樣本 用N1 N2 N個樣本對設(shè)計好的分類器作分類檢驗 設(shè) 1類被錯分的個數(shù)為k1 2類錯分的個數(shù)為k2 k1 k2統(tǒng)計獨立 聯(lián)合概率為 式中 i是 i類的真實錯誤率 總錯誤率的最大似然估計為 2 未設(shè)計好分類器時錯誤率的估計 要求 用收集到的有限的N個樣本設(shè)計分類器并估計其性能 錯誤率的函數(shù)形式 1 2 1 用于設(shè)計分類器的樣本的分布參數(shù) 2 用于檢驗分類器性能的樣本的分布參數(shù) 設(shè) 是全部訓(xùn)練樣本分布的真實參數(shù)集 為全部樣本中N個樣本分布的參數(shù)估計量 有 將有限樣本劃分為設(shè)計樣本集和檢驗樣本集的兩種基本方法 1 樣本劃分法 將樣本分成兩組 其中一組用來設(shè)計分類器 另一組用來檢驗分類器 求其錯誤率 取不同劃分方法的平均值作為錯誤率的估計 缺點 需要的樣本數(shù)N很大 2 留一法 將N個樣本每次留下其中的一個 用其余的 N 1 個設(shè)計分類器 用留下的那個樣本進行檢驗 檢驗完后重新放回樣本集 重復(fù)進行N次 注意 每次留下的一個樣本應(yīng)當(dāng)是不同的樣本 適用于樣本數(shù)較小的情況 缺點 計算量大 4 4聶曼 皮爾遜 Neyman Person 決策 適用于P i 或P i 和Lij X 難以確定時 基本思想 限制一個錯誤概率 追求另一個最小 二類問題 在兩類問題貝葉斯決策的錯誤率公式中 1 基本思想 式中 先驗概率通常為常數(shù) 故一般也稱P1 e 和P2 e 為兩類錯誤率 P1 e 1類模式被誤判為 2類的錯誤率 P2 e 2類模式被誤判為 1類的錯誤率 聶曼 皮爾遜決策出發(fā)點 在P2 e 等于常數(shù)的條件下 使P1 e 為最小 以此確定閾值t 一維情況聶曼 皮爾遜決策示意 此時聶曼 皮爾遜決策含義 在虛警概率P2 e 是一個可以承受的常數(shù)值的條件下 使漏報概率為最小 求解問題 在P2 e 等于常數(shù)的條件下 求P1 e 極小值的條件極值問題 P2 e 的值一般很小 2 判別式推導(dǎo) 式中 待定常數(shù) P2 e 常數(shù) 求P1 e 最小 即是求Q最小 構(gòu)造輔助函數(shù) 要使Q最小 積分項至少應(yīng)為負值 即在R1區(qū)域內(nèi) 至少應(yīng)保證 4 57 同理由式 4 57 有 在R2區(qū)域內(nèi)至少應(yīng)保證 由于和是已知的 所以聶曼 皮爾遜決策最終歸結(jié)為尋找似然比閾值 求解 值從常數(shù)P2 e 入手 這時由有 即是P2 e 的函數(shù) 通過查標(biāo)準正態(tài)分布表可以求得的值 表中末行系函數(shù)值 3 0 3 1 3 9 縱向值 的整數(shù)部分和小數(shù)點后第一位 橫向值 的小數(shù)點后第二位 表中為 0時 的值 1 標(biāo)準正態(tài)分布表 復(fù)習(xí) 2 正態(tài)分布的概率計算 左邊陰影部分的面積表示為概率 即分布函數(shù) 在任一區(qū)間內(nèi)取值的概率 當(dāng)時 解 1 2 3 例4 4一兩類問題 模式分布為二維正態(tài) 其分布參數(shù)協(xié)方差矩陣為C1 C2 I 設(shè)P2 e 0 046 求聶曼 皮爾遜決策規(guī)則的似然比閾值 和判別界面 i 1 2 解 1 求類概率密度函數(shù)正態(tài)分布的類概率密度函數(shù)為 已知 又計算得 2 求似然比 3 求判別式 決策規(guī)則 兩邊取自然對數(shù) 有 得判別式 4 62 4 求似然比閾值 由與的關(guān)系有 分離積分 向正態(tài)分布表的標(biāo)準形式 變換 有 令有 查正態(tài)分布數(shù)值表 要求P2 e 0 046 在表上查 當(dāng)時 對應(yīng) 對應(yīng) 1 69 即 有 計算得 由 4 62 式得判別界面 圖4 12聶曼 皮爾遜決策結(jié)果 4 5概率密度函數(shù)的參數(shù)估計 4 5 1最大似然估計 兩類估計方法 概率密度函數(shù)的形式未知 直接估計概率密度函數(shù)的方法 已知概率密度函數(shù)的形式而函數(shù)的有關(guān)參數(shù)未知 通過估計參數(shù)來估計概率密度函數(shù)的方法 參數(shù)估計法 非參數(shù)估計法 兩種主要參數(shù)估計法 最大似然估計 貝葉斯估計 設(shè) i類的類概率密度函數(shù)具有某種確定的函數(shù)形式 是該函數(shù)的一個未知參數(shù)或參數(shù)集 最大似然估計把 當(dāng)作確定的未知量進行估計 從 i類中獨立地抽取N個樣本 1 似然函數(shù) 稱這N個樣本的聯(lián)合概率密度函數(shù)為相對于樣本集XN的 的似然函數(shù) 在參數(shù) 下觀測到的樣本集XN的概率 聯(lián)合分布 密度 2 最大似然估計 根據(jù)已經(jīng)抽取的N個樣本估計這組樣本 最可能 來自哪個密度函數(shù) 最似 哪個密度函數(shù) 也即 要找到一個 它能使似然函數(shù)極大化 由求得 為一維時的最大似然估計示意圖 的最大似然估計量就是使似然函數(shù)達到最大的估計量 為便于分析 定義似然函數(shù)的對數(shù)為 的最大似然估計是下面微分方程的解 設(shè) i類的概率密度函數(shù)有p個未知參數(shù) 記為p維向量 此時 解以上微分方程即可得到 的最大似然估計值 3 正態(tài)分布情況舉例 設(shè) i類 正態(tài)分布 一維模式 概率密度函數(shù)為 待估計參數(shù)為 2 4 69 其中 若XN表示從 i中獨立抽取的N個樣本 則 的似然函數(shù)為 其中 得 由以上方程組解得均值和方差的估計量為 類似地 多維正態(tài)分布情況 均值向量的最大似然估計是樣本的均值 最大似然估計結(jié)果 協(xié)方差矩陣的最大似然估計是N個矩陣的算術(shù)平均 4 5 2貝葉斯估計與貝葉斯學(xué)習(xí) 貝葉斯估計和貝葉斯學(xué)習(xí)將未知參數(shù)看作隨機參數(shù)進行考慮 1 貝葉斯估計和貝葉斯學(xué)習(xí)的概念 1 貝葉斯估計 步驟 2 貝葉斯學(xué)習(xí) 迭代計算式的推導(dǎo) 4 72 4 71 式中 除樣本XN以外其余樣本的集合 4 72 4 73 將 4 73 式代入 4 72 式得 類似地 4 74 4 75 將 4 75 式代入 4 74 式得 4 76 參數(shù)估計的遞推貝葉斯方法 迭代過程即是貝葉斯學(xué)習(xí)的過程 迭代式的使用 給出X2 對用X1估計的結(jié)果進行修改 2 正態(tài)分布密度函數(shù)的貝葉斯估計和貝葉斯學(xué)習(xí) 1 貝葉斯估計 逐次給出X3 X4 XN 得到 式中 4 79 有 由于 有 式中 與最大似然估計形式類似 式中 同前 2 貝葉斯學(xué)習(xí) 圖4 14均值的貝葉斯學(xué)習(xí)過程示意圖 可見 則利用貝葉斯估計得到的M的后驗概率密度函數(shù)為 其中 根據(jù)貝葉斯學(xué)習(xí)得到的類概率密度函數(shù)為 4 6概率密度函數(shù)的非參數(shù)估計 4 6 1基本方法 根據(jù)樣本直接估計類概率密度函數(shù)的方法 1 出發(fā)點 基于事實 p X 類概率密度函數(shù) 隨機向量X落入?yún)^(qū)域R的概率P為 設(shè)從密度為p X 的總體中獨立抽取的樣本X1 X2 XN 若N個樣本中有k個落入?yún)^(qū)域R中的概率最大 則 希望是X落入?yún)^(qū)域R中概率P的一個很好的估計 類概率密度函數(shù)p X 的估計 設(shè)p X 連續(xù) 區(qū)域R足夠小且體積為V p X 在R中沒有變化 X是R中的點 有 得 X點概率密度的估計 2 存在的兩個問題 4 91 1 固定V 樣本數(shù)增多 則k N以概率1收斂 但只能得到在某一體積V中的平均估計 2 N固定 V趨于零 或發(fā)散到無窮大 沒有意義 必須注意V k k N隨N變化的趨勢和極限 保持合理性 3 估計的步驟 構(gòu)造一串包含X的區(qū)域R1 R2 RN 對R1采用一個樣本估計 對R2采用兩個樣本 假定VN是RN的體積 kN是落入RN內(nèi)的樣本數(shù)目 是p X 的第N次估計 有 4 為保證估計合理性應(yīng)滿足的三個條件 1 2 3 使式右邊能以概率1收斂于p X 4 92 落入RN中的樣本數(shù)始終是總數(shù)中的極小部分 5 兩種非參數(shù)估計法 Parzen窗法 kN近鄰估計法 4 6 2Parzen窗法 1 Parzen窗估計的基本概念 設(shè)區(qū)域RN d維超立方體 棱長 hN 則 以原點為中心的超立方體 當(dāng)Xi落入以X為中心 體積為VN的超立方體時 否則 落入超立方體內(nèi)的樣本數(shù)為 4 95 代入得 Parzen窗法基本公式 實質(zhì) 窗函數(shù)的作用是內(nèi)插 樣本對估計所起的作用取決于它到X的距離 為密度函數(shù)應(yīng)滿足的兩個條件 2 窗函數(shù)的選擇 1 方窗函數(shù) 2 正態(tài)窗函數(shù) 3 指數(shù)窗函數(shù) 一維形式 滿足條件和的都可以作為窗函數(shù) 最終估計效果的好壞與樣本情況 窗函數(shù)以及窗函數(shù)參數(shù)的選擇有關(guān) 定義 有 如何選取根據(jù)經(jīng)驗折中考慮 限制條件 1 總體密度函數(shù)p X 在X點連續(xù) 2 窗函數(shù)滿足以下條件 3 窗函數(shù)受下列條件的約束 有 估計結(jié)果 解 估計結(jié)果 具有一般性 適用于單峰 多峰形式 Parzen窗法特點 要得到較精確的估計必須抽取大量的樣本 一般非參數(shù)估計法的共同問題 比參數(shù)估計法多得多 樣本數(shù)目隨模式維數(shù)一般按指數(shù)規(guī)律增長 4 6 3kN 近鄰估計法 基本思想 使體積為樣本密度的函數(shù) 而不是樣本數(shù)N的函數(shù) 限制條件仍然是 例4 5和4 6中 用kN 近鄰法估計的p X 的結(jié)果 4 7后驗概率密度函數(shù)的勢函數(shù)估計法 勢函數(shù)的確定方法有兩種方法 第i類判別函數(shù)的迭代算法 說明 解 從圖上可看出兩類模式不是線性可分的 選擇指數(shù)型二維勢函數(shù) 結(jié)束 同學(xué)們 來學(xué)校和回家的路上要注意安全 同學(xué)們 來學(xué)校和回家的路上要注意安全

注意事項

本文(模式識別_第四章_概率分類法PPT課件)為本站會員(青****)主動上傳,裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng)(點擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因為網(wǎng)速或其他原因下載失敗請重新下載,重復(fù)下載不扣分。




關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!