計(jì)算機(jī)專業(yè)外文文獻(xiàn)翻譯-外文翻譯--機(jī)器學(xué)習(xí)的研究
《計(jì)算機(jī)專業(yè)外文文獻(xiàn)翻譯-外文翻譯--機(jī)器學(xué)習(xí)的研究》由會(huì)員分享,可在線閱讀,更多相關(guān)《計(jì)算機(jī)專業(yè)外文文獻(xiàn)翻譯-外文翻譯--機(jī)器學(xué)習(xí)的研究(21頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1 in of 1) of by of (2) up (3) 4) of an in in to to of in as as to as In I a of of is to in to a I to of 1) of (2) up (3) 4) of be is a of of my is to a of in of In of I to to in he in I by In a is of (… , ( y = f(x). of or as i, I ij 2 i. In I i it is by y a of 1,… , k} in of or in of In I on be by a of a a is a f. x it y I by , An of is a of in by or to of of in of of is An if 990). To we an of { a x. If h1(x) is h2(x) h3(x) if by h1(x) is h2(x) h3(x) be so a x. if hi to p. we to to h*. 1996b) to of by be by is a it be to of is as t we be to a as as at be it be or to a as as To we of by a of f). of it to f. If is we a of to 11 or In a of ; we () to a . of is a > of to We of or of 。 現(xiàn)在,我們能把一些其他的學(xué)習(xí)算法應(yīng)用到第二層數(shù)據(jù)來學(xué)習(xí) h*。 996b) 申請(qǐng)了這個(gè)用好結(jié)果聯(lián)合不同形式的線退化的達(dá)成方式。 為什么需要集成工作 我已經(jīng)為全體為什么能改善績(jī)效有了基本的直覺 : 單一的分類器犯 的是不相關(guān)的錯(cuò)誤,它能在加權(quán)時(shí)移除。然而 ,有一個(gè)較深的問題在這里潛藏 : 為什么應(yīng)該找到產(chǎn)生不相關(guān)的 錯(cuò)誤的分類器的全體是有可能的 ?恐怕最好的另外的一個(gè)問題 : 我們?yōu)槭裁床荒軌蛘业揭粋€(gè)單一的分類器能與全體分類器有相同的效果 ? 至少有三個(gè)理由能說明為什么好全體能被構(gòu)造和為什么找到一個(gè)單一分類器能夠有與全體相同的效果是困難的甚至是不可能的。為了理解這些理由,我們一定要考慮機(jī)器學(xué)習(xí)算法的性質(zhì)。機(jī)器學(xué)習(xí)算法是這樣運(yùn)行的,它通過為最正確 20 的假說尋找一個(gè)可能假定 也就是 , 假設(shè)最好接近未知的功能 f) 。假說隔開 果假說空間很大 ,那么我們需要大量的試驗(yàn)數(shù)據(jù)制約對(duì)好的近似值的搜尋。每個(gè)示例排除(或產(chǎn)生比較不真實(shí)的模擬)對(duì) 中 一個(gè)二類別的問題中 , 理想地每個(gè)示例能除去一半的對(duì) 因此 ,我們需要 O() 例子選擇來自 對(duì)全體的需要的第一因素是,試驗(yàn)數(shù)據(jù)不可能提供充份的信息給選擇來自 我們大部分的學(xué)習(xí)算法考慮非常大的假說空間 ;因此 , 即使在排除了對(duì)示例 的錯(cuò)誤分類的假定之后 ,仍然保持著許多假定。所有的這些假定是關(guān)于有效的試驗(yàn)數(shù)據(jù)平等地正確地出現(xiàn)。我們可能有偏愛在其它 ( 舉例來說 , 偏愛較簡(jiǎn)單的假定或者比較高的原先概率假定 ) 的一些假定的理由,但是,這些是典型地許多似真實(shí)的假定。從收集在 我們能容易地構(gòu)造一個(gè)分類器的全體而且把他們集成起來,然后使用在之前被描述的方法。 對(duì)全體的需要的第二個(gè)因素是我們的學(xué)習(xí)算法可能無法解決我們引起的困難的搜尋問題。舉例來說 , 發(fā)現(xiàn)對(duì)一組試驗(yàn)例子感到一致的最小決斷樹的問題是 976) 因此,實(shí)際的決斷樹算法使用啟發(fā)式的搜尋過程研究引導(dǎo)對(duì)小的決斷樹的貪婪搜尋。同樣地,發(fā)現(xiàn)對(duì)試驗(yàn)例子感到一致的最小可能的神經(jīng)網(wǎng)絡(luò)的權(quán)重也是 988)。因此神經(jīng)網(wǎng)絡(luò)算法使用局部的搜尋方法 (就像是傾斜的降落 )為網(wǎng)絡(luò)尋找局部性最佳的權(quán)重。這些有缺點(diǎn)的搜尋算法的結(jié)果是,即使組合我們的試驗(yàn)例子和我們之前的知識(shí) ( 舉例來說 , 喜歡簡(jiǎn)單的假定 , 貝斯定理的優(yōu)先 ) 決定一個(gè)獨(dú)特的最好假說 ,我們也可能無法找到。相反的,我們典型地找一個(gè)略微更復(fù)雜的假說 。 (或有略微低的概率 )如果我們用一個(gè)稍微不同的試驗(yàn)樣本或帶有干擾的搜尋算法 (或用任何的其他技術(shù)更早地描述 ),那么我們就找一個(gè)差積 (次最佳的 )假說。因此 ,全體可看作為有缺點(diǎn)的搜尋算法作補(bǔ)償?shù)姆椒ā? 對(duì)全體的需要第三個(gè)因素是我們的假說空間 f。相反的,過這些近似的加權(quán)組合,我們可能能夠代替在 解這一點(diǎn)的一個(gè)方法是分清學(xué)習(xí)算法構(gòu)造的判決交界。一個(gè)決斷交界是一個(gè)表面,以致于實(shí)例在將表面的一邊賦值給一個(gè)不同的類比用表面的另一邊賦值更好。被決斷構(gòu) 造學(xué)習(xí)樹的算法的決斷交界是線性 (或 ,更常用的 ,超平面地 )平行于同樣的軸。 如果在二個(gè)類別之間的真實(shí)交界是一條對(duì)角線 , 那么決斷樹算法一定接近一個(gè)以平行片段 (圖 6)為軸的 "梯形 "的對(duì)角線。試驗(yàn)樣本 (或差積被 的不同啟動(dòng)程序改變梯形近似值的位置 ,通過在這些不同的近似值之中投票,構(gòu)造對(duì)對(duì)角線的決斷交界的較好近似是可能的。 有趣地是,這些改良的梯形近似與對(duì)復(fù)雜的決斷樹是等價(jià)的。然而,這些樹是如此的大以致于我們要把它們包括在我們的假說中空間 個(gè)空間對(duì)于有效的試驗(yàn)數(shù)據(jù)遠(yuǎn)遠(yuǎn)的大。 因此,我們能夠發(fā)現(xiàn)全體提供克服我們的假說空間的不能充分具有代表性的方法。 關(guān)于啟動(dòng)全體問題 全體會(huì)通過集成不太精確的各分類器獲得高精確分類器而很好地被構(gòu)建起來。然而 ,仍然有許多問題:用最好的方法構(gòu)造全體以及怎樣才能最好理解被全 21 體作出的決斷。 面對(duì)一個(gè)新的學(xué)習(xí)問題 ,最好的構(gòu)造和應(yīng)用一個(gè)集成的分類器的方法是什么 ? 大體而言,沒有單一最好的學(xué)習(xí)算法。 然而,一些方法可能完全地比其它方法更好,而且一些方法可能在特定的局勢(shì)中比其它方法更好。 實(shí)驗(yàn)證明 1997) 比較 表明法是出眾的。然而, 996) 已經(jīng)顯示,在網(wǎng)域中帶干擾的試驗(yàn)數(shù)據(jù), 它把高權(quán)限設(shè)置在錯(cuò)誤的標(biāo)簽標(biāo)示的示例,結(jié)果構(gòu)造出壞的分類器。 995)表示,結(jié)合糾錯(cuò)輸出編碼的封裝改良了兩種方法的績(jī)效 ,因此建議其他全體方法的組合也應(yīng)該被探究。 指出糾錯(cuò)輸出編碼不能與高度局部的算法 很好地一起運(yùn)行 (就像最近 - 近鄰方法 )。 為構(gòu)造神經(jīng)網(wǎng)絡(luò)的全體,學(xué)習(xí)規(guī)則,系統(tǒng),和其他分類器的類型,已經(jīng)有了一些系統(tǒng)的研究方法。在這一個(gè)領(lǐng)域中仍然有許多工作要做。雖然全體能提供正確的分類器 , 但是一些問題可能限制它們實(shí)際的應(yīng)用。一個(gè)問題是,全體需要大量的存儲(chǔ)器用于儲(chǔ)存還要大量的計(jì)算應(yīng)用。 舉例來說,前面我提到了一個(gè) 200個(gè)決斷樹的全體達(dá)到在一個(gè)文字 - 辨識(shí)的基準(zhǔn)任務(wù)上的完美績(jī)效。然而 , 這 200個(gè)決斷樹需要儲(chǔ)存 五千九 百萬(wàn)位 ,這 對(duì)于大多數(shù)現(xiàn)在的計(jì)算機(jī)來說是不可能的。一個(gè)研究的重要線索是找出能把這些全體轉(zhuǎn)換成 更少冗余的表示方法 , 也許是通過刪除全體中高度有相互關(guān)系的成員或由具有代表性的成員替換。 產(chǎn)生集成分類器的第二個(gè)困難是全體對(duì)如何作決斷很難洞察。一個(gè)單一決斷樹能時(shí)常被使用者解釋,但是一個(gè)由 200個(gè)決斷樹投票組成的全體是很難理解的。那么能否發(fā)現(xiàn)獲得來自全體的解釋 (至少局部性地 )嗎 ? 在這個(gè)問題上一個(gè)實(shí)例是 s 996)。- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
6 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 計(jì)算機(jī)專業(yè) 外文 文獻(xiàn) 翻譯 機(jī)器 學(xué)習(xí) 研究
鏈接地址:http://appdesigncorp.com/p-18929.html