歡迎來到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁 裝配圖網(wǎng) > 資源分類 > PPT文檔下載  

廈門大學(xué)《應(yīng)用多元統(tǒng)計(jì)分析》第10章多維標(biāo)度法

  • 資源ID:16335826       資源大?。?span id="sfzoi9b" class="font-tahoma">2.02MB        全文頁數(shù):60頁
  • 資源格式: PPT        下載積分:14.9積分
快捷下載 游客一鍵下載
會員登錄下載
微信登錄下載
三方登錄下載: 微信開放平臺登錄 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要14.9積分
郵箱/手機(jī):
溫馨提示:
用戶名和密碼都是您填寫的郵箱或者手機(jī)號,方便查詢和重復(fù)下載(系統(tǒng)自動(dòng)生成)
支付方式: 支付寶    微信支付   
驗(yàn)證碼:   換一換

 
賬號:
密碼:
驗(yàn)證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會被瀏覽器默認(rèn)打開,此種情況可以點(diǎn)擊瀏覽器菜單,保存網(wǎng)頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無水印,預(yù)覽文檔經(jīng)過壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標(biāo)題沒有明確說明有答案則都視為沒有答案,請知曉。

廈門大學(xué)《應(yīng)用多元統(tǒng)計(jì)分析》第10章多維標(biāo)度法

第十章 多維標(biāo)度法,第一節(jié) 引 言,第二節(jié) 古典多維標(biāo)度法(Classical MDS),第三節(jié) 權(quán)重多維標(biāo)度(WMDS),第四節(jié) 實(shí)例分析與計(jì)算實(shí)現(xiàn),第一節(jié) 引 言,在實(shí)際中我們會經(jīng)常遇到這些的問題,給你一組城市,你總能從地圖上測出任何一對城市之間的距離。但若給你若干城市的距離,你能否確定這些城市之間的相對位置呢?假定你知道只是哪兩個(gè)城市最近,哪兩個(gè)城市次近等等,你是否還能確定它們之間的相對位置呢?假定通過調(diào)查了解了10種飲料產(chǎn)品在消費(fèi)者心中的相似程度,你能否確定這些產(chǎn)品在消費(fèi)者心理空間中的相對位置呢?在實(shí)際中我們常常會遇到類似這樣的問題。 多維標(biāo)度法(Multidimensional Scaling)就是解決這類問題的一種方法,它是一種在低維空間展示“距離”數(shù)據(jù)結(jié)構(gòu)的多元數(shù)據(jù)分析技術(shù),簡稱MDS。 多維標(biāo)度法起源于心理測度學(xué),用于理解人們判斷的相似性。Torgerson拓展了Richardson及Klingberg等人在三、四十年代的研究,具有突破性地提出了多維標(biāo)度法,后經(jīng),Shepard和Kruskal等人進(jìn)一步加以發(fā)展完善。多維標(biāo)度法現(xiàn)在已經(jīng)成為一種廣泛用于心理學(xué)、市場調(diào)查、社會學(xué)、物理學(xué)、政治科學(xué)及生物學(xué)等領(lǐng)域的數(shù)據(jù)分析方法。 多維標(biāo)度法解決的問題是:當(dāng)n個(gè)對象(object)中各對對象之間的相似性(或距離)給定時(shí),確定這些對象在低維空間中的表示(感知圖Perceptual Mapping),并使其盡可能與原先的相似性(或距離)“大體匹配”,使得由降維所引起的任何變形達(dá)到最小。多維空間中排列的每一個(gè)點(diǎn)代表一個(gè)對象,因此點(diǎn)間的距離與對象間的相似性高度相關(guān)。也就是說,兩個(gè)相似的對象由多維空間中兩個(gè)距離相近的點(diǎn)表示,而兩個(gè)不相似的對象則由多維空間兩個(gè)距離較遠(yuǎn)的點(diǎn)表示。多維空間通常為二維或三維的歐氏空間,但也可以是非歐氏三維以上空間。,多維標(biāo)度法內(nèi)容豐富、方法較多。按相似性(距離)數(shù)據(jù)測量尺度的不同MDS可分為:度量MDS和非度量MDS。當(dāng)利用原始相似性(距離)的實(shí)際數(shù)值為間隔尺度和比率尺度時(shí)稱為度量MDS(metric MDS),當(dāng)利用原始相似性(距離)的等級順序(即有序尺度)而非實(shí)際數(shù)值時(shí)稱為非度量MDS(nonmetric MDS)。按相似性(距離)矩陣的個(gè)數(shù)和MDS模型的性質(zhì)MDS可分為:古典多維標(biāo)度CMDS(一個(gè)矩陣,無權(quán)重模型)、重復(fù)多維標(biāo)度Replicated MDS(幾個(gè)矩陣,無權(quán)重模型)、權(quán)重多維標(biāo)度WMDS(幾個(gè)矩陣,權(quán)重模型)。本章僅介紹常用的古典多維標(biāo)度法和權(quán)重多維標(biāo)度法。,第二節(jié) 古典多維標(biāo)度法 (Classical MDS),一 相似與距離的概念,二 古典多維標(biāo)度分析的思想及方法,三 度量MDS的古典解,四 非度量MDS的古典解(nonmetric MDS),首先我們提出這樣一個(gè)問題,表10.1是美國十城市之間的飛行距離,我們?nèi)绾卧谄矫孀鴺?biāo)上據(jù)此標(biāo)出這10城市之間的相對位置,使之盡可能接近表中的距離數(shù)據(jù)呢?,表10.1 美國10城市間的飛行距離,一、相似與距離的概念,在解決上述問題之前,我們首先明確與多維標(biāo)度法相關(guān)的數(shù)據(jù)概念。 1相似數(shù)據(jù)與不相似數(shù)據(jù) 相似數(shù)據(jù):如果用較大的數(shù)據(jù)表示非常相似,用較小的數(shù)據(jù)表示非常不相似,則數(shù)據(jù)為相似數(shù)據(jù)。如用10表示兩種飲料非常相似,用1表示兩種飲料非常不相似。 不相似數(shù)據(jù):如果用較大的數(shù)值表示非常不相似,較小的數(shù)值表示非常相似,則數(shù)據(jù)為不相似數(shù)據(jù),也稱距離數(shù)據(jù)。如用10表示兩種飲料非常不相似,用1表示兩種飲料非常相似。 2距離陣 定義10.1 一個(gè)n n階的矩陣D=(dij ) n n ,如果滿足條件:,在進(jìn)行多維標(biāo)度分析時(shí),如果數(shù)據(jù)是多個(gè)分析變量的原始數(shù)據(jù),則要根據(jù)聚類分析中介紹的方法,計(jì)算分析對象間的相似測度;如果數(shù)據(jù)不是廣義距離陣,要通過一定的方法將其轉(zhuǎn)換成廣義距離陣才能進(jìn)行多維標(biāo)度分析。,二、古典多維標(biāo)度分析的思想及方 法,這里需要特別注意,并非所有的距離陣都存在一個(gè)r維的歐氏空間和n個(gè)點(diǎn),使得n個(gè)點(diǎn)之間的距離等于D。因而,并不是所有的距離陣都是歐氏距離陣,還存在非歐氏距離陣。 當(dāng)距離陣為歐氏時(shí),可求得一個(gè)D的構(gòu)圖X,當(dāng)距離陣不是歐氏時(shí),只能求得D的擬合構(gòu)圖。在實(shí)際應(yīng)用中,即使D為歐氏,一般也只求r =2或3的低維擬合構(gòu)圖。 值得注意的是,由于多維標(biāo)度法求解的n個(gè)點(diǎn)僅僅要求它們的相對歐氏距離與D相近,也就是說,只與相對位置相近而與絕對位置無關(guān),根據(jù)歐氏距離在正交變換和平移變換下的不變性,顯然所求得解并不唯一。,三、度量MDS的古典解,(4)根據(jù)(10.7)式計(jì)算 ,得到r維擬合構(gòu)圖(簡稱古典解)。 這里需要注意,如果i中有負(fù)值,表明D是非歐氏型的。 (一)已知距離矩陣的CMDS計(jì)算 以前述美國10城市間的飛行距離數(shù)據(jù)來說明古典度量多維標(biāo)度法的計(jì)算過程。 表10.1美國10城市間的飛行距離為比率測度。數(shù)值越大表明距離越遠(yuǎn),數(shù)值越小表明距離越短,符合廣義距離陣的定義,又只涉及一個(gè)距離陣,因此為度量CMDS。 根據(jù)上述度量古典CMDS的計(jì)算方法,首先可求得內(nèi)積矩陣,結(jié)果見表10.2。,表10.2 美國10城市內(nèi)積矩陣,10個(gè)城市的坐標(biāo)分別為: (-718.759,142.9942),(-382.056,-340.84),(481.602,-25.285),(-161.466,572.77),(1203.738,390.100),(-1133.53,581.907),(1072.24,-519.024),(1420.603,112.589),(1341.723,-579.739),(-979.622,-335.473)。 計(jì)算結(jié)果表明,較大的特征值有兩個(gè),說明在二維平面上表示10城市間的相對位置是合適的。由于有特征值小于零,表明距離陣不是歐氏型,其結(jié)果為擬合構(gòu)圖。在此,城市是“對象”,飛行里程是“相似性”。圖10.1給出了MDS反映美國10座城市相對位置的感知圖。圖中的10個(gè)點(diǎn),每個(gè)點(diǎn)代表一個(gè)城市,相近的點(diǎn)代表飛行距離短的城市,相距較遠(yuǎn)的點(diǎn)代表飛行距離遠(yuǎn)的城市。,圖10.1 10城市坐標(biāo)感知圖,相關(guān)系數(shù)的值越大,表示課程越相似,相關(guān)系數(shù)值越小,表明課程越不相似,顯而易見,相關(guān)系數(shù)矩陣為相似系數(shù)矩陣,記為C。,表10.3 6門課程相關(guān)系數(shù)陣,根據(jù)變換(10.8)式可得到距離陣D,見表10.4。在此基礎(chǔ)上,根據(jù)(10.5)式得到內(nèi)積矩陣B,具體結(jié)果見表10.5。,表10.4 距離陣D,表10.5 內(nèi)積矩陣,從結(jié)果知距離陣D不是歐氏型,我們?nèi)=2,由(10.7)式求得D的古典解,結(jié)果如下: 圖10.2大體反映了這六門課程的基本結(jié)構(gòu),從圖中可以直觀的看出,算術(shù)、代數(shù)、幾何較為相近,英語和蓋爾語較為相近,而歷史課程與其他課程的差異性較大。,圖10.2 六門課程的古典解感知圖,四、非度量MDS的古典解 (nonmetric MDS),在實(shí)際問題中,我們涉及更多的是不易量化的相似性測度,如兩種顏色的相似性,雖然我們可以用1表示顏色非常相似,10表示顏色非常不相似,但是這里的數(shù)字只表示顏色之間的相似或不相似程度,并不表示實(shí)際的數(shù)值大小,因而是定序尺度,這時(shí)是由兩兩顏色間的不相似數(shù)據(jù) ij形成“距離”矩陣。對于非度量的不相似性矩陣,我們?nèi)绾芜M(jìn)行多維標(biāo)度分析呢?假定有一個(gè)n個(gè)對象的不相似矩陣( ij)n n ,要尋找n個(gè)對象的一個(gè)r維擬合構(gòu)造點(diǎn)X。下面介紹Kruskal的非度量MDS分析方法。 為了尋找一個(gè)較好的擬合構(gòu)造點(diǎn),我們可以從某一個(gè)擬合構(gòu)造點(diǎn)開始,即先將n個(gè)對象隨意放置在r維空間,形成一個(gè)感知圖,用Xi =(Xi 1,Xi 2,Xir) 表示i對象在r維空間的坐標(biāo),對象i與j在r維空間的距離為 :,也就是說,S應(yīng)力是將(10.9)式中的dij和 用它們的平方代 表后所得到的量度。S應(yīng)力的值介于0和1之間。典型的情況是:此值小于0.1意味著感知圖是n個(gè)對象的一個(gè)好的幾何表示。 在非度量MDS分析過程中,另一個(gè)需要解決的問題是感知圖 空間維數(shù)r的確定。我們可以制作應(yīng)力-r圖確定感知圖的維數(shù) r 。從前述可知,對每一個(gè)r ,可以找到使應(yīng)力達(dá)到最小的點(diǎn) 結(jié)構(gòu)。隨著r的增加,最小應(yīng)力將在運(yùn)算誤差的范圍內(nèi)逐漸下 降,且當(dāng)r =n-1時(shí)達(dá)到零。從r 1開始,可將應(yīng)力S( r )對 r作圖。這些點(diǎn)隨r的增加而呈下降排列。若找到一個(gè)r ,上述 下降趨勢到這一點(diǎn)開始接近水平狀態(tài),即形成一個(gè)“肘”形曲 線,這個(gè)r便是“最佳”維數(shù)。 非度量MDS雖然是基于非度量尺度數(shù)據(jù)的分析方法,但是,當(dāng)定量尺度的距離陣中的數(shù)據(jù)不可靠,而距離大小的順序可靠時(shí),采用非度量MDS比度量MDS得到的結(jié)果更接近與實(shí)際。,第三節(jié) 權(quán)重多維標(biāo)度(WMDS),以上我們的討論都是以單個(gè)“距離”陣數(shù)據(jù)出發(fā)進(jìn)行的,但在實(shí)踐中,往往需要確定多個(gè)距離陣數(shù)據(jù)的感知圖,比如由10個(gè)人分別對5種飲料進(jìn)行兩兩相似評測,結(jié)果就會得到10個(gè)相似性矩陣,那么,我們?nèi)绾胃鶕?jù)這10個(gè)人的評測結(jié)構(gòu)得出5種飲料的相似性感知圖呢?顯然,按照古典多維的方法,我們只能是每一個(gè)相似性矩陣確定一個(gè)感知圖,10個(gè)人分別確定10個(gè)感知圖。但是,往往我們想要得到的是這10個(gè)人共同的一個(gè)感知圖而非10個(gè)。這一節(jié)將介紹由Carroll和Chang提出的解決這類問題的多維標(biāo)度方法權(quán)重多維標(biāo)度法(WMDS)?;A(chǔ)權(quán)重多維標(biāo)度法也稱權(quán)重個(gè)體差異歐氏距離模型。,第四節(jié) 實(shí)例分析與計(jì)算實(shí)現(xiàn),一 多維標(biāo)度法在SPSS中的實(shí)現(xiàn),二 利用SPSS對本章美國十城市的例子 進(jìn)行多維標(biāo)度,一、多維標(biāo)度法在SPSS中的實(shí)現(xiàn) 實(shí)例1,以SPSS自帶文件World95.sav為例,對亞洲國家和地區(qū)的17個(gè)國家的人口壽命情況進(jìn)行分析。 (一)操作步驟: 1. 在DataSelect case對話框的If過濾條件中輸入過濾條件 “region=3”。得到17個(gè)國家和地區(qū)。 2. 主菜單中選擇AnalyzeScaleMultidimensional Scaling (ALSCAL) 。就進(jìn)入多維標(biāo)度法的主對話框(圖10.3)。在左上方是變量列表選擇以下變量:urban(城市人口比例),lifeexpf(女性平均壽命),lifeexpm(男性平均壽命),gdp_cap(人均GDP),death_rt(千人死亡率),birth_rt(千人出生率),literacy(受教育人口比例)。由于原始數(shù)據(jù)不是距離陣,因此需要在下方Distances單選項(xiàng)中選擇Create distances from data,這時(shí)Measure子對話框被激活,默認(rèn)計(jì)算Euclidean distance,即歐氏距離。,圖10.3 多維標(biāo)度法的主對話框,3. 點(diǎn)擊進(jìn)入Measure子對話框,對距離陣進(jìn)行設(shè)定,(圖10.4)。由于我們的變量都是連續(xù)數(shù)值型的,所以應(yīng)在Measure單選項(xiàng)中選擇Interval。并在其下方的Transform Values欄中選擇變量標(biāo)準(zhǔn)化變換的方式,這里我們選擇Z scores和By variable,表示對變量進(jìn)行正態(tài)標(biāo)準(zhǔn)化。然后在Create Distance Matrix單選項(xiàng)中選擇Between cases,表示計(jì)算樣品之間的距離陣。設(shè)置完畢后,點(diǎn)擊Continue回到主對話框。,圖10.4 Measure子對話框,4. 在主對話框中點(diǎn)擊進(jìn)入Model子對話框,如圖10.5。這里可以設(shè)定變量取值的類型。在Level of Measurement中選擇Interval,即連續(xù)取值的數(shù)值型變量。其他設(shè)置無需改變,點(diǎn)擊Continue返回主對話框。,圖10.5 Model子對話框,5. 點(diǎn)擊進(jìn)入Options子對話框(圖10.6),該對話框中提供了一些結(jié)果顯示的選擇。Display欄中默認(rèn)不輸出任何圖表。選擇Group plots項(xiàng)可得到多維標(biāo)度圖,這里圖表的維度由Model中的Dimensions中填入最小維度Minimum和最大維度Maximum決定;擇選Data matrix項(xiàng)可得到距離陣和擬合構(gòu)造點(diǎn)的坐標(biāo);而Model and options summary是顯示出多維標(biāo)度法中的參數(shù)設(shè)置,計(jì)算方法等。這里我們選擇Group plots和Data matrix項(xiàng)后,點(diǎn)擊Continue返回主對話框,再點(diǎn)擊OK運(yùn)行。,圖10.6 Options子對話框,(二)結(jié)果分析: 1. 樣品驗(yàn)證表,發(fā)現(xiàn)有一個(gè)樣品存在缺失值。查原始數(shù)據(jù)后發(fā)現(xiàn)Taiwan缺少千人死亡率,該樣品被去除。國家地區(qū)的編號如下(表10.6)。,表10.6 國家和地區(qū)的編號,2. SPSS會依次輸出原始距離陣(表10.7),古典解的迭代過程和有關(guān)壓力指標(biāo)值(表10.8),擬合構(gòu)造點(diǎn)在二維空間中的坐標(biāo)(表10.9),以及最優(yōu)標(biāo)度的距離陣(表10.10)。在表3中,Young氏壓力指標(biāo)值為0.02289,K壓力指標(biāo)為0.03880,都小于0.05。RSQ=0.99485。這些都說明模型擬合效果很好。,表10.7 原始距離陣(部分),表10.8 壓力指標(biāo)檢驗(yàn),表10.9 擬合點(diǎn)的在2維標(biāo)度中的坐標(biāo)(部分),3. 接下來是歐氏距離下的16個(gè)國家和地區(qū)的擬合構(gòu)造點(diǎn)的二維圖(圖10.7),從圖上可以看出比較發(fā)達(dá)的地區(qū)基本都在第三個(gè)象限,如香港,日本,新加坡。而中國和泰國,菲律賓等國較為接近。而線性擬合散點(diǎn)圖(圖10.8)從圖形上告訴我們采用歐氏距離來擬合原始數(shù)據(jù)的距離陣是非常合適的。,表10.10 最優(yōu)標(biāo)度的距離陣(部分),圖10.7 擬合構(gòu)造點(diǎn)的二維坐標(biāo)圖,圖10.8 歐氏距離下的線性擬合散點(diǎn)圖,二、利用SPSS對本章美國十城市的例子進(jìn)行多維標(biāo)度,(一)操作步驟: 1. 打開文件之后,在主對話框的distances單選項(xiàng)中選擇Data are distances,此時(shí)shape對話框被激活(圖10.9),默認(rèn)距離形式為Square symmetric。 若原始數(shù)據(jù)的距離是對稱的,則只需要輸入三角陣即可,運(yùn)算中SPSS會自動(dòng)填充,如本例;Square asymmetric表示不對稱的距離陣;而Rectangular表示距離陣不是方陣,這時(shí)需要指定矩陣使用的行數(shù)Number of rows,該數(shù)值必需大于等于4。本例中選擇Square symmetric,點(diǎn)擊Continue返回主對話框。,圖10.9 shape子對話框,2. 在Options子對話框中選中Group plots,點(diǎn)擊Continue返回,再點(diǎn)擊OK運(yùn)行。 (二)結(jié)果分析: 1. 首先觀察壓力指標(biāo)(表10.11),Young氏指標(biāo)值為0.00291,K氏指標(biāo)值為0.00272,RSQ=0.99996,說明歐氏距離模型擬合效果很好。,表10.11 壓力指標(biāo)檢驗(yàn),2. 擬合點(diǎn)的坐標(biāo)(表10.12),二維坐標(biāo)圖(圖10.10)以及線性擬合散點(diǎn)圖(圖10.11)。從圖10.11可以看出采用歐氏距離的擬合標(biāo)度非常符合原始距離陣。各個(gè)城市之間的距離可以非常好地用圖10.10中的散點(diǎn)來表示。,圖10.10 歐氏距離模型下的二維散點(diǎn)圖,表10.12 擬合點(diǎn)坐標(biāo),圖10.11 擬合散點(diǎn)圖,本章結(jié)束,

注意事項(xiàng)

本文(廈門大學(xué)《應(yīng)用多元統(tǒng)計(jì)分析》第10章多維標(biāo)度法)為本站會員(san****019)主動(dòng)上傳,裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng)(點(diǎn)擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因?yàn)榫W(wǎng)速或其他原因下載失敗請重新下載,重復(fù)下載不扣分。




關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!