歡迎來到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁 裝配圖網(wǎng) > 資源分類 > PPT文檔下載  

廈門大學《應用多元統(tǒng)計分析》第08章-相應分析

  • 資源ID:22823816       資源大?。?span id="hmnbpsk" class="font-tahoma">1.82MB        全文頁數(shù):58頁
  • 資源格式: PPT        下載積分:14.9積分
快捷下載 游客一鍵下載
會員登錄下載
微信登錄下載
三方登錄下載: 微信開放平臺登錄 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要14.9積分
郵箱/手機:
溫馨提示:
用戶名和密碼都是您填寫的郵箱或者手機號,方便查詢和重復下載(系統(tǒng)自動生成)
支付方式: 支付寶    微信支付   
驗證碼:   換一換

 
賬號:
密碼:
驗證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網(wǎng)頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無水印,預覽文檔經(jīng)過壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標題沒有明確說明有答案則都視為沒有答案,請知曉。

廈門大學《應用多元統(tǒng)計分析》第08章-相應分析

第八章 相應分析 第一節(jié) 引 言 第二節(jié) 列聯(lián)表 第三節(jié) 相應分析的基本理論 第四節(jié) 相應分析中應注意的問題 第五節(jié) 實例分析與計算機實現(xiàn) 第一節(jié) 引 言 相應分析 (correspondence analysis)也叫對應分析,其特點是 它所研究的變量可以是定性的。通常意義下的相應分析,是 指對兩個定性變量(因素)的多種水平進行相應性研究,因 而它的應用越來越廣泛,現(xiàn)在這種方法已經(jīng)成為常用的多元 分析方法之一。 在社會、經(jīng)濟以及其他領域中,進行數(shù)據(jù)分析時經(jīng)常要處理 因素與因素之間的關系,及因素內(nèi)部各個水平之間的相互關 系。例如,評價某一個行業(yè)所屬企業(yè)的經(jīng)濟效益,我們不僅 要研究因素 A,即企業(yè)按照經(jīng)濟效益好壞的分類情況,以及 要研究因素 B,即經(jīng)濟效益指標之間的關系,還要研究哪些 企業(yè)與哪些經(jīng)濟效益指標更密切一些。這就需要相應分析的 方法,將經(jīng)濟效益指標和企業(yè)狀況放在一起進行分類、作圖, 以便更好的描述兩者之間的關系,在經(jīng)濟意義上做出切合實 際的解釋。 相應分析的思想首先由理查森( Richardson)和庫德 ( Kuder)于 1933年提出,后來法國統(tǒng)計學家讓 -保羅 貝內(nèi) 澤( Jean-Paul Benzcri)等人對該方法進行了詳細的論述 而使其得到了發(fā)展。為了把握相應分析方法的實質(zhì),本章將 從列聯(lián)資料入手,介紹一些基本概念和相應分析的基本理論, 并讓讀者理解相應分析與獨立性檢驗的關系,進一步明確對 實際問題進行相應分析研究的必要性所在。 第二節(jié) 列聯(lián)表 一 列聯(lián)表的概念 二 有關記號 一、列聯(lián)表的概念 在實際中經(jīng)常要了解兩組或多組因素 (或變量 )之間的關系。 設有兩組因素 A和 B,其中因素 A包含 r個水平,即 A1, A2, , Ar;因素 B包含 c個水平,即 B1 , B2 , , Bc 。又 設有受制于這兩個因素的載體 (或客體 )的集合總體 。我們 希望通過對總體 關于這兩組因素的有關資料 (或抽樣資料 ), 來分析這兩組因素的關系。 例如,要考查在某個人群中關于吸煙或不吸煙 (因素 A)與得 肺癌或不得肺癌 (因素 B)兩組因素之間的關系。通常的作法 是,隨機地從該人群中抽樣,對這兩種因素進行調(diào)查,設調(diào) 查了 k個人,得到一個二維列聯(lián)表,見表 8.1。 其中, kij為調(diào)查的 k人中出現(xiàn)因素 A的第 i個水平和因素 B的第 j個水平的人數(shù)。這樣,我們就得到一個兩因素,即吸煙與 是否得肺癌的 2 2列聯(lián)表。 因素 B 因素 A 得肺癌( 1B ) 不得肺癌( 2B ) 吸煙( 1A ) 11k 12k 1.k 不吸煙( 2A ) 21k 22k 2.k .1k .2k . ijk k k 表 8.1 二維列聯(lián)表 一般地,設受制于某個載體總體的兩個因素為 A 和 B ,其中 因素 A 包含 r 個水平,即 12, rA A A ;因素 B 包含 c 個水 平,即 12, cB B B 。對這兩組因素作隨機抽樣調(diào)查,得到 一個 rc 的二維列聯(lián)表,記為 () i j r ck K ,見表 8. 2 。 在表 8. 2 子中, . 1 c i ij j kk 表示因素 A 的第 i 個水平的樣本個 數(shù); . 1 r j i j i kk 表示因素 B 的第 j 個水平的樣本個數(shù); . ijk k k 表 示 總 的 樣 本 個 數(shù) 。 這 樣 我 們 便 稱 () i j r ck K 為一個 rc 的二維列聯(lián)表。 因素 B 1B 2B cB 1A 11k 12k 1 ck 1.k 2A 21k 22k 2 ck 2.k 因 素 A rA 1rk 2rk rck .rk .1k .2k .ck . ijk k k 表 8.2 一般的二維列聯(lián)表 二、有關記號 為了敘述方便,先引進一些基本概念和記號。 設 K=(kij)r c為一個 r c的列聯(lián)表 (表 8.2),稱元素 kij為原始頻 數(shù)。將列聯(lián)表 K轉化為頻率矩陣,記為 F=(fij) r c ,見表 8.3。 因素 B 1B 2B cB 1A 11f 12f 1 cf 1.f 2A 21f 22f 2 cf 2.f 因 素 A rA 1rf 2rf rcf .rf .1f .2f .cf .1 ijff 表 8.3 一般的二維頻率表 表 8 . 3 中 /ij ijf k k 是樣本中屬于因素 A 的第 i 個水平和 因素 B 的第 j 個水平的百分比; . 1 c i i j j ff , . 1 r j ij i ff , 1 , 2 , ,ir , 1 , 2 , ,jc 。這里我們記 1 . 2 . .( , , , )rr f f f f , . 1 . 2 .( , , , )cc f f f f , 1 . 2 . .( , , , ) ( )r r rd i a g f f f d i a gDf , . 1 . 2 .( , , , ) ( )c c cd i a g f f f d i a gDf 那么有, rcf F I , cr f F I ( 8 . 1 ) 1r r c c r c I f I f I F I ( 8 . 2 ) 其中 1( 1 , 1 , , 1 )rr I , 1( 1 , 1 , , 1 )cc I 。 從數(shù)理統(tǒng)計的角度, K 可視為對兩個隨機變量 ( 記為 和 ) 調(diào)查得到的二維列聯(lián)表,頻率矩陣 F 則表示它們相應的經(jīng)驗 聯(lián)合抽樣分布為 , ijP i j f , 1 , 2 , ,ir , 1 , 2 , ,jc 其中 與 分別表示因素 A 和 因素 B 的隨機變量。 1 . 2 . .( , , , )rf f f 和 . 1 . 2 .( , , , )cf f f 分別為二維隨機變量( , )的抽樣邊際分布。在此,我們稱 rD 和 cD 分別為 和 的 邊際陣。那么,有條件概率為 . , | ij i fP i j P j i P i f , 1 , 2 , ,jc 在此稱 12 . . . , , , ic i i ic c i i i f f f f f f fR ( 8 . 3 ) 為因素 A 的第 i 個水平分布輪廓。稱 1 r DF 為因素 A 的輪廓矩 陣 。 這 里 應 該 注 意 到 , i cf , 1 , 2 , ,ir 是 超 平 面 12 1rx x x 的一點集。 同理,因素 B 的第 j 個水平的分布輪廓為 12 . . . , , , j j c jjr r j j j f f f f f f fR ( 8 . 4 ) 并稱 1 c DF 為因素 B 的輪廓矩陣,同樣 j rf , 1 , 2 , ,jc 是 超平面 12 1cy y y 的一點集。這里有 . , | ij j fP i j P i j P j f , 1 , 2 , ,ir 最后,由( 8 . 1 )式和( 8. 2 )式我們應該明確 r r cD I F I , 1r r r r cI D I = I F I = , ( 8. 5 ) c c rD I F I , 1c c c c r I D I I F I , ( 8 . 6 ) 從( 8. 5 )式和( 8. 6 )式我們清楚地看到, rD 和 cD 中的元素 起到了權重的作用,稱其為權重矩陣。 第三節(jié) 相應分析的基本理論 一 原始資料的變換 二 基于矩陣的分析過程 我們知道相應分析的主要目的是尋求列聯(lián)表行因素 A和列因 素 B的基本分析特征和它們的最優(yōu)聯(lián)立表示。為了實現(xiàn)行因 素 A與列因素 B最優(yōu)聯(lián)立表示,進一步剖析行因素 A內(nèi)部之間, 列因素 B內(nèi)部之間,以及因素 A和列因素 B之間的關系,這里 將介紹原始的列聯(lián)資料 K=(kij) r c變換成矩陣 Z=(zij) r c的具 體過程,這樣使得 zij對因素 A和列因素 B具有對等性,在此基 礎上進行相應分析。 一、原始資料的變換 設 () i j r ck K 為一個 rc 的列聯(lián)資料,其轉化后的頻率矩 陣為 () i j r cf F 。我們針對因素 A 而言,由( 8. 3 )式知, 第 i 個水 平分布輪廓 ic c fR 1 , 2 , ,ir 為 超平面 12 1rx x x 的一點集。如果我考慮因素 A 中各水平之 間的遠近,引入歐氏距離,那么第 i 個水平和第 i 個水平之 間的歐氏距離為 2 2 1 . ( , ) c ij i j j ii ff D i i ff ( 8 . 7 ) 這樣定義的距離沒有考慮到因素 B 的各水平邊際概率的 影響,為了消除因素 B 各個水平數(shù)量級的影響,應該對每 一項加一個權數(shù) .1/ jf ,即有 : 2 2 1 . . . 1 ( , ) c ij i j w j i i j ff D i i f f f 2 1 . . . . c i j i j j i j i j ff f f f f ( 8 . 8 ) 我們稱 2 ( , ) wD i i 為因素 A 中第 i 個水平和第 i 個水平之間 2 距離。 這里應該注意到,( 8. 8 )式所定義的距離 2 ( , ) wD i i ,也可以 看作是點集 12 . . 1 . . 2 . . , , , i i i c i i i c f f f f f f f f f 中兩點 i 和 i 之 間的歐氏距離( 1 , 2 , ,ir )。那么,我們從加權的角度考 察這 r 個點的平均水平,其第 j 個分量的平均水平為 . 11 . . . 1 rr ij i ij j ii i j j f f f f f f f , 1 , 2 , ,jc ( 8 . 9 ) 從而,計算出關于因素 B 各水平構成的協(xié)差陣為 ()c i j c ca ( 8 . 10 ) 其中, . . . 1 . . . . r ji i j i j ij ff a f f f f f f f . 1 . . . . r jjii ij f f ff f f f f f f 1 r ij zz 這里 . . . . . . . . . . . . . . . . . . / ( / ) ( / ) ( / ) ( / ) i i i i i ii f f f k x k x k x z f f k x k x . . . . . ( / ) ii i k k k k kk 1 , 2 , , 1 , 2 , ,r i c 令 () ij r cz Z ,則( 8. 10 )式可表示為 c ZZ ( 8. 1 1 ) 類似地,由( 8. 4 )式知,針對因素 B 的第 j 個水平的分布輪廓 j rf r R , 它 是 超 平 面 12 1cy y y 的 一 點 集 , 1 , 2 , ,jc 。同樣,變換以后所得到的關于因素 A 各水平構 成的協(xié)差陣為 r ZZ ( 8 . 12 ) 這里我們需要說明的是,將原始列聯(lián)表設 () i j r ck K 中的數(shù)據(jù) 變換成矩陣 () ij r cz Z 時,則因素 A 和因素 B 各個水平構成 的協(xié)差陣分別為 r ZZ 和 c ZZ ,矩陣 r 和 c 存在簡 單的對等關系,這樣如果把原始列聯(lián)表中的數(shù)據(jù) ijk 變換成 ijz 以后, ijz 對于兩個因素具有對等性。 二、基于矩陣的分析過程 由矩陣的知識我們知道, r ZZ 和 c ZZ 有完全相同 的非零特征根,記為 12 m , 0 m in , m r c , 設 12, , , mu u u 為相對于特征根 12, , , m 的關于因素 B 各水平構成的協(xié)差陣 c 的特征向量,則有 c j j j j u Z Zu u ( 8 . 13 ) 用矩陣 Z 左乘( 8. 13 )式兩端得 ( ) ( )j j j ZZ Zu Zu 即有 ( ) ( )r j j j Zu Zu ( 8 . 14 ) ( 8.14)式表明 Zuj為相對于特征值 j的關于因素 A各水平構 成的協(xié)差陣 r的特征向量。這樣我們就建立了相應分析中 R 型因子分析和 Q型因子分析的關系。也就是說,我們可以從 R型因子分析出發(fā)而直接得到 Q型因子分析的結果。 這里需要強調(diào)的是,由于 r和 c有相同的特征根,而這些特 征根又表示各個公共因子所提供的方差。那么,在因素 B的 c 維空間 Rc中的第一公共因子,第二公共因子直到第 m個公共 因子與因素 A的 r維空間 Rr中相對于的各個主因子在總方差中 所占的百分比就完全相同。這樣就可以用相同的因子軸同時 描述兩個因素各個水平的情況,把兩個因素的各個水平的狀 況同時反映到具有相同坐標軸的因子平面上。一般情形,我 們?nèi)蓚€公共因子,這樣就可以在一張二維平面圖上繪出兩 個因素各個水平的情況,即可以直觀地描述兩個因素 A和因 素 B以及各個水平之間的相關關系。 第四節(jié) 相應分析中應注意的問題 我們知道相應分析是分析兩組或多組變量之間關系的有效方 法,在離散情況下,它是從資料出發(fā)通過建立因素間的二維 或多維列聯(lián)表來對數(shù)據(jù)進行分析。在此我們要問,這種分析 是否有意義,或者說對于所給的數(shù)據(jù)是否值得做這種相應分 析。這一節(jié)我們將介紹相應分析與獨立性檢驗的內(nèi)在關系, 以此說明應用相應分析方法在解決實際問題時,避免盲目性。 設二維列聯(lián)資料為 () i j r ck K (見表 8. 2 ),其頻率陣為 () i j r cf F (見表 8. 3 )。用 .ip 表示因素 A 中第 i 水平發(fā)生 時的概率; . jp 表示因素 B 中第 j 水平發(fā)生時的概率,那么 其估計值分別為 . . i i k f k 和 . . j j k f k 這里我們關心的是因素 A 和因素 B 是否獨立,由此提出要檢 驗的問題是 0H :因素 A 和因素 B 是獨立的 1H :因素 A 和因素 B 不獨立 由上面的假設所構造的統(tǒng)計量為 : 2 2 11 ( ) () rc ij ij ij ij k E k Ek 2 . 11 . / / rc ij i j ij ij k k k k k k k 2 11 () rc ij ij kz ( 8 . 15 ) 其中 . . . .( / ) /ij ij i j i jz k k k k k k ,當假設 0H :因素 A 和因 素 B 是獨立成立時,在 n 足夠大的條件下, 2 服從自由度 為 ( 1 ) ( 1 )rc 的 2 分布。拒絕區(qū)域為 : 22 1 ( 1 ) ( 1 ) rc 通過上面的分析,我們應該注意幾個問題。 第一,這里的 ijz 是原始列聯(lián)資料 () i j r ck K 通過相應變換 以后得到的資料陣 () ij r cz Z 的元素。說明 ijz 與 2 統(tǒng)計量有著內(nèi)在的聯(lián)系。 第二,關于因素 B 和因素 A 各水平構成的協(xié)差陣 c 和 r , 由( 8. 15 )式知, 2( ) ( ) / crtr tr k ,這里 ( . )tr 表示矩陣的跡。 第三,獨立性檢驗只能判斷因素 A 和因素 B 是否獨立。如果 因素 A 和因素 B 獨立,則沒有必要進行相應分析;如 果因素 A 和因素 B 不獨立,可以進一步通過相應分析 考察兩因素各個水平之間的相關關系。 第五節(jié) 實例分析與計算機實現(xiàn) 一 利用 SPSS進行相應分析 實例 1 二 利用 SPSS進行相應分析 實例 2 一、利用 SPSS進行相應分析 實例 1 數(shù)據(jù)來自 SPSS軟件自帶數(shù)據(jù)集 voter.sav,為 1992年美國大選 的部分數(shù)據(jù)。要求對選民的最高學歷水平( degree)和所支 持的總統(tǒng)候選人( pres92)進行相應分析。 (一)操作步驟 1. 正確打開數(shù)據(jù)集 voter.sav后,由 AnalyzeData ReductionCorrespondence Analysis 可進入相應分析的主 對話框(圖 8.1)。 圖 8.1 相應分析主界面 2. 從左側變量列表中選擇兩個變量作為相應分析的兩個維度。 這里我們選擇 pres92作為行維度,點擊 Row左側的三角箭頭 就可以看到在 Row項下出現(xiàn)了 pres92(? ?),這時用鼠標選中 該變量,其下方的 Define Range子對話框激活,點擊后出現(xiàn) 變量水平設置窗口(圖 8.2)。分為上下兩個部分: Category range for row variable: pres92和 Category Constraints。 這里要分析所有的三位總統(tǒng)候選人和選民的學歷水平的關系, 所以在 Minimum value中填入 1,在 Maximum value中填入 3, 之后點擊 Update按鈕。就可以在下方的 Category Constraints 欄中看到,后續(xù)分析中的行變量僅包含 3個類目,分別是 1、 2 和 3。 圖 8.2 Define Row Range子對話框 在右側還有三個單選項: None表示沒有任何約束; Categories must be equal可用于指定某些類目的得分必須相同,最多可以 設置有效類目的個數(shù)減 1個得分相等的類目,如本例中最多可 以設置 2個類目得分相等; Category is supplemental表示某些 類目不參加相應分析但是會在圖形中標示。這里我們不對分類 進行任何約束,點擊 Continue按鈕后回到主對話框。 類似的可以指定 degree的有效類目最小值為 0,最大值為 4。 3.點擊 Model按鈕,指定相應分析結果的維數(shù)。(圖 8.3) ( 1) Dimensions in solution。默認為 2,最大可以設置為各變量 中的最少類目數(shù)減 1。 ( 2)選擇距離測度的方式 Distance Measure。有 Chi square 和 Euclidean兩種,定性變量應該用 Chi square。 ( 3)標準化方法 Standardization Method。 圖 8.3 Model子對話框 ( 4)正態(tài)化方法 Normalization Method。需要比較行列變量的類 目差異時選擇 Symmetrical,需要比較行列變量中任意兩個類目的 差異時選擇 Principal,比較行變量的類目差異時選擇 Row principal,而比較列變量的類目差異時選擇 Column principal,也 可以在 Customize中指定 -1,1之間的任意實數(shù),特別的,如果輸 入 -1則為 Column principal,輸入 1為 Row principal,輸入 0為 Symmetrical。而一般該對話框中的選項無需改動。 4.點擊 Statistics按鈕,設定輸出的相應分析統(tǒng)計量,如圖 8.4。 可以指定輸出相應分析表 Correspondence table,行點總覽 表 Overview of row points,列點總覽表 Overview of column points,行輪廓 Row profiles,列輪廓 Column profiles。默認 只輸出前三項。而 Permutations of the correspondence table 是用于指定前 n個維度的行列得分表。如果該項選中,下方 的 Maximum dimension for permutations被激活,用于指定 維度 n。此外,還可以在 Confidence Statistics for復選項中選 擇計算行點和列點的標準差以及相關系數(shù)。 圖 8.4 Statistics子對話框 5.點擊 Plots按鈕,設定輸出的統(tǒng)計圖,如圖 8.5??梢灾付ㄝ?出相應分析的散點圖 Scatterplots,默認只輸出包含行列變量 的雙變量散點圖 Biplot。也可指定輸出行點圖 Row points和 列點圖 Column points。而 ID label width for Scatterplots是 指定散點標簽的長度,默認 20。下方的 Line plots項中,可 以輸出行 /列點對應于行 /列得分的線圖,和散點圖類似。 6. 我們在 Model, Statistics, Plots三個子對話框中都使用默 認設定,點擊主對話框的 OK按鈕,即得到相應分析的結果。 圖 8.5 Plots子對話框 (二)結果分析: SPSS運行相應分析后會產(chǎn)生以下四張表(表 8.4到表 8.7)。 1. Correspondence Table(相應分析表),如表 8.4,即列聯(lián) 表。 Active Margin為邊際頻數(shù)。大致可以看出 Clinton在各個學歷 層次都有最高的票數(shù)。 C o r r e s p o n d e n c e T a b l e R S H I G H E S T D E G R E E V O T E F O R C L I N T O N , B U S H , P E R O T l t h i g h s c h o o l h i g h s c h o o l ju n i o r c o l l e g e b a c h e l o r g r a d u a te d e g r e e A c ti v e M a r g i n B u s h 55 349 48 146 63 661 P e r o t 12 159 26 62 19 278 C l i n to n 122 436 58 178 111 905 A c ti v e M a r g i n 189 944 132 386 193 1844 表 8.4 列聯(lián)表 2. Summary(總覽表),如表 8.5。 表中從左到右依次是維度編號、奇異值、慣量、卡方統(tǒng)計量、 顯著性、慣量所占總慣量比例、每個維度的奇異值的標準差和 相關系數(shù)。 Singular Value為特征值的平方根,根據(jù)總慣量和 特征值求和相等,有 0.1392+0.0162=0.019+0.000=0.019。第一 個維度慣量 0.019,占總慣量的 98.7%,第二個維度慣量接近 0, 僅占總慣量 1.3%。因此可以認為只要用一個維度就可以解釋 行列變量之間所有的關系,但為了說明分析過程,仍然保留兩 個維度??倯T量 35.867 1844=0.19,滿足總慣量和卡方統(tǒng)計量 的關系式。同時卡方統(tǒng)計量的自由度 8=(3-1) (5-1),數(shù)值為 0.000,說明行列變量之間存在顯著的相關性,相應分析是有 意義的。 S u m m ar y P r op or ti on of I n e r ti a C on fi d e n c e S i n g u l ar V al u e C or r e l at i on D i m e n s i on S i n g u l a r V al u e I n e r ti a C h i S q u ar e S i g. A c c ou n te d for C u mu l ati v e S tan d ar d D e v i ati o n 2 1 .139 .019 .987 .987 .021 .062 2 .016 .000 .013 1.000 .024 T ota l .019 35.867 .000 ( a) 1.000 1.000 * 8 d e gr e e s o f f r e e d om 表 8.5 總覽表 3. Overview Row Points與 Overview Column Points(行 /列點 總覽表),如表 8.6,表 8.7。 現(xiàn)以表 8.6為例, Mass項表示行變量中每個類目的邊際概率。 Score in dimension下面則是行點在兩個維度的坐標( SPSS稱 為得分),即有坐標點 Bush( 0.194,-0.156), Perot ( 0.663,0.198), Clinton( -0.346,0.053)。 Inertia項為慣量, 即每個行點與行重心的加權距離的平方。而行慣量為行點與行 重心的加權距離平方和,即 0.19=0.002+0.009+0.008。比較表 8.6和表 8.7的總慣量,可以發(fā)現(xiàn)行慣量與列慣量相等。 Contribution項有兩個部分,分別是行變量的每個類目對維度 (公共因子)特征值的貢獻,每一個維度對每個類目的特征值 的貢獻。 O ve r vi e w R ow P oi n t s ( a) C on tr i b u ti o n S c or e i n D i m e n s i on O f P oi n t to I n e r ti a o f D i m e n s i on O f D i me n s i on to I n e r ti a o f P oi n t V O TE F O R C L I N TO N , BU S H , P ER O T M as s 1 2 I n e r ti a 1 2 1 2 T ota l Bu s h .358 .194 - .156 .002 .098 .544 .931 .069 1.000 P e r ot .151 .663 .198 .009 .479 .370 .990 .010 1.000 C l i n ton .491 - .346 .053 .008 .423 .086 .997 .003 1.000 A c ti v e T ota l 1.000 .019 1.000 1.000 * S ym m e tr i c a l n or ma l i z at i on 表 8.6 行點總覽表 O ve r vi e w C ol u m n P oi n t s ( a ) C on tr i b u ti o n S c or e i n D i m e n s i on O f P oi n t to I n e r ti a o f D i m e n s i on O f D i me n s i on to I n e r ti a o f P oi n t R S H I G H E S T D E G R EE M as s 1 2 I n e r ti a 1 2 1 2 T ota l l t h i gh s c h oo l .102 - .899 .087 .01 1 .597 .048 .999 .001 1.000 h i gh s c h oo l .512 .173 .014 .002 .1 10 .006 .999 .001 1.000 ju n i or c o l l e g e .072 .357 .352 .001 .066 .554 .899 .101 1.000 b ac h e l or .209 .149 - .168 .001 .034 .370 .871 .129 1.000 gr ad u ate d e gr e e .105 - .506 - .057 .004 .193 .022 .999 .001 1.000 A c ti v e T ota l 1.000 .019 1.000 1.000 * S ym m e tr i c a l n or ma l i z at i on 表 8.7 列點總覽表 4. 相應分析圖,如圖 8.6。 可以發(fā)現(xiàn)研究生層次的選民( Graduate degree)傾向于具有 實干精神的 Clinton,而較 Clinton更為激進的 Bush更受 high school和 Bachelor層次的選民歡迎, Perot僅和 junior college層 次的選民較近。 -1 . 0 -0 . 5 0.0 0.5 D im ens io n 1 -0 . 2 -0 . 1 0.0 0.1 0.2 0.3 0.4 Dimen sio n 2 B u sh P e r o t Clinton lt high school high school j u n i o r co l l e g e bachelor g r a d u a t e d e g r e e R S H I G H E S T D E G R E E V O T E F O R C L I N T O N , B U S H , P E R O T S y m m e t r i c a l N o r m a l i za t i o n R o w a n d C o l u m n P o i n t s 圖8.6 相 應 分 析 的 二 維 圖 5. 如果在 Statistics子對話框中選中了 Row profile和 Column profile, SPSS還會輸出以下兩張表(表 8.8,表 8.9)。 R ow P r of i l e s R S H I G H E S T D E G R E E V O T E F O R C L I N T O N , B U S H , P E R O T l t h i g h s c h o o l h i g h s c h o o l ju n i o r c o l l e g e b a c h e l o r g r a d u a te d e g r e e A c ti v e M a r g i n B u s h .0 8 3 .5 2 8 .0 7 3 .2 2 1 .0 9 5 1 .0 0 0 P e r o t .0 4 3 .5 7 2 .0 9 4 .2 2 3 .0 6 8 1 .0 0 0 C l i n to n .1 3 5 .4 8 2 .0 6 4 .1 9 7 .1 2 3 1 .0 00 M a s s .1 0 2 .5 1 2 .0 7 2 .2 0 9 .1 0 5 表 8.8 行輪廓表 C ol u m n P r of i l e s R S H I G H E S T D E G R E E V O T E F O R C L I N T O N , B U S H , P E R O T l t h i g h s c h o o l h i g h s c h o o l ju n i o r c o l l e g e b a c h e l o r g r a d u a te d e g r e e M a s s B u s h .2 9 1 .3 7 0 .3 6 4 .3 7 8 .3 2 6 .3 5 8 P e r o t .0 6 3 .1 6 8 .1 9 7 .1 6 1 .0 9 8 .1 5 1 C l i n to n .6 4 6 .4 6 2 .4 3 9 .4 6 1 .5 7 5 .4 9 1 A c ti v e M a r g i n 1 .0 0 0 1 .0 0 0 1 .0 0 0 1 .0 0 0 1 .0 0 0 表 8.9 列輪廓表 6. 行 /列點圖(圖 8.7,圖 8.8)。 如果要單獨考察行 /列變量的各個水平在兩個公共因子維度上 的分布情況,可在 Plots子對話框中選中 Row points和 Column points。運行后即得下圖: -0 . 4 -0 . 2 0.0 0.2 0.4 0.6 0.8 D i m en si on 1 -0 . 2 -0 . 1 0.0 0.1 0.2 D im e n s io n 2 B u s h P e r o t C l i n t o n S y m m e t r i c a l N o r m a l i z a t i o n R o w P o i n t s f o r V O T E F O R C L I N T O N , B U S H , P E R O T 圖 8.7 行點在兩個公共因子維度上的分布 -1 .0 -0 .8 -0 .6 -0 .4 -0 .2 0.0 0.2 0.4 D im ensio n 1 -0 .2 -0 .1 0.0 0.1 0.2 0.3 0.4 Dimens ion 2 lt high sc hool hi gh sch oo l ju ni or col le ge bachelor gr ad ua t e de gr ee Sy m m e tr i c a l No r m a l i za ti o n Co l u m n Po i n ts fo r RS HI G HE ST DE G RE E 圖 8.8 列點在兩個公共因子維度上的分布 二 、利用 SPSS進行相應分析 實例 2 滬市 604 家上市公司 2001 年財務報表中有以下十個主要財 務指標。請對因子分析后的因子進行相應分析。 1X :主營業(yè)務收入(元), 2X :主營業(yè)務利潤(元), 3X :利潤總額(元), 4X :凈利潤(元), 5X :每股收益(元), 6X :每股凈資產(chǎn)(元), 7X :凈資產(chǎn)收益率(), 8X :總資產(chǎn)收益率(), 9X :資產(chǎn)總計(元), 10X :股本。下面列舉了 4 只股票的 數(shù)據(jù)。 c od e 600146 900950 600082 600069 X 1 1,531,125, 205 106,581,997 536,170,246 183,099,889 X 2 - 1,992,739 - 6,138,074 22,818,078 1,185,389 X 3 - 121,376,966 - 209,356,318 - 83,143,688 - 228,540,095 X 4 - 121,764,217 - 191,123,71 1 - 83,249,935 - 227,809,996 X 5 - 0.61 - 0 .58 - 0.56 - 0.61 X 6 1.75 1.06 2.17 1.02 X 7 - 34.81 - 54.27 - 25.72 - 60.26 X 8 - 30.04 - 24.92 - 23.72 - 23.71 X 9 405,382,146. 30 767,045,438. 82 350,930,945. 92 960,701,823. 91 X 1 0 200,000,000. 00 331,914,000. 00 148,980,783. 00 371,600,000. 00 表 8.10 4只股票的財務數(shù)據(jù) (一)操作步驟: 1. 首先由 SPSS的因子分析過程(詳細步驟參見因子分析一 章),通過主成分法估計和最大方差旋轉法進行因子旋轉, 發(fā)現(xiàn)需要 3個公共因子才能解釋 83%以上的方差??傻靡蜃?得分的計算公式為(加上 *號的變量和因子表示都已經(jīng)標準 化): * * * * * * * 1 1 2 3 4 5 6 * * * * 7 8 9 1 0 0 . 2 1 7 0 . 2 1 6 0 . 1 4 5 0 . 1 3 8 0 . 0 5 4 0 . 0 3 2 0 . 0 6 6 0 . 0 6 6 0 . 2 5 4 0 . 2 4 6 F X X X X X X X X X X * * * * * * * 2 1 2 3 4 5 6 * * * * 7 8 9 1 0 0 . 1 0 9 0 . 0 4 3 0 . 1 1 6 0 . 1 4 4 0 . 2 3 5 0 . 1 6 5 0 . 3 8 1 0 . 3 7 1 0 . 0 8 6 0 . 0 1 6 F X X X X X X X X X X * * * * * * * 3 1 2 3 4 5 6 * * * * 7 8 9 1 0 0 . 1 0 0 0 . 0 9 8 0 . 0 0 4 0 . 0 3 7 0 . 2 1 6 0 . 8 7 6 0 . 2 2 9 0 . 1 5 7 0 . 0 0 8 0 . 2 5 5 F X X X X X X X X X X 因此 factor1可以稱為股票規(guī)模因子, factor2稱為股票收益因子, factor3稱為個股價值因子。將這三個因子劃分為 5個等級:低 于 -0.5, -0.50, 00.5, 0.51,大于 1,分別編碼為 1,2,3,4,5。 這樣就可以利用相應分析來詳細的研究這三個因子之間的關系。 2. 在相應分析的主對話框中,我們以 factor1和 factor2為例說 明。設置好類目(圖 8.9),在 Model子對話框中仍然選擇維 數(shù) 2,其他設置不變,點擊 OK后,就得到相應分析的結果。 圖 8.9 相應分析主界面 (二)結果分析: 這里僅列出相應分析表(表 8.11)、總覽表(表 8.12)以及 相應分析圖(圖 8.10),其余圖表的分析與前一例題類似。 C or r e s p on d e n c e T ab l e 個股價值因子 股票規(guī)模因子 1 2 3 4 5 A c ti v e M ar gi n 1 55 23 31 17 27 153 2 98 83 53 24 26 284 3 16 14 24 11 16 81 4 10 6 9 7 10 42 5 15 8 7 3 11 44 A c ti v e M ar gi n 194 134 124 62 90 604 表 8.11 列聯(lián)表 S u m m ar y P r op or ti on of I n e r ti a C on fi d e n c e S i n g u l ar V al u e C or r e l at i on D i m e n s i o n S i n g u l ar V al u e I n e r ti a C h i S q u ar e S i g. A c c ou n te d for C u mu l at i v e S tan d ar d D e v i ati o n 2 1 .221 .049 .734 .734 .039 - .018 2 .1 13 .013 .193 .927 .040 3 .058 .00 3 .051 .978 4 .038 .001 .022 1.000 T ota l .066 40.160 .001 ( a) 1.000 1.000 * 16 d e gr e e s of fr e e d om 表 8.12 總覽表 從表 8.12中可以看出,卡方檢驗是顯著相關的,因此相應分 析是有意義的,而且只需要兩個公共因子就可以解釋 92.7% 的總慣量。所以使用二維圖就可以充分的反映行列變量之間 的關系了。在圖 8-10上可以發(fā)現(xiàn),規(guī)模因子為 1和 5,個股價 值因子為 5,這表明“小股票”和“大股票”都可能實現(xiàn)最 高的個股價值,并且“小股票”似乎更有可能。而股票規(guī)模 因子中略高于平均水平的取值為 3,4,這兩個檔次較為接近可 以將其合并為一個檔次,相應的個股價值因子也略高于平均 水平。 讀者應該可以發(fā)現(xiàn)相應分析實際是對兩組高維空間的點的二 維投影進行分析。有時在高維空間中相隔很近的點投影后卻 顯的很遠,因此有時需要進一步分析每個類目對公共因子的 貢獻大小。同時相應分析主要是建立在圖形分析的基礎上, 而沒有給出足夠充分的統(tǒng)計量來度量這種相關程度,因此相 應分析的結果帶有一定的主觀性。 -0.5 0.0 0.5 Di mension 1 -0.7 5 -0.5 0 -0.2 5 0.00 0.25 0.50 0.75 D im ensio n 2 1 2 3 4 5 1 2 3 4 5 個股價值因子 股票規(guī)模因子 Sy mm e tr i c a l No rm a l i za ti on Ro w a nd Co l um n Po i nt s 圖 8.10 二維相應分析圖 本章結束

注意事項

本文(廈門大學《應用多元統(tǒng)計分析》第08章-相應分析)為本站會員(san****019)主動上傳,裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權或隱私,請立即通知裝配圖網(wǎng)(點擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因為網(wǎng)速或其他原因下載失敗請重新下載,重復下載不扣分。




關于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!