《萬變不離其宗五【選修1-11-24-5】:專題五 統(tǒng)計(jì)案例 Word版含解析》由會(huì)員分享,可在線閱讀,更多相關(guān)《萬變不離其宗五【選修1-11-24-5】:專題五 統(tǒng)計(jì)案例 Word版含解析(5頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、
一、題之源:課本基礎(chǔ)知識(shí)
1.變量間的相關(guān)關(guān)系
(1)常見的兩變量之間的關(guān)系有兩類:一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系;與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系.
(2)從散點(diǎn)圖上看,點(diǎn)分布在從左下角到右上角的區(qū)域內(nèi),兩個(gè)變量的這種相關(guān)關(guān)系稱為正相關(guān),點(diǎn)分布在左上角到右下角的區(qū)域內(nèi),兩個(gè)變量的相關(guān)關(guān)系為負(fù)相關(guān).
2.兩個(gè)變量的線性相關(guān)
(1)從散點(diǎn)圖上看,如果這些點(diǎn)從整體上看大致分布在通過散點(diǎn)圖中心的一條直線附近,稱兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫回歸直線.
(2)回歸方程為=x+,其中=,=-.
(3)通過求Q= (yi-bxi-a)2的最小值而得出回歸直線的方法,
2、即求回歸直線,使得樣本數(shù)據(jù)的點(diǎn)到它的距離的平方和最小,這一方法叫做最小二乘法.
(4)相關(guān)系數(shù):
當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān);
當(dāng)r<0時(shí),表明兩個(gè)變量負(fù)相關(guān).
r的絕對(duì)值越接近于1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng).r的絕對(duì)值越接近于0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系,通常|r|大于0.75時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)性.
3.獨(dú)立性檢驗(yàn)
假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為:
y1
y2
總計(jì)
x1
a
b
a+b
x2
c
d
c+d
總計(jì)
a+c
b+d
3、a+b+c+d
K2=(其中n=a+b+c+d為樣本容量).
二、題之本:思想方法技巧
1.在研究兩個(gè)變量之間是否存在某種關(guān)系時(shí),必須從散點(diǎn)圖入手.對(duì)于散點(diǎn)圖,可以做出如下判斷:
(1)如果所有的樣本點(diǎn)都落在某一函數(shù)曲線上,就用該函數(shù)來描述變量之間的關(guān)系,即變量之間具有函數(shù)關(guān)系.
(2)如果所有的樣本點(diǎn)都落在某一函數(shù)曲線附近,變量之間就有相關(guān)關(guān)系.
(3)如果所有的樣本點(diǎn)都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系.
2.分析兩個(gè)變量相關(guān)關(guān)系的常用方法:
(1)利用散點(diǎn)圖進(jìn)行判斷;
(2)利用相關(guān)系數(shù)r進(jìn)行判斷.
3.
(1)回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)
4、分析的方法,只有在散點(diǎn)圖大致呈線性時(shí),求出的回歸直線方程才有實(shí)際意義,否則無意義.
(2)根據(jù)回歸方程進(jìn)行的估計(jì)僅是一個(gè)預(yù)測值,而不是真實(shí)發(fā)生的值.
(3)用最小二乘法求回歸方程,關(guān)鍵在于正確求出系數(shù),,由于,的計(jì)算量較大,計(jì)算時(shí)應(yīng)仔細(xì)小心.
4.線性回歸分析的方法、步驟
(1)畫出兩個(gè)變量的散點(diǎn)圖;
(2)求相關(guān)系數(shù)r,并確定兩個(gè)變量的相關(guān)程度的高低;
(3)用最小二乘法求回歸直線方程=x+,
(4)利用回歸直線方程進(jìn)行預(yù)報(bào).
注:①對(duì)于非線性(可線性化)的回歸分析,一般是利用條件及我們熟識(shí)的函數(shù)模型,將題目中的非線性關(guān)系轉(zhuǎn)化為線性關(guān)系進(jìn)行分析,最后還原.②利用相關(guān)指數(shù)R
5、2=1-刻畫回歸效果時(shí),R2越大,意味著殘差平方和越小,模型的擬合效果越好.
5.獨(dú)立性檢驗(yàn)的一般步驟
(1)假設(shè)兩個(gè)分類變量x與y沒有關(guān)系;
(2)計(jì)算出K2的觀測值,其中
K2=;
(3)把K2的值與臨界值比較,作出合理的判斷.
6.獨(dú)立性檢驗(yàn)的注意事項(xiàng)
(1)在列聯(lián)表中注意事件的對(duì)應(yīng)及相關(guān)值的確定,不可混淆.
(2)在實(shí)際問題中,獨(dú)立性檢驗(yàn)的結(jié)論僅是一種數(shù)學(xué)關(guān)系表述,得到的結(jié)論有一定的概率出錯(cuò).
(3)對(duì)判斷結(jié)果進(jìn)行描述時(shí),注意對(duì)象的選取要準(zhǔn)確無誤,應(yīng)是對(duì)假設(shè)結(jié)論進(jìn)行的含概率的判斷,而非其他.
三、題之變:課本典例改編
1.原題(選修1-2第6頁例2)一只紅鈴
6、蟲的產(chǎn)卵數(shù) 和溫度 有關(guān),現(xiàn)收集了 7 組觀測數(shù)據(jù)列于表中,試建立 與 之間的回歸方程。
溫度
21
23
25
27
29
32
35
產(chǎn)卵數(shù)個(gè)
7
11
21
24
66
115
325
改編 為了對(duì)2006年佛山市中考成績進(jìn)行分析,在60分以上的全體同學(xué)中隨機(jī)抽出8位,他們的數(shù)學(xué)(已折算為百分制)、物理、化學(xué)分?jǐn)?shù)對(duì)應(yīng)如下表,
學(xué)生編號(hào)
1
2
3
4
5
6
7
8
數(shù)學(xué)分?jǐn)?shù)x
60
65
70
75
80
85
90
95
物理分?jǐn)?shù)y
72
77
80
84
88
90
93
95
7、
化學(xué)分?jǐn)?shù)z
67
72
76
80
84
87
90
92
(1) 若規(guī)定85分(包括85分)以上為優(yōu)秀,求這8位同學(xué)中數(shù)學(xué)和物理分?jǐn)?shù)均為優(yōu)秀的概率;
(2) 用變量y與x、z與x的相關(guān)系數(shù)說明物理與數(shù)學(xué)、化學(xué)與數(shù)學(xué)的相關(guān)程度;
(3) 求y與x、z與x的線性回歸方程(系數(shù)精確到0.01),并用相關(guān)指數(shù)比較所求回歸模型的效果.
參考數(shù)據(jù):,,,,,,,,,,.
【解析】(1) 由表中可以看出,所選出的8位同學(xué)中,數(shù)學(xué)和物理分?jǐn)?shù)均為優(yōu)秀的人數(shù)是3人,其概率是.
(2) 變量y與x、z與x的相關(guān)系數(shù)分別是
、.
可以看出,物理與數(shù)學(xué)、化學(xué)與數(shù)學(xué)的成績都是高
8、度正相關(guān).
(3) 設(shè)y與x、z與x的線性回歸方程分別是、.
根據(jù)所給的數(shù)據(jù),可以計(jì)算出,
.
所以y與x和z與x的回歸方程分別是、.
又y與x、z與x的相關(guān)指數(shù)是、.
故回歸模型比回歸模型的擬合的效果好.
2.原題(選修1-2第19頁復(fù)習(xí)參考題A組第2題)改編 甲乙兩個(gè)學(xué)校高三年級(jí)分別有1100人,1000人,為了了解兩個(gè)學(xué)校全體高三年級(jí)學(xué)生在該地區(qū)二模考試的數(shù)學(xué)成績情況,采用分層抽樣方法從兩個(gè)學(xué)校一共抽取了 105名學(xué)生的數(shù)學(xué)成績,并作出了如下的頻數(shù)分布統(tǒng)計(jì)表,規(guī)定考試成績?cè)趦?nèi)為優(yōu)秀,甲校:
乙校:
(I )計(jì)算的值;
(II)由以上統(tǒng)計(jì)數(shù)據(jù)填寫右面列聯(lián)表,若按是否優(yōu)秀來判斷,是否有97.5% 的把握認(rèn)為兩個(gè)學(xué)校的數(shù)學(xué)成績有差異.
附:
【解析】 (I )
(II),故有
97.5% 的把握認(rèn)為兩個(gè)學(xué)校的數(shù)學(xué)成績有差異.