《(福建專版)2019高考數(shù)學一輪復習 10.4 變量間的相關關系、統(tǒng)計案例課件 文.ppt》由會員分享,可在線閱讀,更多相關《(福建專版)2019高考數(shù)學一輪復習 10.4 變量間的相關關系、統(tǒng)計案例課件 文.ppt(37頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、10.4變量間的相關關系、統(tǒng)計案例,知識梳理,考點自測,1.變量間的相關關系 (1)定義:當自變量取值一定時,因變量的取值帶有一定隨機性的兩個變量之間的關系叫做相關關系.與函數(shù)關系不同,相關關系是一種. (2)散點圖:表示具有相關關系的兩個變量的一組數(shù)據(jù)的圖形叫做散點圖,它可直觀地判斷兩個變量的關系是否可以用線性關系表示.若這些散點分布在從左下角到右上角的區(qū)域,則稱兩個變量;若這些散點分布在從左上角到右下角的區(qū)域,則稱兩個變量. (3)線性相關關系、回歸直線:如果散點圖中點的分布從整體上看大致在,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線.,非確定性關系,正相關,負相關,一條直線
2、附近,知識梳理,考點自測,(4)非線性相關:若散點圖上所有點看上去都在附近波動,則稱此相關為非線性相關.此時,可以用 來擬合. (5)不相關:如果所有的點在散點圖中,那么稱變量間是不相關的.,某條曲線,一條曲線,沒有顯示任何關系,知識梳理,考點自測,2.兩個變量的線性相關 (1)從散點圖上看,如果這些點從整體上看大致分布在通過散點圖中心的一條直線附近,稱兩個變量之間具有,這條直線叫做.,線性相關關系,回歸直線,知識梳理,考點自測,當r0時,表明兩個變量正相關; 當r<0時,表明兩個變量負相關. r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0時,表明兩個變量之間幾乎不存
3、在線性相關關系.通常當|r|大于0.75時,認為兩個變量有很強的線性相關性.,知識梳理,考點自測,知識梳理,考點自測,3.獨立性檢驗 (1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這類變量稱為分類變量. (2)22列聯(lián)表:假設有兩個分類變量X和Y,它們的值域分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱22列聯(lián)表)為:,(3)用K2的大小可以決定是否拒絕原來的統(tǒng)計假設H0,若K2值較大,就拒絕H0,即拒絕事件A與B無關.,知識梳理,考點自測,1.判斷下列結論是否正確,正確的畫“”,錯誤的畫“”. (1)相關關系與函數(shù)關系都是一種確定性的關系,也是一種因果關系. () (2)利用
4、散點圖可以直觀判斷兩個變量的關系是否可以用線性關系表示. () (3)只有兩個變量有相關關系,所得到的回歸模型才有預測價值. () (4)事件X,Y關系越密切,則由觀測數(shù)據(jù)計算得到的K2的觀測值越大. () (5)通過回歸方程 可以估計和觀測變量的取值和變化趨勢. (),,,,,,知識梳理,考點自測,A,知識梳理,考點自測,3.(2017遼寧葫蘆島一模,文8)廣告投入對商品的銷售額有較大影響.某電商對連續(xù)5個年度的廣告費和銷售額進行統(tǒng)計,得到統(tǒng)計數(shù)據(jù)如下表(單位:萬元):,A.101.2萬元B.108.8萬元C.111.2萬元D.118.2萬元,C,知識梳理,考點自測,4.在一次對性別
5、與說謊是否相關的調(diào)查中,得到如下數(shù)據(jù):,根據(jù)表中數(shù)據(jù),得到如下結論正確的一項是() A.在此次調(diào)查中有95%的把握認為是否說謊與性別有關 B.在此次調(diào)查中有99%的把握認為是否說謊與性別有關 C.在此次調(diào)查中有99.5%的把握認為是否說謊與性別有關 D.在此次調(diào)查中沒有充分的證據(jù)顯示說謊與性別有關,D,知識梳理,考點自測,,考點一,考點二,考點三,相關關系的判斷 例1(1)(2017河南洛陽模擬)為研究語文成績和英語成績之間是否具有線性相關關系,統(tǒng)計某班學生的兩科成績得到如圖所示的散點圖(x軸、y軸的單位長度相同),用回歸直線方程 近似地刻畫其相關關系,根據(jù)圖形,以下結論最有可能成立的是(
6、),A.線性相關關系較強,b的值為1.25 B.線性相關關系較強,b的值為0.83 C.線性相關關系較強,b的值為-0.87 D.線性相關關系較弱,無研究價值,B,考點一,考點二,考點三,(2)甲、乙、丙、丁四名同學各自對A,B兩個變量的線性相關性做試驗,并用回歸分析方法分別求得相關系數(shù)r與殘差平方和m如下表:,則哪名同學的試驗結果體現(xiàn)A,B兩個變量有更強的線性相關性() A.甲B.乙 C.丙D.丁,D,考點一,考點二,考點三,解析: (1)由散點圖可以看出兩個變量所構成的點在一條直線附近,所以線性相關關系較強,且應為正相關,所以回歸直線方程的斜率應為正數(shù),且從散點圖觀察,回歸直線方程的斜率應
7、該比y=x的斜率要小一些,綜上可知應選B. (2)在驗證兩個變量之間的線性相關關系時,相關系數(shù)的絕對值越接近1,相關性越強,在四個選項中只有丁的相關系數(shù)最大;殘差平方和越小,相關性越強,只有丁的殘差平方和最小,綜上可知丁的試驗結果體現(xiàn)了A,B兩個變量有更強的線性相關性,故選D.,考點一,考點二,考點三,思考如何判斷兩個變量有無相關關系? 解題心得判斷兩個變量有無相關關系有兩個方法:一是根據(jù)散點圖,具有很強的直觀性,直接得出兩個變量是正相關或負相關;二是計算相關系數(shù)法,這種方法能比較準確地反映相關程度,相關系數(shù)的絕對值越接近1,相關性就越強,相關系數(shù)就是描述相關性強弱的.,考點一,考點二,考點三
8、,對點訓練1(1)對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關于其相關系數(shù)的比較,正確的是(),A.r2
9、五名學生的數(shù)學、物理成績(單位:分)如下表所示:,(1)要從5名學生中選2人參加一項活動,求選中的學生中至少有一人的物理成績高于90分的概率; (2)根據(jù)上表數(shù)據(jù),作出散點圖,并求變量y與x的相關系數(shù)說明物理成績y與數(shù)學成績x之間線性相關關系的強弱.如果具有較強的線性相關關系,求y與x的線性回歸方程(系數(shù)精確到0.01);如果不具有線性相關關系,請說明理由.,考點一,考點二,考點三,考點一,考點二,考點三,考點一,考點二,考點三,考點一,考點二,考點三,思考對已知的兩個變量的一組數(shù)據(jù)如何做回歸分析? 解題心得1.在分析兩個變量的相關關系時,可根據(jù)樣本數(shù)據(jù)作出散點圖來確定兩個變量之間是否具有相關
10、關系;若具有線性相關關系,則可通過線性回歸方程來估計和預測.,考點一,考點二,考點三,對點訓練2(2017四川成都診斷)PM2.5是指空氣中直徑小于或等于2.5微米的顆粒物(也稱可入肺顆粒物),為了探究車流量與PM2.5的濃度是否相關,現(xiàn)采集到某城市周一至周五某時間段車流量與PM2.5濃度的數(shù)據(jù)如下表:,(1)根據(jù)上表數(shù)據(jù),用最小二乘法求出y與x的線性回歸方程; (2)若周六同一時段車流量是200萬輛,試根據(jù)(1)求出的線性回歸方程,預測此時PM2.5的濃度為多少.,考點一,考點二,考點三,考點一,考點二,考點三,考點一,考點二,考點三,獨立性檢驗 例3(2017福建廈門一模,文18)為了響應
11、廈門市政府“低碳生活,綠色出行”的號召,思明區(qū)委文明辦率先全市發(fā)起“少開一天車,呵護廈門藍”綠色出行活動.“從今天開始,從我做起,力爭每周至少一天不開車,上下班或公務活動帶頭選擇步行、騎車或乘坐公交車,鼓勵拼車”鏗鏘有力的話語,傳遞了綠色出行、低碳生活的理念. 某機構隨機調(diào)查了本市部分成年市民某月騎車次數(shù),統(tǒng)計如下:,考點一,考點二,考點三,若規(guī)定:18歲至44歲為青年人,45歲至59歲為中年人,60歲及以上為老年人.用樣本估計總體的思想,解決如下問題: (1)估計本市一個18歲以上青年人每月騎車的平均次數(shù); (2)若月騎車次數(shù)不少于30次者稱為“騎行愛好者”,根據(jù)這些數(shù)據(jù),能否在犯錯誤的概率
12、不超過0.001的前提下認為“騎行愛好者”與“青年人”有關?,考點一,考點二,考點三,解 (1)估計本市一個18歲以上青年人每月騎車的平均次數(shù)為(205+4015+4025+20035+20045+30055)(20+40+40+200+200+300)=42.75. (2)22列聯(lián)表如下:,故能在犯錯誤的概率不超過0.001的前提下認為“騎行愛好者”與“青年人”有關.,考點一,考點二,考點三,思考獨立性檢驗得出的結論是什么?它對我們?nèi)粘I钣惺裁磶椭? 解題心得獨立性檢驗就是考察兩個分類變量是否有關系,利用獨立性檢驗,能夠幫助我們對日常生活中的實際問題作出合理的推斷和預測,并能較為準確地給出
13、這種判斷的可信度;具體做法是根據(jù)公式 ,計算隨機變量的觀測值k,k值越大,說明“兩個變量有關系”的可能性越大.,考點一,考點二,考點三,對點訓練3(2017廣東、江西、福建十校聯(lián)考,文18)某校衛(wèi)生所成立了調(diào)查小組,調(diào)查“按時刷牙與不患齲齒的關系”,對該校某年級800名學生進行檢查,按患齲齒和不患齲齒分類,得匯總數(shù)據(jù):按時刷牙且不患齲齒的學生有160名,不按時刷牙但不患齲齒的學生有100名,按時刷牙但患齲齒的學生有240名. (1)該校4名校衛(wèi)生所工作人員甲、乙、丙、丁被隨機分成兩組,每組2人,一組負責數(shù)據(jù)收集,另一組負責數(shù)據(jù)處理,求工作人員甲、乙分到同一組的概率. (2)
14、是否有99.9%的把握認為該年級學生按時刷牙與不患齲齒有關系?,考點一,考點二,考點三,解 (1)4人分組的所有情況如下表.,因此4人分組的情況共有6種,其中工作人員甲乙分到同一組有2種, 所以工作人員甲、乙分到同一組的概率是,考點一,考點二,考點三,(2)根據(jù)題意,列22聯(lián)表如下.,所以有99.9%的把握認為該年級學生按時刷牙與不患齲齒有關系.,考點一,考點二,考點三,2.回歸分析是處理變量相關關系的一種數(shù)學方法.主要解決:(1)確定特定量之間是否有相關關系,如果有,就找出它們之間貼近的數(shù)學表達式;(2)根據(jù)一組觀測值,預測變量的取值及判斷變量取值的變化趨勢;(3)求出線性回歸方程. 3.根
15、據(jù)K2的值可以判斷兩個分類變量有關的可信程度,并用來指導科研和實際生活.,考點一,考點二,考點三,1.相關關系與函數(shù)關系的區(qū)別 相關關系與函數(shù)關系不同,函數(shù)關系中的兩個變量之間是一種確定性關系.例如正方形面積S與邊長x之間的關系S=x2就是函數(shù)關系.相關關系是一種非確定性關系,即相關關系是非隨機變量與隨機變量之間的關系.例如商品的銷售額與廣告費之間的關系是相關關系.兩個變量具有相關關系是回歸分析的前提. 2.回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性分布時,求出的線性回歸方程才有實際意義,否則,求出的線性回歸方程毫無意義.根據(jù)回歸方程進行預報,僅是一個預報值,而不是真實發(fā)生的值.,