《2020版高考數(shù)學(xué)一輪復(fù)習(xí) 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第4節(jié) 變量間的相關(guān)關(guān)系、統(tǒng)計案例教學(xué)案 文(含解析)北師大版》由會員分享,可在線閱讀,更多相關(guān)《2020版高考數(shù)學(xué)一輪復(fù)習(xí) 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第4節(jié) 變量間的相關(guān)關(guān)系、統(tǒng)計案例教學(xué)案 文(含解析)北師大版(12頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第四節(jié)變量間的相關(guān)關(guān)系、統(tǒng)計案例考綱傳真1.會作兩個相關(guān)變量的數(shù)據(jù)的散點圖,會利用散點圖認識變量間的相關(guān)關(guān)系.2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程.3.了解獨立性檢驗的基本思想、方法及其初步應(yīng)用.4.了解回歸分析的基本思想、方法及簡單應(yīng)用1相關(guān)性(1)線性相關(guān)若兩個變量x和y的散點圖中,所有點看上去都在一條直線附近波動,則稱變量間是線性相關(guān)的(2)非線性相關(guān)若所有點看上去都在某條曲線(不是一條直線)附近波動,則稱此相關(guān)為非線性相關(guān)的(3)不相關(guān)如果所有的點在散點圖中沒有顯示任何關(guān)系,則稱變量間是不相關(guān)的2最小二乘估計(1)最小二乘法如果有n個點(x1,y1
2、),(x2,y2),(xn,yn)可以用下面的表達式來刻畫這些點與直線yabx的接近程度:y1(abx1)2y2(abx2)2yn(abxn)2.使得上式達到最小值的直線yabx就是我們所要求的直線,這種方法稱為最小二乘法(2)線性回歸方程方程ybxa是兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)的線性回歸方程,其中a,b是待定參數(shù)3回歸分析(1)定義:對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法(2)樣本點的中心對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)中,(,)稱為樣本點的中心(3)相關(guān)系數(shù)rr;當r0時,稱兩個
3、變量正相關(guān)當r2.706時,有90%的把握判定變量A,B有關(guān)聯(lián);(3)當23.841時,有95%的把握判定變量A,B有關(guān)聯(lián);(4)當26.635時,有99%的把握判定變量A,B有關(guān)聯(lián)1線性回歸方程ybxa一定過樣本點的中心(,)2由回歸直線求出的數(shù)據(jù)是估算值,不是精確值基礎(chǔ)自測1(思考辨析)判斷下列結(jié)論的正誤(正確的打“”,錯誤的打“”)(1)“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的水平成正相關(guān)關(guān)系()(2)某同學(xué)研究賣出的熱飲杯數(shù)y與氣溫x()之間的關(guān)系,得回歸方程y2.352x147.767,則氣溫為2時,一定可賣出143杯熱飲()(3)因為由任何一組觀測值都可以求得一個線性回歸方程
4、,所以沒有必要進行相關(guān)性檢驗()(4)若事件A,B關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的2的值越小()答案(1)(2)(3)(4)2.(教材改編)為調(diào)查中學(xué)生近視情況,測得某校男生150名中有80名近視,在140名女生中有70名近視在檢驗這些學(xué)生眼睛近視是否與性別有關(guān)時,用下列哪種方法最有說服力()A回歸分析B均值與方差C獨立性檢驗D概率C“近視”與“性別”是兩類變量,其是否有關(guān),應(yīng)用獨立性檢驗判斷3(教材改編)已知變量x與y正相關(guān),且由觀測數(shù)據(jù)算得樣本平均數(shù)3,3.5,則由該觀測數(shù)據(jù)算得的線性回歸方程可能是()Ay0.4x2.3By2x2.4Cy2x9.5Dy0.3x4.4A因為變量x和y正相關(guān)
5、,排除選項C,D又樣本中心(3,3.5) 在回歸直線上,排除B,選項A滿足4下面是22列聯(lián)表:則表中a,b的值分別為()y1y2合計x1a2173x2222547合計b46120A94,72B52,50C52,74D74,52Ca2173,a52.又a22b,b74.5某校為了研究學(xué)生的性別和對待某一活動的態(tài)度(支持和不支持兩種態(tài)度)的關(guān)系,運用22列聯(lián)表進行獨立性檢驗,經(jīng)計算27.069,則所得到的統(tǒng)計學(xué)結(jié)論是:有多少的把握認為“學(xué)生性別與支持該活動有關(guān)系”()附:P(2x0)0.1000.0500.0250.0100.001x02.7063.8415.0246.63510.828A0.1%
6、B1% C99%D99.9%C因為7.069與附表中的6.635最接近,所以得到的統(tǒng)計學(xué)結(jié)論是:有10.0100.9999%的把握認為“學(xué)生性別與支持該活動有關(guān)系”相關(guān)關(guān)系的判斷1已知變量x和y滿足關(guān)系y0.1x1,變量y與z正相關(guān)下列結(jié)論中正確的是()Ax與y正相關(guān),x與z負相關(guān)Bx與y正相關(guān),x與z正相關(guān)Cx與y負相關(guān),x與z負相關(guān)Dx與y負相關(guān),x與z正相關(guān)C因為y0.1x1的斜率小于0,故x與y負相關(guān)因為y與z正相關(guān),可設(shè)zbya,b0,則zbya0.1bxba,故x與z負相關(guān)2(2019廣州模擬)根據(jù)下面給出的2004年至2013年我國二氧化硫排放量(單位:萬噸)的條形統(tǒng)計圖. 以下
7、結(jié)論不正確的是()A逐年比較,2008年減少二氧化硫排放量的效果最顯著B2007年我國治理二氧化硫排放顯現(xiàn)成效 C2006年以來我國二氧化硫年排放量呈減少趨勢 D2006年以來我國二氧化硫年排放量與年份正相關(guān)D從2006年,將每年的二氧化硫排放量與前一年作差比較,得到2008年二氧化硫排放量與2007年排放量的差最大,A選項正確; 2007年二氧化硫排放量較2006年降低了很多,B選項正確;雖然2011年二氧化硫排放量較2010年多一些,但自2006年以來,整體呈遞減趨勢,C選項正確;自2006年以來我國二氧化硫年排放量與年份負相關(guān),D選項錯誤, 故選D3(2019日照模擬)變量X與Y相對應(yīng)的
8、一組數(shù)據(jù)為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),變量U與V相對應(yīng)的一組數(shù)據(jù)為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)r1表示變量Y與X之間的線性相關(guān)系數(shù),r2表示變量V與U之間的線性相關(guān)系數(shù),則()參考公式:線性相關(guān)系數(shù)rAr2r10B0r2r1Cr20r1Dr1r2C由己知中的數(shù)據(jù)可知:第一組數(shù)據(jù)正相關(guān),則相關(guān)系數(shù)大于零,第二組數(shù)據(jù)負相關(guān),則相關(guān)系數(shù)小于零,故選C規(guī)律方法判定兩個變量正、負相關(guān)性的方法(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關(guān);點的分布從左上角到右下角,兩個變量負相關(guān)(2)相關(guān)系
9、數(shù):r0時,正相關(guān);r0時,負相關(guān)(3)線性回歸方程中:b0時,正相關(guān);b0時,負相關(guān)線性回歸分析及應(yīng)用【例1】(2018全國卷)如圖是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設(shè)施投資額y(單位:億元)的折線圖為了預(yù)測該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額,建立了y與時間變量t的兩個線性回歸模型根據(jù)2000年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,17)建立模型:y30.413.5t;根據(jù)2010年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,7)建立模型:y9917.5t.(1)分別利用這兩個模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值;(2)你認為用哪個模型得到的預(yù)測值更可靠?
10、并說明理由解(1)利用模型,可得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值為y30.413.519226.1(億元)利用模型,可得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值為y9917.59256.5(億元)(2)利用模型得到的預(yù)測值更可靠理由如下:(i)從折線圖可以看出,2000年至2016年的數(shù)據(jù)對應(yīng)的點沒有隨機散布在直線y30.413.5t上下,這說明利用2000年至2016年的數(shù)據(jù)建立的線性模型不能很好地描述環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢,2010年相對2009年的環(huán)境基礎(chǔ)設(shè)施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對應(yīng)的點位于一條直線的附近,這說明從2010年開始環(huán)境基礎(chǔ)設(shè)施
11、投資額的變化規(guī)律呈線性增長趨勢,利用2010年至2016年的數(shù)據(jù)建立的線性模型y9917.5t可以較好地描述2010年以后的環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢,因此利用模型得到的預(yù)測值更可靠()從計算結(jié)果看,相對于2016年的環(huán)境基礎(chǔ)設(shè)施投資額220億元,由模型得到的預(yù)測值226.1億元的增幅明顯偏低,而利用模型得到的預(yù)測值的增幅比較合理,說明利用模型得到的預(yù)測值更可靠規(guī)律方法線性回歸分析問題的類型及解題方法(1)求線性回歸方程:利用公式,求出回歸系數(shù)b,a.待定系數(shù)法:利用回歸直線過樣本點中心求系數(shù)(2)利用回歸方程進行預(yù)測:把回歸直線方程看作一次函數(shù),求函數(shù)值(3)利用回歸直線判斷正、負相關(guān):決
12、定正相關(guān)還是負相關(guān)的是系數(shù)b. (2016全國卷)如圖是我國2008年至2014年生活垃圾無害化處理量(單位:億噸)的折線圖注:年份代碼17分別對應(yīng)年份20082014(1)由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請用相關(guān)系數(shù)加以說明;(2)建立y關(guān)于t的回歸方程(系數(shù)精確到0.01),預(yù)測2016年我國生活垃圾無害化處理量附注:參考數(shù)據(jù):yi9.32,tiyi40.17,0.55,2.646.參考公式:相關(guān)系數(shù)r,回歸方程yabt中斜率和截距的最小二乘估計公式分別為:b,ab.解(1)由折線圖中數(shù)據(jù)和附注中參考數(shù)據(jù)得4, (ti)228,0.55, (ti)(yi)tiyiyi40.
13、1749.322.89,r0.99.因為y與t的相關(guān)系數(shù)近似為0.99,說明y與t的線性相關(guān)程度相當高,從而可以用線性回歸模型擬合y與t的關(guān)系(2)由1.331及(1)得b0.103,ab1.3310.10340.92.所以,y關(guān)于t的回歸方程為y0.920.10t.將2016年對應(yīng)的t9代入回歸方程得y0.920.1091.82.所以預(yù)測2016年我國生活垃圾無害化處理量將約為1.82億噸獨立性檢驗及應(yīng)用【例2】(2017全國卷)海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下: (1)記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg”,估計A的概率;(2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān);箱產(chǎn)量50 kg箱產(chǎn)量50 kg舊養(yǎng)殖法新養(yǎng)殖法(3)根據(jù)箱產(chǎn)量的頻率分布直方圖,對這兩種養(yǎng)殖方法的優(yōu)劣進行比較附:P(2x0)0.0500.0100.001x03.8416.63510.828,2.解(1)舊養(yǎng)殖法的箱產(chǎn)量低于50 kg的頻率為(0.0120.0140.0240.0340.040)50.62.因此,事件A的概率估計值為0.62.(2)根據(jù)箱產(chǎn)量的頻率分布直方圖得列聯(lián)表箱產(chǎn)量6.635,所以有99%的把握認為兩種生產(chǎn)方式的效率有差異- 12 -