《53第5章第3節(jié)假設(shè)檢驗(yàn)課件》由會(huì)員分享,可在線閱讀,更多相關(guān)《53第5章第3節(jié)假設(shè)檢驗(yàn)課件(17頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、5.3,假設(shè)檢驗(yàn)概述,江蘇師范大學(xué),第,*,頁,第 5 章 參數(shù)估計(jì)與假設(shè)檢驗(yàn),5.3 假設(shè)檢驗(yàn)概述目錄,本章目錄,5.3.1 假設(shè)檢驗(yàn)問題,5.3.2 參數(shù)假設(shè)檢驗(yàn)的思想方法,5.3.3 參數(shù)假設(shè)檢驗(yàn)的一般步驟,5.3.4 檢驗(yàn)的顯著性水平與兩類錯(cuò)誤,5.3.5 檢驗(yàn)的,p,值,5.3.6 多參數(shù)與非參數(shù)假設(shè)檢驗(yàn)問題,5.3 假設(shè)檢驗(yàn)概述,本章目錄,本節(jié)目錄,統(tǒng)計(jì)推斷的另一個(gè)主要內(nèi)容是(統(tǒng)計(jì))假設(shè)檢驗(yàn),本節(jié)主要介紹,參數(shù)假設(shè)檢驗(yàn),的基本概念和基本思想方法。,例,某廠規(guī)定,產(chǎn)品的次品率不超過 1%才能出廠,現(xiàn)有200 件產(chǎn)品準(zhǔn)備出廠,從中隨機(jī)抽取 5 件,發(fā)現(xiàn)有次品,試問能否允許這批產(chǎn)品出廠?
2、,本章目錄,5.3.1 假設(shè)檢驗(yàn)問題,本節(jié)目錄,為了說明什么是假設(shè)檢驗(yàn)問題,先看幾個(gè)實(shí)際例子。,設(shè)這批產(chǎn)品的次品率為,p,,,問題就是要回答“,p,1%”是否成立。,例,某工廠宣稱已采取大力措施治理廢水污染,根據(jù)經(jīng)驗(yàn),廢水中所含某種有毒物質(zhì)的濃度,X,(單位:mg/kg)服從正態(tài)分布?,F(xiàn)環(huán)保部門抽測了9個(gè)水樣,算得樣本平均值為 ,樣本標(biāo)準(zhǔn)差為,s,=2.4,以往該廠廢水中有毒物質(zhì)的平均濃度為18.2,試問有毒物質(zhì)的平均濃度有無顯著變化?,本章目錄,本節(jié)目錄,X,N,(,2,),其中,2,均未知,直觀上看,有毒物質(zhì)的平均濃度有所降低,但這種差異也有可能是抽樣的隨機(jī)性造成的。,問題是要判定有毒物質(zhì)
3、的平均濃度是否還是18.2,mg/kg,。,例,隨機(jī)抽測了60名2015年 1 月出生的嬰兒的體重,希望確定嬰兒的體重,X,是否服從正態(tài)分布。,本章目錄,本節(jié)目錄,問題是要判定,X,N,(,2,)是否成立?,上述各例所述問題的共同點(diǎn)是:對總體分布的,參數(shù),或,總體分布的類型,提出假設(shè),希望通過抽得的樣本信息對“假設(shè)是否成立”進(jìn)行推斷。這類問題稱為,假設(shè)檢驗(yàn)問題,。,本章目錄,本節(jié)目錄,在假設(shè)檢驗(yàn)問題中,通常把待檢驗(yàn)的假設(shè)稱為,原假設(shè),或,零假設(shè),,記為,H,0,,與之對應(yīng)的假設(shè)則稱為,備擇假設(shè),,記為,H,1,。在統(tǒng)計(jì)學(xué)中這兩個(gè)假設(shè)統(tǒng)稱為,統(tǒng)計(jì)假設(shè),,簡稱,假設(shè),。統(tǒng)計(jì)假設(shè)通常記為,H,0,v
4、s,H,1,。,比如,例、例和例的統(tǒng)計(jì)假設(shè)分別為:,例,某廠規(guī)定,產(chǎn)品的次品率不超過 1%才能出廠,現(xiàn)有200 件產(chǎn)品準(zhǔn)備出廠,從中隨機(jī)抽取 5 件,發(fā)現(xiàn)有次品,試問能否允許這批產(chǎn)品出廠?,本章目錄,本節(jié)目錄,設(shè)這批產(chǎn)品的次品率為,p,,,問題就是要回答“,p,1%”是否成立。,統(tǒng)計(jì)假設(shè)為,H,0,:,p,1%vs,H,1,:,p,1%,例,某工廠宣稱已采取大力措施治理廢水污染,根據(jù)經(jīng)驗(yàn),廢水中所含某種有毒物質(zhì)的濃度,X,(單位:mg/kg)服從正態(tài)分布。現(xiàn)環(huán)保部門抽測了9個(gè)水樣,算得樣本平均值為 ,樣本標(biāo)準(zhǔn)差為,s,=2.4,以往該廠廢水中有毒物質(zhì)的平均濃度為18.2,試問有毒物質(zhì)的平均濃度
5、有無顯著變化?,本章目錄,本節(jié)目錄,X,N,(,2,),其中,2,均未知,直觀上看,有毒物質(zhì)的平均濃度有所降低,但這種差異也有可能是抽樣的隨機(jī)性造成的。,問題是要判定有毒物質(zhì)的平均濃度是否還是18.2,mg/kg,。,統(tǒng)計(jì)假設(shè)為,H,0,:,=18.2 vs,H,1,:,18.2,例,隨機(jī)抽測了60名2015年 1 月出生的嬰兒的體重,希望確定嬰兒的體重,X,是否服從正態(tài)分布。,本章目錄,本節(jié)目錄,問題是要判定,X,N,(,2,)是否成立?,統(tǒng)計(jì)假設(shè)為,H,0,:,X,N,(,2,)vs,H,1,:,X,不服從正態(tài)分布。,本章目錄,本節(jié)目錄,在假設(shè)檢驗(yàn)問題中,若總體的分布類型是已知的,未知的只
6、是其中的一個(gè)或幾個(gè)參數(shù),統(tǒng)計(jì)假設(shè)只與這些未知參數(shù)有關(guān),我們稱為,參數(shù)假設(shè),,相應(yīng)的檢驗(yàn)稱為,參數(shù)假設(shè)檢驗(yàn),。若總體的分布類型未知,統(tǒng)計(jì)假設(shè)是總體分布的類型或某些特征,我們稱此類假設(shè)為,非參數(shù)假設(shè),,相應(yīng)的檢驗(yàn)稱為,非參數(shù)假設(shè)檢驗(yàn),。,進(jìn)一步地,在參數(shù)假設(shè)檢驗(yàn)問題中,總體中可能有多個(gè)未知的參數(shù),有時(shí)只對其中某一個(gè)參數(shù)提出假設(shè)并進(jìn)行檢驗(yàn),有時(shí)需要對多個(gè)參數(shù)一起提出一個(gè)假設(shè)并進(jìn)行檢驗(yàn),根據(jù)這一區(qū)別,我們可將參數(shù)假設(shè)檢驗(yàn)細(xì)分為,單參數(shù)假設(shè)檢驗(yàn),與,多參數(shù)假設(shè)檢驗(yàn),。,例5.3.1 和例5.3.2 都是參數(shù)假設(shè)檢驗(yàn)問題,而例 5.3.3 就是一個(gè)非參數(shù)假設(shè)檢驗(yàn)問題。下面重點(diǎn)討論單參數(shù)假設(shè)檢驗(yàn)問題。,本章
7、目錄,5.3.2 參數(shù)假設(shè)檢驗(yàn)的思想方法,本節(jié)目錄,例(續(xù)),某廠規(guī)定,產(chǎn)品的次品率不超過 1%才能出廠,現(xiàn)有 200 件產(chǎn)品準(zhǔn)備出廠,從中隨機(jī)抽取 5 件,發(fā)現(xiàn)有次品,試問能否允許這批產(chǎn)品出廠?,解,統(tǒng)計(jì)假設(shè)為,H,0,:,p,1%vs,H,1,:,p,1%,仍用上面的例子來說明假設(shè)檢驗(yàn)的基本思想方法:,若統(tǒng)計(jì)假設(shè),H,0,成立(即,p,1%),則事件,A,=“任取 5 件中有次品”發(fā)生的概率為,也就是說,如果,H,0,成立,則任取 5 件中有次品的概率很小,現(xiàn)在這種“罕見”的情況發(fā)生了,其根源是假設(shè)了,H,0,成立,因此我們有理由拒絕此假設(shè),并作出這批產(chǎn)品不能出廠的決定。,上述思路可歸結(jié)為
8、:,若假設(shè),H,0,:,p,1%成立,看看會(huì)推出什么結(jié)果,。,若假設(shè),H,0,:,=,0,=18.2 成立(即假設(shè)有毒物質(zhì)的濃度無顯著變化),看看會(huì)推出什么結(jié)果?,例(續(xù)),某工廠宣稱已采取大力措施治理廢水污染,根據(jù)經(jīng)驗(yàn),廢水中所含某種有毒物質(zhì)的濃度,X,(單位:mg/kg)服從正態(tài)分布?,F(xiàn)環(huán)保部門抽測了 9 個(gè)水樣,算得樣本平均值為 ,樣本標(biāo)準(zhǔn)差為,s,=2.4,以往該廠廢水中有毒物質(zhì)的平均濃度為 18.2,試問有毒物質(zhì)的平均濃度有無顯著變化?,本章目錄,本節(jié)目錄,解,統(tǒng)計(jì)假設(shè)為,H,0,:,=18.2 vs,H,1,:,18.2,設(shè)(,X,1,X,2,X,n,)為正態(tài)總體的一個(gè)樣本,(,x
9、,1,x,2,x,n,)是相應(yīng)的樣本觀察值。樣本均值是未知參數(shù),的無偏估計(jì)量,為相應(yīng)的估計(jì)值。我們也許想到用,的估計(jì)值代替,來檢驗(yàn),H,0,,但由于樣本的隨機(jī)性造成的估計(jì)誤差使得幾乎不會(huì)真正等于,,所以即使,H,0,:,=,0,為真,由于估計(jì)誤差的存在,也不會(huì)真正等于,0,。因而我們不能簡單地根據(jù)是否有來判斷,H,0,:,=,0,是否成立。,本章目錄,本節(jié)目錄,但是,如果,H,0,:,=,0,為真,那么會(huì)以很大的概率落在,0,附近的一定范圍內(nèi),而遠(yuǎn)離,0,的概率會(huì)很小。即,只要,d,足夠的大,則會(huì)很小。如果在一次觀察中出現(xiàn)了,根據(jù)小概率原理(認(rèn)為小概率事件在一次試驗(yàn)中不會(huì)發(fā)生),我們自然有充足
10、的理由,否定,H,0,:,=,0,;相反,如果不成立,則沒有充足的理由否定,H,0,:,=,0,,也稱,不能拒絕假設(shè),H,0,。,上面的論述事實(shí)上提供了解決例的方法,具體解決步驟后面再作詳細(xì)論述。,從上面的討論可以看出,要實(shí)施檢驗(yàn)(是否拒絕假設(shè),H,0,),首先要確定小概率的大小,這一小概率在假設(shè)檢驗(yàn)中稱為,檢驗(yàn)的顯著性水平,,通常記作,。它是根據(jù)具體問題而需要事先確定的一個(gè)很小的正數(shù),比如0.01,0.05,0.10等。其次,對給定的顯著性水平,,還需要確定一個(gè)由樣本所描述的概率不超過顯著性水平,的小概率事件,這一小概率事件對應(yīng)的樣本取值區(qū)域通常稱為,假設(shè)檢驗(yàn)的拒絕域,,簡稱,拒絕域,。最后
11、看樣本觀察值是否落入拒絕域,若樣本觀察值落入拒絕域便可以拒絕,H,0,;否則,就不能拒絕,H,0,。,本章目錄,5.3.3 參數(shù)假設(shè)檢驗(yàn)的一般步驟,本節(jié)目錄,參數(shù)假設(shè)檢驗(yàn)的一般步驟可歸納為:,第一步,:提出統(tǒng)計(jì)假設(shè),H,0,vs,H,1,;,第二步,:選取,的一個(gè)較優(yōu)的點(diǎn)估計(jì) ,并根據(jù) 給出拒絕域的形式(在,H,0,成立前提下);,第三步,:圍繞 構(gòu)建樞軸量并確定其分布;,第四步,:對給定的顯著性水平,,確定拒絕域,C,使得,P,(,X,1,X,2,X,n,),C,|,H,0,),;,第五步,:如果(,x,1,x,2,x,n,),C,,則在顯著性水平,下拒絕,H,0,;否則,則不能拒絕,H,0
12、,。,本章目錄,5.3.4 檢驗(yàn)的顯著性水平與兩類錯(cuò)誤,本節(jié)目錄,在假設(shè)檢驗(yàn)問題中,由樣本提供的信息來推斷是否“拒絕假設(shè),H,0,”時(shí),用了“小概率原理”,但小概率事件并非不可能事件,如果零假設(shè),H,0,本為真,但因樣本值落入拒絕域而作出了拒絕,這便犯了,棄真錯(cuò)誤,,通常稱為,第一類錯(cuò)誤,;相反,如果零假設(shè),H,0,本不成立,卻因樣本值沒有落入拒絕域而作出了不能拒絕,這便犯了,納偽錯(cuò)誤,,通常稱為,第二類錯(cuò)誤,。,根據(jù)檢驗(yàn)法則知,當(dāng),H,0,成立時(shí),拒絕,H,0,的概率小于等于顯著性水平,,這表明犯第一類錯(cuò)誤的概率至多為,,從而說明檢驗(yàn)的顯著性水平,是用以控制犯第一類錯(cuò)誤的概率的。由此可能會(huì)產(chǎn)
13、生一種錯(cuò)覺,以為只要把顯著性水平,取得越小,假設(shè)檢驗(yàn)的準(zhǔn)確程度就會(huì)越高。事實(shí)上不然,因?yàn)轱@著性水平,只是用來控制犯第一類錯(cuò)誤的概率,而在假設(shè)檢驗(yàn)中還存在著犯第二類錯(cuò)誤的可能性。一般來說,當(dāng)樣本容量,n,給定時(shí),在降低顯著性水平,的同時(shí),拒絕域往往也在變小,從而會(huì)增大犯第二類錯(cuò)誤的可能性。通常的做法是,事先給定顯著性水平,來控制犯第一類錯(cuò)誤的概率,再通過選取較好的檢驗(yàn)方法盡可能地減少犯第二類錯(cuò)誤的概率,(比如,拒絕域盡可能取大些)。,本章目錄,5.3.5 檢驗(yàn)的,p,值,本節(jié)目錄,可以看出,顯著性水平,越小,則相應(yīng)的拒絕域就越?。划?dāng)顯著性水平,取得足夠小時(shí),可以使得樣本值不落在相應(yīng)的拒絕域中,從
14、而在此顯著性水平,下不能拒絕假設(shè),H,0,。當(dāng)顯著性水平,由上述足夠小的值不斷增大時(shí),相應(yīng)的拒絕域也就越來越大,當(dāng)顯著性水平,大到一定程度時(shí),便可以使得樣本值落入相應(yīng)的拒絕域中,從而在此顯著性水平,下可以拒絕假設(shè),H,0,。,也就是說,對于一個(gè)確定的樣本值,存在一個(gè)實(shí)數(shù),p,(0,p,1),在顯著性水平等于,p,下可以拒絕假設(shè),H,0,,而在小于,p,的顯著性水平下不能拒絕假設(shè),H,0,。可見,,p,是使得依據(jù)給定樣本值作出“拒絕假設(shè),H,0,”的最小的顯著性水平,稱之為檢驗(yàn)的,p,值。,多數(shù)統(tǒng)計(jì)軟件都提供,p,值的輸出結(jié)果,人們就不必針對每個(gè)顯著性水平,查相應(yīng)分布的下側(cè)分位數(shù),只要直接比較,與,p,值即可。,本章目錄,5.3.6 多參數(shù)與非參數(shù)假設(shè)檢驗(yàn)問題,本節(jié)目錄,前面對單參數(shù)假設(shè)檢驗(yàn)問題作了比較詳盡的討論,其解決問題的基本思想方法也適用于多參數(shù)假設(shè)檢驗(yàn)或非參數(shù)假設(shè)檢驗(yàn)問題,只是在具體細(xì)節(jié)上作適當(dāng)調(diào)整即可。為此,僅說明兩點(diǎn):,對于多參數(shù)假設(shè)檢驗(yàn)問題,需尋求一個(gè)包含所有待檢驗(yàn)參數(shù)的樞軸量,并使之服從或漸近地服從一個(gè)已知的確定分布;,非參數(shù)假設(shè)檢驗(yàn)問題可以近似地化為一個(gè)多參數(shù)假設(shè)檢驗(yàn)問題來解決。,