歡迎來(lái)到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁(yè) 裝配圖網(wǎng) > 資源分類 > PPT文檔下載  

復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法PPT課件

  • 資源ID:271016       資源大?。?span id="1116666" class="font-tahoma">1.75MB        全文頁(yè)數(shù):46頁(yè)
  • 資源格式: PPT        下載積分:20積分
快捷下載 游客一鍵下載
會(huì)員登錄下載
微信登錄下載
三方登錄下載: 微信開放平臺(tái)登錄 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要20積分
郵箱/手機(jī):
溫馨提示:
用戶名和密碼都是您填寫的郵箱或者手機(jī)號(hào),方便查詢和重復(fù)下載(系統(tǒng)自動(dòng)生成)
支付方式: 支付寶    微信支付   
驗(yàn)證碼:   換一換

 
賬號(hào):
密碼:
驗(yàn)證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會(huì)被瀏覽器默認(rèn)打開,此種情況可以點(diǎn)擊瀏覽器菜單,保存網(wǎng)頁(yè)到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請(qǐng)使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無(wú)水印,預(yù)覽文檔經(jīng)過(guò)壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標(biāo)題沒(méi)有明確說(shuō)明有答案則都視為沒(méi)有答案,請(qǐng)知曉。

復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法PPT課件

復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法,內(nèi) 容,概述研究設(shè)計(jì)方法統(tǒng)計(jì)分析方法分析實(shí)例,概 述,疾病的分類,隨著人類基因組計(jì)劃的完成和后基因組計(jì)劃的開展,人們對(duì)于疾病的認(rèn)識(shí)也越來(lái)越深入。已有的研究結(jié)果發(fā)現(xiàn)人類疾病都與基因受損有關(guān),因此提出了基因病-人類疾病的新概念。由此提出將人類疾病分為三種類型。 第一類是單基因病。僅由單個(gè)基因DNA序列某個(gè)堿基對(duì)的改變就造成疾病,并且可以把這樣的改變傳遞給后代。如血友病A、白化病等。,第二類是多基因?。◤?fù)雜性疾病)。這類疾病的發(fā)生涉及兩個(gè)以上基因的結(jié)構(gòu)或表達(dá)調(diào)控的改變,主要指慢性非傳染性疾病,如腫瘤、高血壓、冠心病、糖尿病、哮喘病、骨質(zhì)疏松癥、神經(jīng)性疾病、原發(fā)性癲癇等。 第三類為獲得性基因病。主要是傳染病由病原微生物通過(guò)感染將其基因入侵到宿主基因引起。如HIV。,復(fù)雜性疾病的特征,Genetic Heterogeneity(遺傳異質(zhì)性)Gene-Gene and Gene-Environment Interaction(基因基因,基因環(huán)境的交互作用)Incomplete Penetrance(不完全外顯性)Phenocopy(擬表型)Pleiotropy(多效性),研究設(shè)計(jì)方法,患病家系成員設(shè)計(jì),優(yōu)點(diǎn):具有明顯的孟德爾遺傳特點(diǎn)。遺傳方式確定(常顯、常隱或X連鎖)。缺點(diǎn):如果指定的遺傳方式不正確,可能導(dǎo)致錯(cuò)誤的結(jié)論。難以收集到家系全部人員。,患病家系成員設(shè)計(jì),患病同胞對(duì)設(shè)計(jì),患病同胞對(duì),表型不一致同胞對(duì),患病同胞對(duì)設(shè)計(jì),優(yōu)點(diǎn):可以進(jìn)行非參數(shù)統(tǒng)計(jì)分析。研究對(duì)象相對(duì)容易收集。缺點(diǎn):檢驗(yàn)效能相對(duì)較低樣本量要求較大,患病先證者核心家系設(shè)計(jì),優(yōu)點(diǎn):可以進(jìn)行非參數(shù)統(tǒng)計(jì)分析。研究對(duì)象相對(duì)容易收集。缺點(diǎn):統(tǒng)計(jì)分析時(shí)僅僅雜合子的雙親可以有效利用。對(duì)于遲發(fā)性疾病難以收集到雙親資料。,患病先證者核心家系設(shè)計(jì),雙生子研究設(shè)計(jì) 通過(guò)比較在相似或不同環(huán)境中成長(zhǎng)起來(lái)的同卵雙生子及異卵雙生子某一疾病或性狀發(fā)生的一致性,來(lái)判斷遺傳與環(huán)境因素的作用。養(yǎng)子研究設(shè)計(jì) 通過(guò)比較、分析養(yǎng)子與其同胞及生身父母某疾病或性狀的相似性和與其寄養(yǎng)同胞或養(yǎng)父母的相似性,研究在某種疾病或性狀發(fā)生中遺傳因素與環(huán)境因素相對(duì)作用的大小。,家系研究中其它研究設(shè)計(jì)方法,半同胞研究設(shè)計(jì) 是指同父異母或同母異父的兄弟姐妹。根據(jù)半同胞中所研究疾病的患病情況,可分析疾病或遺傳性狀來(lái)自父方或母方。,病例對(duì)照研究設(shè)計(jì),優(yōu)點(diǎn):相對(duì)容易收集到資料。 投入少,產(chǎn)出高。缺點(diǎn):由于存在連鎖不平衡和種群分層, 容易導(dǎo)致假陽(yáng)性或假陰性。,病例對(duì)照研究設(shè)計(jì),背 景1994年P(guān)iegorseh、Begs等提出 遺傳與環(huán)境的關(guān)系 交互作用,單純病例研究,應(yīng)用前提條件 在正常人群中基因型與環(huán)境暴露各自獨(dú)立發(fā)生, 所研究疾病為罕見病。,衍生的研究設(shè)計(jì)方法,研究示意圖,單純病例研究,環(huán)境暴露,基因型,病人,+,-,+,-,+,-,統(tǒng)計(jì)分析方法,表型與基因型常規(guī)統(tǒng)計(jì)分析病例-父母三結(jié)構(gòu)資料的TDT分析同胞數(shù)據(jù)SDT分析以家系為基礎(chǔ)的關(guān)聯(lián)分析 (FBAT)交互作用分析連鎖分析單體型分析 全基因組關(guān)聯(lián)分析,統(tǒng)計(jì)分析方法,分析基因型與表型的關(guān)系,也就是比較不同基因型的研究對(duì)象的表型是否存在差異,如基因型不同,表型也顯著不同,則表示兩者有關(guān)。 表型為連續(xù)型變量的基因型之間比較可用t-檢驗(yàn)、方差分析、 GEE等統(tǒng)計(jì)方法。 表型為分類型變量的基因型之間比較可用卡方檢驗(yàn)、GEE等統(tǒng)計(jì)方法。,表型與基因型常規(guī)統(tǒng)計(jì)分析,交互作用的統(tǒng)計(jì)方法包括參數(shù)法和非參數(shù)法。參數(shù)法線性回歸和Logistic回歸模型。 非參數(shù)法(主要是數(shù)據(jù)挖掘方法)。(1)降維法;多因子降維法。(2)基于樹的方法;分類回歸樹和隨機(jī)森林法。(3)模式識(shí)別法;包括神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)。(4)貝葉斯法:貝葉斯上位效應(yīng)關(guān)聯(lián)圖譜。 參數(shù)法和非參數(shù)法分析交互作用時(shí)各有優(yōu)缺點(diǎn); 低維數(shù)據(jù)的分析可采用參數(shù)法和非參數(shù)法, 高維數(shù)據(jù)的分析則主要采用非參數(shù)法,,交互作用的統(tǒng)計(jì)分析方法,以吸煙與飲酒兩個(gè)兩分類變量為例,它們有四種可能的組合(如下表):,我們可以形成一個(gè)四分類的變量,再用四個(gè)二分類變量X00、X01、X10、X11指示這四組,形成回歸方程:,回歸分析法,方程I:f(Y)= 0+1X10+2X01+3X11 1是吸煙不飲酒組與不吸煙不飲酒組的差,2是不吸煙但飲酒組與不吸煙不飲酒組的差,3是吸煙又飲酒組與不吸煙不飲酒組的差。方程II:f(Y)=0+aalcohol+ssmoke+sasmoke*alcohol 回歸系數(shù)的s不能簡(jiǎn)單地解釋為吸煙的作用,而應(yīng)確切地說(shuō)是對(duì)不飲酒者吸煙的作用(等于方程I的1)。a不能簡(jiǎn)單地解釋為飲酒的作用,而應(yīng)確切地說(shuō)是對(duì)不吸煙者飲酒的作用(等于方程I的2),因?yàn)閟、a、0 三者間有相互依賴的關(guān)系。,回歸分析法,方程I與方程II是等同的,方程I中的3 等于方程II中的a+s+sa 。方程I和II都有3個(gè)自變量(自由度),都沒(méi)有假定sa等于零,又稱為飽和(Saturated)模型。從方程II中我們可以觀察sa是否顯著。如果我們假定吸煙與飲酒無(wú)交互作用,sa等于零,則方程II變?yōu)椋悍匠蘄II:f(Y)= 0+aalcohol+ssmoke只用a、s來(lái)擬合這四組,如果得到的似然數(shù)與方程I(II)沒(méi)有顯著差別,表明sa是多余的,或者說(shuō)sa與零無(wú)顯著性差異,吸煙與飲酒對(duì)f(Y)無(wú)交互作用。反之,吸煙與飲酒對(duì)f(Y)有交互作用。,回歸分析法,上面講了交互作用的兩種檢驗(yàn)方法:方法I:模型中乘積項(xiàng)回歸系數(shù)的檢驗(yàn)(又稱WALD TEST)。如上例sa的檢驗(yàn),如顯著表示有交互作用;方法II:似然比檢驗(yàn)(Log likelihood ratio test),具體方法為:計(jì)算卡方值:X2=2*(LL1-LL2)。如上例,LL1表示從方程I(或II)得出的似然對(duì)數(shù);LL2表示從方程III得出的似然對(duì)數(shù)。計(jì)算自由度差。如上例,方程I(或II)有3個(gè)自變量,方程III只有2個(gè)自變量,差為1。按卡方檢驗(yàn),得出P值。一般來(lái)說(shuō),似然比檢驗(yàn)效率高于回歸系數(shù)的檢驗(yàn)。,回歸分析法,優(yōu)點(diǎn): (1) 分析某個(gè)自變量的效應(yīng)時(shí), 可以同時(shí)控制多個(gè)協(xié)變量的影響; (2) 可以處理自變量對(duì)因變量的非線性效應(yīng); (3) 可以在模型中引入交互作用項(xiàng); (4) 回歸系數(shù)的可解釋性。缺點(diǎn): (1) 維度困擾的問(wèn)題。維度困擾是指樣本量有限而自變量較多(高維數(shù)據(jù)) 時(shí), 分析交互作用時(shí)會(huì)使得觀測(cè)數(shù)相對(duì)于自變量數(shù)過(guò)少, 數(shù)據(jù)分布在高維稀疏的列聯(lián)表中, 此時(shí)維度困擾的問(wèn)題會(huì)導(dǎo)致Logistic 回歸模型中參數(shù)估計(jì)的錯(cuò)誤, 或使回歸系數(shù)的標(biāo)準(zhǔn)誤過(guò)大, 從而導(dǎo)致I類錯(cuò)誤或II類錯(cuò)誤增加。(2)自變量之間的相關(guān)性會(huì)導(dǎo)致不同的建模策略( 前進(jìn)法或后退法) , 并得到不同的結(jié)果。(3)Logistic 回歸不能很好地解決遺傳異質(zhì)性的問(wèn)題。,Logistic回歸分析,多因子降維法(multifactor dimensionality reduction, MDR)是2001年發(fā)展出的一種非參數(shù)、無(wú)需遺傳模式的高階交互作用分析方法,在2007年又提出了一種基于MDR基本原理的擴(kuò)展方法廣義多因子降維法(generalized multifactor dimensionality reduction,GMDR),又稱基于計(jì)分的多因子降維法(score-based MDR)。該法可以通過(guò)將廣義線性模型的概念引人到MDR中,使其不但能夠分析連續(xù)變量,且能夠納入?yún)f(xié)變量,從而控制協(xié)變量引起的干擾,提高預(yù)測(cè)的準(zhǔn)確度。其主要特點(diǎn):分析的基因表型和校正因素不限于離散型變量,也可以是連續(xù)型變量;可應(yīng)用于多種數(shù)據(jù)結(jié)構(gòu)(病例對(duì)照資料、人群隨機(jī)抽樣樣本或其他類型樣本);結(jié)合GMDR software軟件,可識(shí)別多個(gè)位點(diǎn)或環(huán)境因素之間的交互作用。,基本原理GMDR是對(duì)原始MDR的擴(kuò)展,其基本原理包括計(jì)分統(tǒng)計(jì)量(score statistic)和交叉驗(yàn)證(cross validation)。計(jì)分統(tǒng)計(jì)量:通過(guò)計(jì)算每個(gè)個(gè)體的計(jì)分統(tǒng)計(jì)量均值是否超過(guò)某個(gè)設(shè)定標(biāo)準(zhǔn)(例如大于或等于1),分別標(biāo)記為“高危”或“低?!?,單元格因此被分為2類,形成一維兩水平的模型。交叉驗(yàn)證(Cross validation):隨機(jī)方式產(chǎn)生十等份幾乎相同的數(shù)據(jù)子集,每次用十份中的九份作為訓(xùn)練樣本,另一份稱為留存數(shù)據(jù)(held-out data)作為測(cè)試樣本,當(dāng)十次全部完成后再將十次所得的平均絕對(duì)誤差求均值,即為研究的預(yù)測(cè)誤差。,GMDR軟件:目前最新的GMDR軟件(版本beta 07)是基于Java程序編寫的源代碼開放的免費(fèi)軟件, http:/www.healthsystem.virginia.edu/intemet/addiction.genomics/Software/免費(fèi)下載).文件類型:GMDR能夠識(shí)別的文件包括三種,分別為標(biāo)記文件(marker file),協(xié)變量與表型文件(covariate&phenotype file)以及計(jì)分文件(score file)。三者均為文本文件。結(jié)果輸出:每個(gè)單元格的顏色由單元格的計(jì)分決定,藍(lán)色為計(jì)分超過(guò)設(shè)定值,黃色為未超過(guò)設(shè)定值,白色表示單元格內(nèi)沒(méi)有數(shù)據(jù)。單元格中的左側(cè)條帶表示正計(jì)分之和,右側(cè)條帶表示負(fù)計(jì)分之和。,優(yōu)點(diǎn): (1) 在單個(gè)SNP位點(diǎn)缺乏主效應(yīng)時(shí), 可以同時(shí)檢測(cè)位點(diǎn)間的交互作用; (2) 將研究中的多因子組合以疾病易感性的方式分為高危和低危, 把高維結(jié)構(gòu)降低到一維兩水平, 降低了建模所需的自由度, 從而可以分析多個(gè)位點(diǎn)間的高階交互作用;(3)GMDR能有效識(shí)別無(wú)主效應(yīng)但具有交互作用的功能性SNP 位點(diǎn); 存在5% 以下的基因分型錯(cuò)誤和5% 的缺失數(shù)據(jù)時(shí), 對(duì)降低GMDR的檢驗(yàn)效能影響很小, 說(shuō)明GMDR具有一定的穩(wěn)健性。缺點(diǎn): (1)如果使用窮盡搜索的方式檢測(cè)最佳n因子組合, 由于該搜索方式非常耗時(shí), GMDR只能用于分析中小規(guī)模預(yù)測(cè)變量數(shù)的交互作用, 而不能用于處理大規(guī)模數(shù)據(jù)(如全基因組關(guān)聯(lián)研究的多個(gè)位點(diǎn)) 。(2)當(dāng)數(shù)據(jù)中存在遺傳異質(zhì)性和擬表型時(shí), GMDR的檢驗(yàn)效能大大降低 。(3)GMDR將基因型組合簡(jiǎn)單地根據(jù)病例與對(duì)照的比值分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組, 當(dāng)某種組合中病例數(shù)和對(duì)照數(shù)的比值接近于全部觀測(cè)數(shù)據(jù)中的比值, 或者該組合中病例數(shù)和對(duì)照數(shù)都很少時(shí), GMDR很容易發(fā)生分類錯(cuò)誤, 導(dǎo)致假陽(yáng)性率或假陰性率增高; 另外, 有些n因子組合的n維列聯(lián)表的觀測(cè)數(shù)可能為零, 此時(shí)就很難準(zhǔn)確地將該組合歸類為高風(fēng)險(xiǎn)組或是低風(fēng)險(xiǎn)組。,GMDR分析,FBAT既適應(yīng)于定性資料又適應(yīng)于定量資料,并且可以先對(duì)表型變量經(jīng)有關(guān)混雜因素進(jìn)行調(diào)整,將調(diào)整后的殘差值或校正值放入FBAT程序中進(jìn)行分析,這樣得到的結(jié)果就是經(jīng)過(guò)混雜因素調(diào)整后的關(guān)聯(lián)分析的結(jié)果。FBAT適用于各種類型的家系結(jié)構(gòu)。有父母雙親、只有單親、雙親均無(wú)、一個(gè)同胞、多個(gè)同胞的家系都可混合在一起應(yīng)用,有效避免人群分層影響。軟件:http:/www.hsph.harvard.edu/fbat/default.html,FBAT 分析(Family-Based Association Test),原理:FBAT以核心家系為單位計(jì)算每個(gè)核心家系數(shù)的基因型(X)的分布概率與統(tǒng)計(jì)量“S”(統(tǒng)計(jì)量S是表型T與基因型X的乘積),然后累加各核心家系的統(tǒng)計(jì)量S及S的方差與協(xié)方差,進(jìn)行卡方檢驗(yàn)。,#fmy:進(jìn)入分析的核心家系數(shù)。S:表示實(shí)際觀察值,SX*G,X表示表型值,G表示基因型。即S等于表型值與基因型的乘積。E(s):表示期望值,E(s)E(x)*G, E(x)表示期望的表型值,G表示基因型。即E(x)等于期望的表型值與基因型的乘積。 Var(s): 表示S的變異 Z:表示FBAT的統(tǒng)計(jì)值,ZS-E(S)/Var(s)2 , 由此來(lái)判斷P值的大小。P:表示統(tǒng)計(jì)概率,以P<0.05的水平來(lái)判斷是統(tǒng)計(jì)結(jié)果否具有顯著性。,分析實(shí)例,Pharmacogenetics and Genomics 2009, 19:345352,Genegene interactions of CYP2A6 and MAOA polymorphisms on smoking behavior in Chinese male population,交互作用分析實(shí)例,北京大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2003:35(4):377381,Tumor necrosis factor-alpha gene G308A polymorphism is associated with the risk of preterm delivery,FBAT分析實(shí)例,謝謝,

注意事項(xiàng)

本文(復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法PPT課件)為本站會(huì)員(鐘***)主動(dòng)上傳,裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng)(點(diǎn)擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因?yàn)榫W(wǎng)速或其他原因下載失敗請(qǐng)重新下載,重復(fù)下載不扣分。




關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!