生物信息學本科教學課件
生物信息學本科教學課件,生物信息學,本科教學課件,生物,信息學,本科,教學,課件
多序列比較的實際應用多序列比較的實際應用主講教師:趙雨杰主講教師:趙雨杰多序列比較的實際應用多序列比較的實際應用多序列比較的實際應用多序列比較的實際應用多序列比較就是把兩條以上可能有系統(tǒng)進化關系的多序列比較就是把兩條以上可能有系統(tǒng)進化關系的多序列比較就是把兩條以上可能有系統(tǒng)進化關系的多序列比較就是把兩條以上可能有系統(tǒng)進化關系的序列進行比較的方法。序列進行比較的方法。序列進行比較的方法。序列進行比較的方法。目前對多序列比較的研究還在不斷前進中,現(xiàn)有的目前對多序列比較的研究還在不斷前進中,現(xiàn)有的目前對多序列比較的研究還在不斷前進中,現(xiàn)有的目前對多序列比較的研究還在不斷前進中,現(xiàn)有的大多數(shù)算法都基于漸進比較的思想,在序列兩兩比大多數(shù)算法都基于漸進比較的思想,在序列兩兩比大多數(shù)算法都基于漸進比較的思想,在序列兩兩比大多數(shù)算法都基于漸進比較的思想,在序列兩兩比較的基礎上逐步優(yōu)化多序列比較的結果。進行多序較的基礎上逐步優(yōu)化多序列比較的結果。進行多序較的基礎上逐步優(yōu)化多序列比較的結果。進行多序較的基礎上逐步優(yōu)化多序列比較的結果。進行多序列比較后可以對比較結果進行進一步處理,尤其是列比較后可以對比較結果進行進一步處理,尤其是列比較后可以對比較結果進行進一步處理,尤其是列比較后可以對比較結果進行進一步處理,尤其是在尋找基因和致力于發(fā)現(xiàn)新蛋白的努力中,人們習在尋找基因和致力于發(fā)現(xiàn)新蛋白的努力中,人們習在尋找基因和致力于發(fā)現(xiàn)新蛋白的努力中,人們習在尋找基因和致力于發(fā)現(xiàn)新蛋白的努力中,人們習慣于把新的序列同已知功能的蛋白序列作比較。慣于把新的序列同已知功能的蛋白序列作比較。慣于把新的序列同已知功能的蛋白序列作比較。慣于把新的序列同已知功能的蛋白序列作比較。在搜集的比較序列中,可以看出隱含于蛋白之中的在搜集的比較序列中,可以看出隱含于蛋白之中的在搜集的比較序列中,可以看出隱含于蛋白之中的在搜集的比較序列中,可以看出隱含于蛋白之中的物種進化關系,以便于更好地理解蛋白的進化。研物種進化關系,以便于更好地理解蛋白的進化。研物種進化關系,以便于更好地理解蛋白的進化。研物種進化關系,以便于更好地理解蛋白的進化。研究一個家族中的相關蛋白的差異,分析進化壓力和究一個家族中的相關蛋白的差異,分析進化壓力和究一個家族中的相關蛋白的差異,分析進化壓力和究一個家族中的相關蛋白的差異,分析進化壓力和生物秩序對于功能相關的蛋白進化影響。研究完多生物秩序對于功能相關的蛋白進化影響。研究完多生物秩序對于功能相關的蛋白進化影響。研究完多生物秩序對于功能相關的蛋白進化影響。研究完多序列比較中的高度保守區(qū)域,我們可以對蛋白質的序列比較中的高度保守區(qū)域,我們可以對蛋白質的序列比較中的高度保守區(qū)域,我們可以對蛋白質的序列比較中的高度保守區(qū)域,我們可以對蛋白質的整個結構進行預測,并且猜測這些保守區(qū)域對于維整個結構進行預測,并且猜測這些保守區(qū)域對于維整個結構進行預測,并且猜測這些保守區(qū)域對于維整個結構進行預測,并且猜測這些保守區(qū)域對于維持三維結構的重要性。持三維結構的重要性。持三維結構的重要性。持三維結構的重要性。分析一群相關蛋白質時,很有必要了解比較正確的分析一群相關蛋白質時,很有必要了解比較正確的分析一群相關蛋白質時,很有必要了解比較正確的分析一群相關蛋白質時,很有必要了解比較正確的構成。發(fā)展用于多序列比較的程序是一個很有活力構成。發(fā)展用于多序列比較的程序是一個很有活力構成。發(fā)展用于多序列比較的程序是一個很有活力構成。發(fā)展用于多序列比較的程序是一個很有活力的研究領域,絕大多數(shù)方法都是基于漸進比較的研究領域,絕大多數(shù)方法都是基于漸進比較的研究領域,絕大多數(shù)方法都是基于漸進比較的研究領域,絕大多數(shù)方法都是基于漸進比較(progressive alignmentprogressive alignment)的概念。漸進比較的思想)的概念。漸進比較的思想)的概念。漸進比較的思想)的概念。漸進比較的思想依賴于使用者用作比較的序列之間確實存在的生物依賴于使用者用作比較的序列之間確實存在的生物依賴于使用者用作比較的序列之間確實存在的生物依賴于使用者用作比較的序列之間確實存在的生物學上的或者更準確地說是系統(tǒng)發(fā)生學上的相互關聯(lián)。學上的或者更準確地說是系統(tǒng)發(fā)生學上的相互關聯(lián)。學上的或者更準確地說是系統(tǒng)發(fā)生學上的相互關聯(lián)。學上的或者更準確地說是系統(tǒng)發(fā)生學上的相互關聯(lián)。與數(shù)據(jù)庫檢索的關系與數(shù)據(jù)庫檢索的關系l l1 1、對數(shù)據(jù)庫搜索,檢索結果未知;、對數(shù)據(jù)庫搜索,檢索結果未知;l l2 2、數(shù)據(jù)庫檢索后尋找到一組相似序列;、數(shù)據(jù)庫檢索后尋找到一組相似序列;l l3 3、構建進化樹。、構建進化樹。CLUSTAL主講教師:趙雨杰主講教師:趙雨杰1.CLUSTAL Omega1.CLUSTAL OmegaCLUSTAL CLUSTAL 算法算法算法算法是一個最廣泛使用的多序列比較程序,是一個最廣泛使用的多序列比較程序,是一個最廣泛使用的多序列比較程序,是一個最廣泛使用的多序列比較程序,在任何主要的計算機平臺上都可以免費使用。這個程在任何主要的計算機平臺上都可以免費使用。這個程在任何主要的計算機平臺上都可以免費使用。這個程在任何主要的計算機平臺上都可以免費使用。這個程序基于漸進比較的思想,將得到的一系列序列輸入,序基于漸進比較的思想,將得到的一系列序列輸入,序基于漸進比較的思想,將得到的一系列序列輸入,序基于漸進比較的思想,將得到的一系列序列輸入,對于每兩個序列進行雙重比較并且計算結果?;谶@對于每兩個序列進行雙重比較并且計算結果。基于這對于每兩個序列進行雙重比較并且計算結果?;谶@對于每兩個序列進行雙重比較并且計算結果?;谶@些比較,計算得到一個距離矩陣,反映了每對序列的些比較,計算得到一個距離矩陣,反映了每對序列的些比較,計算得到一個距離矩陣,反映了每對序列的些比較,計算得到一個距離矩陣,反映了每對序列的關系,然后,基于鄰近加入方法,這個矩陣被用來計關系,然后,基于鄰近加入方法,這個矩陣被用來計關系,然后,基于鄰近加入方法,這個矩陣被用來計關系,然后,基于鄰近加入方法,這個矩陣被用來計算出一個系統(tǒng)發(fā)生輔助樹。算出一個系統(tǒng)發(fā)生輔助樹。算出一個系統(tǒng)發(fā)生輔助樹。算出一個系統(tǒng)發(fā)生輔助樹。這個輔助樹,加權后可以證實極相近的序列,然后這個輔助樹,加權后可以證實極相近的序列,然后這個輔助樹,加權后可以證實極相近的序列,然后這個輔助樹,加權后可以證實極相近的序列,然后以雙重比較極相近的序列開始,為組建比較提供基以雙重比較極相近的序列開始,為組建比較提供基以雙重比較極相近的序列開始,為組建比較提供基以雙重比較極相近的序列開始,為組建比較提供基礎,重新比較下一個加入的比較序列,依次類推。礎,重新比較下一個加入的比較序列,依次類推。礎,重新比較下一個加入的比較序列,依次類推。礎,重新比較下一個加入的比較序列,依次類推。如果加入的序列較多,那么毫無疑問,必須加入空如果加入的序列較多,那么毫無疑問,必須加入空如果加入的序列較多,那么毫無疑問,必須加入空如果加入的序列較多,那么毫無疑問,必須加入空位以適應序列的差異,但是加入空位必須接受空位位以適應序列的差異,但是加入空位必須接受空位位以適應序列的差異,但是加入空位必須接受空位位以適應序列的差異,但是加入空位必須接受空位開放罰分和空位擴展罰分。開放罰分和空位擴展罰分。開放罰分和空位擴展罰分。開放罰分和空位擴展罰分。在絕大多數(shù)情況下,使用者不會在比較時加入結構在絕大多數(shù)情況下,使用者不會在比較時加入結構在絕大多數(shù)情況下,使用者不會在比較時加入結構在絕大多數(shù)情況下,使用者不會在比較時加入結構信息,但是空位開放補償利用了可以出現(xiàn)在信息,但是空位開放補償利用了可以出現(xiàn)在信息,但是空位開放補償利用了可以出現(xiàn)在信息,但是空位開放補償利用了可以出現(xiàn)在-螺旋螺旋螺旋螺旋或或或或-折疊末端的特殊殘基以及空位罰分所偏好的殘折疊末端的特殊殘基以及空位罰分所偏好的殘折疊末端的特殊殘基以及空位罰分所偏好的殘折疊末端的特殊殘基以及空位罰分所偏好的殘基。已經(jīng)存在的空位的擴展原則很簡單,只是要在基。已經(jīng)存在的空位的擴展原則很簡單,只是要在基。已經(jīng)存在的空位的擴展原則很簡單,只是要在基。已經(jīng)存在的空位的擴展原則很簡單,只是要在那些極有可能在結構中形成彎曲的位點擴展空位,那些極有可能在結構中形成彎曲的位點擴展空位,那些極有可能在結構中形成彎曲的位點擴展空位,那些極有可能在結構中形成彎曲的位點擴展空位,這些空位擴展罰分計算是由位置決定的。這些空位擴展罰分計算是由位置決定的。這些空位擴展罰分計算是由位置決定的。這些空位擴展罰分計算是由位置決定的。為了介紹為了介紹為了介紹為了介紹CLUSTAL CLUSTAL 的的的的使用,考察一下從四種不同使用,考察一下從四種不同使用,考察一下從四種不同使用,考察一下從四種不同物種來源的物種來源的物種來源的物種來源的matrix metalloproteinase 9 matrix metalloproteinase 9 preproproteinpreproprotein蛋白(蛋白(蛋白(蛋白(Homo sapiensHomo sapiens,Paralichthys Paralichthys olivaceusolivaceus,Rattus norvegicusRattus norvegicus,Bos taurusBos taurus)。)。)。)。將下將下將下將下列蛋白序列放入一個列蛋白序列放入一個列蛋白序列放入一個列蛋白序列放入一個獨立的純文本文件獨立的純文本文件獨立的純文本文件獨立的純文本文件中中中中。lgi|14786152|ref|XP_029934.1|matrix metalloproteinase 9 preproprotein Homo sapienslMSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPALLLLQKQLSLPETGELDSATLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTDDRFGFCPSERLYTQDGNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFPFTFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYRFTEGPPLHKDDVNGIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPSAGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEIGNQLYLFKDGKYWRFSEGRGSRPQGPFLIADKWPALPRKLDSVFEERLSKKLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVAQVTGALRSGRGKMLLFSGRRLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTYDILQCPEDlgi|15718389|dbj|BAB68366.1|gelatinase Paralichthys olivaceuslMRCCALAVCLVLVIVQDGWSLPLRSISVTFPGDILKNVTDTDLAETYLKRFGYLDKMHRSGFQSMVSTAKALKMMQRQMGLKETGKLDKSTLEAMKQPRCGVPDVANYQTFEGDLKWDHNDVTYRTLNYSPDMESSLIDDAFARAFKVWSDVTPLTFTRLYEGTADIMISFGKADHGDPYPFDGRNGLLAHAYPPGEGVQGDAHFDDDEHWTLGNGPAVKTLYGNADGAMCHFPFTFEGKSYTSCTTDGRTDNLPWCATTADYSRDGKYGFCPSELLYTVGGNADGAKCVFPFVFLEKEYDSCTKEGRSDGYRWCATTANFDQDQKYGFCPSRDTAVFGGNSEGEPCHFPFVFLGKEYDSCTSEGREDGKLWCSTTDNYDEDAKWGFCDDEGYSLFLVAAHEFGHALGLDHSNIREALMYPMYTYVEDFSLHKDDIEGIQYLYGRGTGPDPTPPQPTSTTTTPNPTEEPEPTTPQPVDPTRDACKLTKFDTITMIENELHFFENGNYWKMPSRGDGGLKGPFSLSERWPALPAVIDSAFEDLLTKNMYFFSGNRFWVYTKEGVLGPRSIEKLGLPTSIQKVEGALQRGKGKVLLFTEESFWKFDLKSQKMDKGYPKSTDYVFGGVPNDAHDVFQYKGHMYFCRDSFYWRMNSRRQVDRVGYVKYDLLKCSDSYlgi|13591993|ref|NP_112317.1|matrix metalloproteinase 9(gelatinase B,92-kDa type IV collagenase)Rattus norvegicuslMNPWQPLLLVLLALGYSFAAPHQRQPTYVVFPRDLKTSNLTDTQLAEDYLYRYGYTRAAQMMGEKQSLRPALLMLQKQLSLPQTGELDSETLKAIRSPRCGVPDVGKFQTFEGDLKWHHHNITYWIQSYTEDLPRDVIDDSFARAFAVWSAVTPLTFTRVYGLEADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGAVVPTYFGNANGAPCHFPFTFEGRSYLSCTTDGRNDGKPWCGTTADYDTDRKYGFCPSENLYTEHGNGDGKPCVFPFIFEGHSYSACTTKGRSDGYRWCATTANYDQDKLYGFCPTRADVTVTGGNSAGEMCVFPFVFLGKQYSTCTGEGRSDGRLWCATTSNFDADKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYHYHEDSPLHEDDIKGIQHLYGRGSKPDPRPPATTAAEPQPTAPPTMCPTAPPMAYPTGGPTVAPTGAPSPGPTGPPTAGPSEAPTESSTPVDNPCNVDVFDAIADIQGALHFFKDGRYWKFSNHGGSQLQGPFLIARTWPALPAKLNSAFEDPQSKKIFFFSGRKMWVYTGQTVLGPRSLDKLGLGSEVTLVTGLLPRRGGKALLISRERIWKFDL KSQKVDPQSVTRLDNEFSGVPWNSHNVFHYQDKAYFCHDKYFWRVSFHNRVNQVDHVAYVTYDLLQCPlgi|467621|emb|CAA55127.1|matrix metalloproteinase 9 Bos tauruslMSPLQPLVLALLVLACCSAVPRRRQPTVVVFPGEPRTNLTNRQLAEEYLYRYGYTPGAELSEDGQSLQRALLRFQRRLSLPETGELDSTTLNAMRAPRCGVPDVGRFQTFEGELKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYGPEADIVIQFGVREHGDGYPFDGKNGLLAHAFPPGKGIQGDAHFDDEELWSLGKGVVIPTYFGNAKGAACHFPFTFEGRSYSACTTDGRSDDMLWCSTTADYDADRQFGFCPSERLYTQDGNADGKPCVFPFTFQGRTYSACTSDGRSDGYRWCATTANYDQDKLYGFCPTRVDATVTGGNAAGELCVFPFTFLGKEYSACTREGRNDGHLWCATTSNFDKDKKWGFCPDQGYSLFLVAAHEFGHALGLDHTSVPEALMYPMYRFTEEHPLHRDDVQGIQHLYGPRPEPEPRPPTTTTTTTTEPQPTAPPTVCVTGPPTARPSEGPTTGPTGPPAAGPTGPPTAGPSAAPTESPDPAEDVCNVDIFDAIAEIRNRLHFFKAGKYWRLSEGGGRRVQGPFLVKSKWPALPRKLDSAFEDPLTKKIFFFSGRQVWVYTGASLLGPRRLDKLGLGPEVAQVTGALPRPEGKVLLFSGQSFWRFDVKTQKVDPQSVTPVDQMFPGVPISTHDIFQYQEKAYFCQDHFYWRVSSQNEVNQVDYVGYVTFDLLKCPED 這四種輸入序列放在一個單獨的文件中,作成這四種輸入序列放在一個單獨的文件中,作成這四種輸入序列放在一個單獨的文件中,作成這四種輸入序列放在一個單獨的文件中,作成7 7種可種可種可種可以接受的格式中的一種,以接受的格式中的一種,以接受的格式中的一種,以接受的格式中的一種,NBRF/PIR NBRF/PIR;EMBL/UniProtKB/Swiss-ProtEMBL/UniProtKB/Swiss-Prot;Pearson(Fasta)Pearson(Fasta);GDE GDE;ALN/ClustalW GCG/MSF ALN/ClustalW GCG/MSF;RSFRSF進入進入進入進入http:/www.ebi.ac.uk/Tools/msa/clustalo/http:/www.ebi.ac.uk/Tools/msa/clustalo/站點,站點,站點,站點,將需要比較的序列輸入工具程序中將需要比較的序列輸入工具程序中將需要比較的序列輸入工具程序中將需要比較的序列輸入工具程序中 ,在在在在“序列輸入序列輸入序列輸入序列輸入窗口窗口窗口窗口”中中中中輸入輸入輸入輸入或粘貼需要比較的序列,也可以在或粘貼需要比較的序列,也可以在或粘貼需要比較的序列,也可以在或粘貼需要比較的序列,也可以在“文件輸入窗口文件輸入窗口文件輸入窗口文件輸入窗口”將含有需要比較序列的文件名輸入將含有需要比較序列的文件名輸入將含有需要比較序列的文件名輸入將含有需要比較序列的文件名輸入ClustalClustal運行運行運行運行程序中,進行多序列比較。程序中,進行多序列比較。程序中,進行多序列比較。程序中,進行多序列比較。CLUSTA OCLUSTA O結束時,會顯示最終的比較結果,在結束時,會顯示最終的比較結果,在結束時,會顯示最終的比較結果,在結束時,會顯示最終的比較結果,在比較下方,一些位點被標記為星號或圓點,這些比較下方,一些位點被標記為星號或圓點,這些比較下方,一些位點被標記為星號或圓點,這些比較下方,一些位點被標記為星號或圓點,這些標記分別顯示這些殘基在序列中是絕對或是高度標記分別顯示這些殘基在序列中是絕對或是高度標記分別顯示這些殘基在序列中是絕對或是高度標記分別顯示這些殘基在序列中是絕對或是高度保守的。結果輸出的最后部分是進化樹,可以看保守的。結果輸出的最后部分是進化樹,可以看保守的。結果輸出的最后部分是進化樹,可以看保守的。結果輸出的最后部分是進化樹,可以看出,比較的四種源自不同種屬的蛋白進化關系。出,比較的四種源自不同種屬的蛋白進化關系。出,比較的四種源自不同種屬的蛋白進化關系。出,比較的四種源自不同種屬的蛋白進化關系。MultAlinMultAlin主講教師:趙雨杰主講教師:趙雨杰2.MultAlin2.MultAlin2.MultAlin2.MultAlinMultAlinMultAlin方法也是基于用一系列雙重比較開始的方法也是基于用一系列雙重比較開始的方法也是基于用一系列雙重比較開始的方法也是基于用一系列雙重比較開始的思思思思想,然后想,然后想,然后想,然后基于雙重比較的打分值進行一個分層次的基于雙重比較的打分值進行一個分層次的基于雙重比較的打分值進行一個分層次的基于雙重比較的打分值進行一個分層次的聚類。當序列都分成類后,開始進行多序列比較,聚類。當序列都分成類后,開始進行多序列比較,聚類。當序列都分成類后,開始進行多序列比較,聚類。當序列都分成類后,開始進行多序列比較,計算出多序列比較中的兩個序列比較的新值,基于計算出多序列比較中的兩個序列比較的新值,基于計算出多序列比較中的兩個序列比較的新值,基于計算出多序列比較中的兩個序列比較的新值,基于這些新值,重新構建一棵樹。這個過程不斷進行,這些新值,重新構建一棵樹。這個過程不斷進行,這些新值,重新構建一棵樹。這個過程不斷進行,這些新值,重新構建一棵樹。這個過程不斷進行,直到分值不再上升,此時所有序列比較也就結束了。直到分值不再上升,此時所有序列比較也就結束了。直到分值不再上升,此時所有序列比較也就結束了。直到分值不再上升,此時所有序列比較也就結束了。MultAlinMultAlin(http:/multalin.toulouse.inra.fr/multalin/multhttp:/multalin.toulouse.inra.fr/multalin/multalin.htmlalin.html)可以在)可以在)可以在)可以在INRA ToulouseINRA Toulouse的一個環(huán)球網(wǎng)點上很的一個環(huán)球網(wǎng)點上很的一個環(huán)球網(wǎng)點上很的一個環(huán)球網(wǎng)點上很容易地執(zhí)行,要比較的序列按照容易地執(zhí)行,要比較的序列按照容易地執(zhí)行,要比較的序列按照容易地執(zhí)行,要比較的序列按照FASTAFASTA的格式被粘貼到的格式被粘貼到的格式被粘貼到的格式被粘貼到序列輸入框內(nèi),也可以在文件輸入窗口輸入文件名序列輸入框內(nèi),也可以在文件輸入窗口輸入文件名序列輸入框內(nèi),也可以在文件輸入窗口輸入文件名序列輸入框內(nèi),也可以在文件輸入窗口輸入文件名,將將將將序列提交給服務器。序列提交給服務器。序列提交給服務器。序列提交給服務器。在提交序列之前,用主界面的一系列下拉菜單,用在提交序列之前,用主界面的一系列下拉菜單,用在提交序列之前,用主界面的一系列下拉菜單,用在提交序列之前,用主界面的一系列下拉菜單,用戶定義適當?shù)膮?shù),比如輸出格式,可選的輸入格戶定義適當?shù)膮?shù),比如輸出格式,可選的輸入格戶定義適當?shù)膮?shù),比如輸出格式,可選的輸入格戶定義適當?shù)膮?shù),比如輸出格式,可選的輸入格式,引用的分值矩陣以及空位開放和擴展罰分的分式,引用的分值矩陣以及空位開放和擴展罰分的分式,引用的分值矩陣以及空位開放和擴展罰分的分式,引用的分值矩陣以及空位開放和擴展罰分的分值。大多數(shù)用戶只會根據(jù)輸入序列的遠近關系,選值。大多數(shù)用戶只會根據(jù)輸入序列的遠近關系,選值。大多數(shù)用戶只會根據(jù)輸入序列的遠近關系,選值。大多數(shù)用戶只會根據(jù)輸入序列的遠近關系,選擇不同的分值矩陣。擇不同的分值矩陣。擇不同的分值矩陣。擇不同的分值矩陣。Blosum 45 MatrixBlosum 45 MatrixG 7 P -2 9 D -1 -1 7 E -2 0 2 6 N 0 -2 2 0 6 H -2 -2 0 0 1 10 Q -2 -1 0 2 0 1 6 K -2 -1 0 1 0 -1 1 5 R-2 -2 -1 0 0 0 1 3 7 S 0 -1 0 0 1 -1 0 -1 -1 4 T-2 -1 -1-1 0 -2 -1 -1 -1 2 5 A 0 -1 -2 -1 -1 -2 -1 -1 -2 1 0 5 M-2 -2 -3 -2 -2 0 0 -1-1 -2 -1 -1 6 V -3 -3 -3 -3 -3 -3 -3 -2 -2 -1 0 0 1 5 I -4 -2 -4 -3 -2 -3 -2 -3 -3-2 -1 -1 2 3 5 L-3 -3 -3 -2 -3 -2 -2 -3 -2-3 -1 -1 2 1 2 5 F-3 -3 -4 -3 -2 -2 -4 -3 -2 -2 -1 -2 0 0 0 1 8 Y-3 -3 -2 -2 -2 2 -1 -1 -1 -2 -1 -2 0 -1 0 0 3 8 W-2 -3 -4 -3 -4 -3 -2 -2 -2-4 -3 -2-2 -3 -2 -2 1 3 15 C -3 -4 -3 -3 -2 -3 -3 -3 -3 -1 -1 -1 -2-1 -3 -2 -2 -3 -5 12 G P D E N H Q K R S T A M V I L F Y W C Homo sapiensMSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPALLLLQKQLSLPETGELDSATLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTDDRFGFCPSERLYTQDGNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFPFTFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYRFTEGPPLHKDDVNGIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPSAGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEIGNQLYLFKDGKYWRFSEGRGSRPQGPFLIADKWPALPRKLDSVFEERLSKKLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVAQVTGALRSGRGKMLLFSGRRLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTYDILQCPEDParalichthys olivaceusMRCCALAVCLVLVIVQDGWSLPLRSISVTFPGDILKNVTDTDLAETYLKRFGYLDKMHRSGFQSMVSTAKALKMMQRQMGLKETGKLDKSTLEAMKQPRCGVPDVANYQTFEGDLKWDHNDVTYRTLNYSPDMESSLIDDAFARAFKVWSDVTPLTFTRLYEGTADIMISFGKADHGDPYPFDGRNGLLAHAYPPGEGVQGDAHFDDDEHWTLGNGPAVKTLYGNADGAMCHFPFTFEGKSYTSCTTDGRTDNLPWCATTADYSRDGKYGFCPSELLYTVGGNADGAKCVFPFVFLEKEYDSCTKEGRSDGYRWCATTANFDQDQKYGFCPSRDTAVFGGNSEGEPCHFPFVFLGKEYDSCTSEGREDGKLWCSTTDNYDEDAKWGFCDDEGYSLFLVAAHEFGHALGLDHSNIREALMYPMYTYVEDFSLHKDDIEGIQYLYGRGTGPDPTPPQPTSTTTTPNPTEEPEPTTPQPVDPTRDACKLTKFDTITMIENELHFFENGNYWKMPSRGDGGLKGPFSLSERWPALPAVIDSAFEDLLTKNMYFFSGNRFWVYTKEGVLGPRSIEKLGLPTSIQKVEGALQRGKGKVLLFTEESFWKFDLKSQKMDKGYPKSTDYVFGGVPNDAHDVFQYKGHMYFCRDSFYWRMNSRRQVDRVGYVKYDLLKCSDSYRattus norvegicusMNPWQPLLLVLLALGYSFAAPHQRQPTYVVFPRDLKTSNLTDTQLAEDYLYRYGYTRAAQMMGEKQSLRPALLMLQKQLSLPQTGELDSETLKAIRSPRCGVPDVGKFQTFEGDLKWHHHNITYWIQSYTEDLPRDVIDDSFARAFAVWSAVTPLTFTRVYGLEADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGAVVPTYFGNANGAPCHFPFTFEGRSYLSCTTDGRNDGKPWCGTTADYDTDRKYGFCPSENLYTEHGNGDGKPCVFPFIFEGHSYSACTTKGRSDGYRWCATTANYDQDKLYGFCPTRADVTVTGGNSAGEMCVFPFVFLGKQYSTCTGEGRSDGRLWCATTSNFDADKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYHYHEDSPLHEDDIKGIQHLYGRGSKPDPRPPATTAAEPQPTAPPTMCPTAPPMAYPTGGPTVAPTGAPSPGPTGPPTAGPSEAPTESSTPVDNPCNVDVFDAIADIQGALHFFKDGRYWKFSNHGGSQLQGPFLIARTWPALPAKLNSAFEDPQSKKIFFFSGRKMWVYTGQTVLGPRSLDKLGLGSEVTLVTGLLPRRGGKALLISRERIWKFDL KSQKVDPQSVTRLDNEFSGVPWNSHNVFHYQDKAYFCHDKYFWRVSFHNRVNQVDHVAYVTYDLLQCPBos taurusMSPLQPLVLALLVLACCSAVPRRRQPTVVVFPGEPRTNLTNRQLAEEYLYRYGYTPGAELSEDGQSLQRALLRFQRRLSLPETGELDSTTLNAMRAPRCGVPDVGRFQTFEGELKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYGPEADIVIQFGVREHGDGYPFDGKNGLLAHAFPPGKGIQGDAHFDDEELWSLGKGVVIPTYFGNAKGAACHFPFTFEGRSYSACTTDGRSDDMLWCSTTADYDADRQFGFCPSERLYTQDGNADGKPCVFPFTFQGRTYSACTSDGRSDGYRWCATTANYDQDKLYGFCPTRVDATVTGGNAAGELCVFPFTFLGKEYSACTREGRNDGHLWCATTSNFDKDKKWGFCPDQGYSLFLVAAHEFGHALGLDHTSVPEALMYPMYRFTEEHPLHRDDVQGIQHLYGPRPEPEPRPPTTTTTTTTEPQPTAPPTVCVTGPPTARPSEGPTTGPTGPPAAGPTGPPTAGPSAAPTESPDPAEDVCNVDIFDAIAEIRNRLHFFKAGKYWRLSEGGGRRVQGPFLVKSKWPALPRKLDSAFEDPLTKKIFFFSGRQVWVYTGASLLGPRRLDKLGLGPEVAQVTGALPRPEGKVLLFSGQSFWRFDVKTQKVDPQSVTPVDQMFPGVPISTHDIFQYQEKAYFCQDHFYWRVSSQNEVNQVDYVGYVTFDLLKCPED很明顯,用兩種方法分別得到的比較結果并不完全很明顯,用兩種方法分別得到的比較結果并不完全很明顯,用兩種方法分別得到的比較結果并不完全很明顯,用兩種方法分別得到的比較結果并不完全一樣。這并不意味這一種方法比另外一種方法優(yōu)越,一樣。這并不意味這一種方法比另外一種方法優(yōu)越,一樣。這并不意味這一種方法比另外一種方法優(yōu)越,一樣。這并不意味這一種方法比另外一種方法優(yōu)越,根據(jù)實際情況,從輸入序列的性質出發(fā),應用不同根據(jù)實際情況,從輸入序列的性質出發(fā),應用不同根據(jù)實際情況,從輸入序列的性質出發(fā),應用不同根據(jù)實際情況,從輸入序列的性質出發(fā),應用不同的方法會得到不同程度的成功。的方法會得到不同程度的成功。的方法會得到不同程度的成功。的方法會得到不同程度的成功。用戶應該選擇若干用戶應該選擇若干用戶應該選擇若干用戶應該選擇若干個工具同時使用個工具同時使用個工具同時使用個工具同時使用,并且對最終的比較結果作手工修,并且對最終的比較結果作手工修,并且對最終的比較結果作手工修,并且對最終的比較結果作手工修正以期達到最佳效果。正以期達到最佳效果。正以期達到最佳效果。正以期達到最佳效果。模序比較分析模序比較分析PROSITE主講教師:趙雨杰主講教師:趙雨杰 PROSITEPROSITEPROSITEPROSITE數(shù)據(jù)庫收集了生物學有顯著意義的蛋白質位點和序數(shù)據(jù)庫收集了生物學有顯著意義的蛋白質位點和序數(shù)據(jù)庫收集了生物學有顯著意義的蛋白質位點和序數(shù)據(jù)庫收集了生物學有顯著意義的蛋白質位點和序列模式,并能根據(jù)這些位點和模式快速和可靠地鑒別一個未列模式,并能根據(jù)這些位點和模式快速和可靠地鑒別一個未列模式,并能根據(jù)這些位點和模式快速和可靠地鑒別一個未列模式,并能根據(jù)這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質序列應該屬于知功能的蛋白質序列應該屬于知功能的蛋白質序列應該屬于知功能的蛋白質序列應該屬于哪哪哪哪一個蛋白質家族。一個蛋白質家族。一個蛋白質家族。一個蛋白質家族?;诮?jīng)典的模式分析的基于經(jīng)典的模式分析的基于經(jīng)典的模式分析的基于經(jīng)典的模式分析的GribskovGribskov方法,方法,方法,方法,PROSITE PROSITE使用一種稱使用一種稱使用一種稱使用一種稱為為為為pfscanpfscan的方法尋找一個蛋白質或核酸的查詢序列同一個模的方法尋找一個蛋白質或核酸的查詢序列同一個模的方法尋找一個蛋白質或核酸的查詢序列同一個模的方法尋找一個蛋白質或核酸的查詢序列同一個模式庫的相似性,因此,在搜索中需要有模式庫。式庫的相似性,因此,在搜索中需要有模式庫。式庫的相似性,因此,在搜索中需要有模式庫。式庫的相似性,因此,在搜索中需要有模式庫。第一個是第一個是第一個是第一個是PROSITEPROSITE(http:/www.expasy.ch/prosite/http:/www.expasy.ch/prosite/),一個),一個),一個),一個ExPASyExPASy(httphttp:/www.Expasy.org/www.Expasy.org)數(shù)據(jù)庫,通過)數(shù)據(jù)庫,通過)數(shù)據(jù)庫,通過)數(shù)據(jù)庫,通過使用基序和序列模式(諸如指紋)將生物學意義重使用基序和序列模式(諸如指紋)將生物學意義重使用基序和序列模式(諸如指紋)將生物學意義重使用基序和序列模式(諸如指紋)將生物學意義重大的位點收集大的位點收集大的位點收集大的位點收集分類。分類。分類。分類。第二個是第二個是第二個是第二個是PfamPfam(http:/www.sanger.ac.uk/Software/Pfam/search.shtmlhttp:/www.sanger.ac.uk/Software/Pfam/search.shtml),收集,收集,收集,收集了蛋白質結構域家族,與其它收集方法有很大不了蛋白質結構域家族,與其它收集方法有很大不了蛋白質結構域家族,與其它收集方法有很大不了蛋白質結構域家族,與其它收集方法有很大不同的是,最初的蛋白質結構域的比較完全是用手工完成同的是,最初的蛋白質結構域的比較完全是用手工完成同的是,最初的蛋白質結構域的比較完全是用手工完成同的是,最初的蛋白質結構域的比較完全是用手工完成的,而不是依靠自動化的處理方法,正因為這樣,的,而不是依靠自動化的處理方法,正因為這樣,的,而不是依靠自動化的處理方法,正因為這樣,的,而不是依靠自動化的處理方法,正因為這樣,PfamPfam幾年前,只擁有五百多幾年前,只擁有五百多幾年前,只擁有五百多幾年前,只擁有五百多條款目,但這些款目的質條款目,但這些款目的質條款目,但這些款目的質條款目,但這些款目的質量極好?,F(xiàn)在擁有量極好?,F(xiàn)在擁有量極好?,F(xiàn)在擁有量極好?,F(xiàn)在擁有幾千條目。幾千條目。幾千條目。幾千條目?;诨诨诨赑ROSITEPROSITE和和和和PfamPfam的搜索可以通過訪問的搜索可以通過訪問的搜索可以通過訪問的搜索可以通過訪問ProfileScanProfileScan的主頁完成,它只需要一條簡單的輸入序的主頁完成,它只需要一條簡單的輸入序的主頁完成,它只需要一條簡單的輸入序的主頁完成,它只需要一條簡單的輸入序列(用文本格式),或者一個標號,比如一個列(用文本格式),或者一個標號,比如一個列(用文本格式),或者一個標號,比如一個列(用文本格式),或者一個標號,比如一個SWISS-SWISS-PROT IDPROT ID。用戶可以選擇搜索的敏感度,選擇返回顯。用戶可以選擇搜索的敏感度,選擇返回顯。用戶可以選擇搜索的敏感度,選擇返回顯。用戶可以選擇搜索的敏感度,選擇返回顯著的匹配或者所有匹配,甚至包括邊界的情況。著的匹配或者所有匹配,甚至包括邊界的情況。著的匹配或者所有匹配,甚至包括邊界的情況。著的匹配或者所有匹配,甚至包括邊界的情況。為了說明輸出的格式,我們現(xiàn)在向為了說明輸出的格式,我們現(xiàn)在向為了說明輸出的格式,我們現(xiàn)在向為了說明輸出的格式,我們現(xiàn)在向PROSITEPROSITE系統(tǒng)提系統(tǒng)提系統(tǒng)提系統(tǒng)提交人類交人類交人類交人類matrix metalloproteinase 9 preproprotein matrix metalloproteinase 9 preproprotein Homo sapiensHomo sapiens蛋白序列。返回的蛋白序列。返回的蛋白序列。返回的蛋白序列。返回的PROSITEPROSITE條目顯條目顯條目顯條目顯示蛋白的功能區(qū),數(shù)字示蛋白的功能區(qū),數(shù)字示蛋白的功能區(qū),數(shù)字示蛋白的功能區(qū),數(shù)字“Start”Start”和和和和“End”End”是顯示是顯示是顯示是顯示出查詢序列和匹配的模式重疊的位點出查詢序列和匹配的模式重疊的位點出查詢序列和匹配的模式重疊的位點出查詢序列和匹配的模式重疊的位點,Bits,Bits是序列比是序列比是序列比是序列比較可靠性評分,較可靠性評分,較可靠性評分,較可靠性評分,EvalueEvalue是序列比較錯誤概率。是序列比較錯誤概率。是序列比較錯誤概率。是序列比較錯誤概率。gi|74272287|ref|NP_004985.2|matrix metalloproteinase-9 preproprotein Homo sapiens gi|74272287|ref|NP_004985.2|matrix metalloproteinase-9 preproprotein Homo sapiens MSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPA MSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPA LLLLQKQLSLPETGELDSATLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDA LLLLQKQLSLPETGELDSATLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDA FARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELW FARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELW SLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTDDRFGFCPSERLYTQD SLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTDDRFGFCPSERLYTQD GNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFP GNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFP FTFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMY FTFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMY PMYRFTEGPPLHKDDVNGIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPS PMYRFTEGPPLHKDDVNGIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPS AGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEIGNQLYLFKDGKYWRFSEGRGSRPQGPFLIADKW AGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEIGNQLYLFKDGKYWRFSEGRGSRPQGPFLIADKW PALPRKLDSVFEERLSKKLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVAQVTGALRSGRGKMLLFSGR PALPRKLDSVFEERLSKKLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVAQVTGALRSGRGKMLLFSGR RLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTYD RLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTYD ILQCPED ILQCPED 模序比較分析模序比較分析SMARThttp:/smart.embl-heidelberg.de/主講教師:趙雨杰主講教師:趙雨杰SMARTSMARTSMARTSMARTSMARTSMART是一款簡單的分子結構檢索工具??梢杂糜谧R別和注釋是一款簡單的分子結構檢索工具。可以用于識別和注釋是一款簡單的分子結構檢索工具??梢杂糜谧R別和注釋是一款簡單的分子結構檢索工具??梢杂糜谧R別和注釋遺傳易變的結構域,還可用于結構域結構的分析,可檢測遺傳易變的結構域,還可用于結構域結構的分析,可檢測遺傳易變的結構域,還可用于結構域結構的分析,可檢測遺傳易變的結構域,還可用于結構域結構的分析,可檢測500500500500種種種種以上與信號轉導、細胞外和染色質相關蛋白的結構域家族,廣泛以上與信號轉導、細胞外和染色質相關蛋白的結構域家族,廣泛以上與信號轉導、細胞外和染色質相關蛋白的結構域家族,廣泛以上與信號轉導、細胞外和染色質相關蛋白的結構域家族,廣泛注釋這些結構域種類分布、功能分類、三級結構、功能上重要的注釋這些結構域種類分布、功能分類、三級結構、功能上重要的注釋這些結構域種類分布、功能分類、三級結構、功能上重要的注釋這些結構域種類分布、功能分類、三級結構、功能上重要的殘基。在非冗余蛋白數(shù)據(jù)庫中檢索結構域,并且檢索參數(shù)和分類殘基。在非冗余蛋白數(shù)據(jù)庫中檢索結構域,并且檢索參數(shù)和分類殘基。在非冗余蛋白數(shù)據(jù)庫中檢索結構域,并且檢索參數(shù)和分類殘基。在非冗余蛋白數(shù)據(jù)庫中檢索結構域,并且檢索參數(shù)和分類信息存儲在相關的數(shù)據(jù)系統(tǒng)中。該數(shù)據(jù)庫的用戶界面可以根據(jù)特信息存儲在相關的數(shù)據(jù)系統(tǒng)中。該數(shù)據(jù)庫的用戶界面可以根據(jù)特信息存儲在相關的數(shù)據(jù)系統(tǒng)中。該數(shù)據(jù)庫的用戶界面可以根據(jù)特信息存儲在相關的數(shù)據(jù)系統(tǒng)中。該數(shù)據(jù)庫的用戶界面可以根據(jù)特定分類單元檢索具有特殊組合結構域的蛋白。定分類單元檢索具有特殊組合結構域的蛋白。定分類單元檢索具有特殊組合結構域的蛋白。定分類單元檢索具有特殊組合結構域的蛋白。“Conserved Domains”BLAST“Conserved Domains”BLASTInterproInterpro http:/www.ebi.ac.uk/interpro/search/sequehttp:/www.ebi.ac.uk/interpro/search/sequence-searchnce-search
收藏
編號:73982957
類型:共享資源
大?。?span id="hveydqk" class="font-tahoma">115.48MB
格式:ZIP
上傳時間:2022-04-12
35
積分
- 關 鍵 詞:
-
生物信息學
本科教學課件
生物
信息學
本科
教學
課件
- 資源描述:
-
生物信息學本科教學課件,生物信息學,本科教學課件,生物,信息學,本科,教學,課件
展開閱讀全文
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。