生物信息學(xué)本科教學(xué)課件
生物信息學(xué)本科教學(xué)課件,生物信息學(xué),本科教學(xué)課件,生物,信息學(xué),本科,教學(xué),課件
蛋白序列分析方法蛋白序列分析方法主講教師:趙雨杰主講教師:趙雨杰蛋白質(zhì)分子是由許多氨基酸通過(guò)肽鍵相連形成的生蛋白質(zhì)分子是由許多氨基酸通過(guò)肽鍵相連形成的生物大分子,每種蛋白質(zhì)都有其一定的氨基酸百分組物大分子,每種蛋白質(zhì)都有其一定的氨基酸百分組成及氨基酸排列順序,以及肽鏈空間的特定排布位成及氨基酸排列順序,以及肽鏈空間的特定排布位置。因此由氨基酸排列順序及空間排布等所構(gòu)成的置。因此由氨基酸排列順序及空間排布等所構(gòu)成的蛋白質(zhì)分子結(jié)構(gòu),才能真正體現(xiàn)蛋白質(zhì)的蛋白質(zhì)分子結(jié)構(gòu),才能真正體現(xiàn)蛋白質(zhì)的個(gè)性和功個(gè)性和功能。能。組成蛋白質(zhì)的氨基酸序列為蛋白質(zhì)的一級(jí)結(jié)構(gòu),蛋白組成蛋白質(zhì)的氨基酸序列為蛋白質(zhì)的一級(jí)結(jié)構(gòu),蛋白質(zhì)的一級(jí)結(jié)構(gòu)決定了蛋白質(zhì)的性質(zhì)。組成蛋白質(zhì)氨基質(zhì)的一級(jí)結(jié)構(gòu)決定了蛋白質(zhì)的性質(zhì)。組成蛋白質(zhì)氨基酸的物理和化學(xué)性質(zhì)早已被人熟知。構(gòu)成蛋白質(zhì)的酸的物理和化學(xué)性質(zhì)早已被人熟知。構(gòu)成蛋白質(zhì)的2020種氨基酸由于化學(xué)構(gòu)造不同,在結(jié)構(gòu)和功能上具有多種氨基酸由于化學(xué)構(gòu)造不同,在結(jié)構(gòu)和功能上具有多樣性,任一殘基對(duì)蛋白質(zhì)的物理和生化性質(zhì)都會(huì)產(chǎn)生樣性,任一殘基對(duì)蛋白質(zhì)的物理和生化性質(zhì)都會(huì)產(chǎn)生影響,即影響,即序列決定構(gòu)象。構(gòu)象決定功能序列決定構(gòu)象。構(gòu)象決定功能。蛋白空間結(jié)構(gòu)預(yù)測(cè)方法主要有兩類(lèi):蛋白空間結(jié)構(gòu)預(yù)測(cè)方法主要有兩類(lèi):一、采用分子力學(xué)、分子動(dòng)力學(xué)的方法,根據(jù)物理化一、采用分子力學(xué)、分子動(dòng)力學(xué)的方法,根據(jù)物理化學(xué)的基本原理,從理論上預(yù)測(cè)蛋白質(zhì)分子的空間結(jié)構(gòu)。學(xué)的基本原理,從理論上預(yù)測(cè)蛋白質(zhì)分子的空間結(jié)構(gòu)。二、通過(guò)對(duì)已知空間結(jié)構(gòu)的蛋白質(zhì)進(jìn)行分析,找出一二、通過(guò)對(duì)已知空間結(jié)構(gòu)的蛋白質(zhì)進(jìn)行分析,找出一級(jí)結(jié)構(gòu)與空間結(jié)構(gòu)的關(guān)系,總結(jié)出規(guī)律,用于新的蛋級(jí)結(jié)構(gòu)與空間結(jié)構(gòu)的關(guān)系,總結(jié)出規(guī)律,用于新的蛋白質(zhì)空間結(jié)構(gòu)的預(yù)測(cè)。白質(zhì)空間結(jié)構(gòu)的預(yù)測(cè)。蛋白質(zhì)在線分析工具蛋白質(zhì)在線分析工具ExPASy主講教師:趙雨杰主講教師:趙雨杰ExPASy ExPASy(Expert Protein Analysis SystemExpert Protein Analysis System)ExPASyExPASy(http:/www.expasy.org/)http:/www.expasy.org/)瑞士生物信息院瑞士生物信息院提供的蛋白質(zhì)在線分析工具,包括蛋白數(shù)據(jù)庫(kù)提供的蛋白質(zhì)在線分析工具,包括蛋白數(shù)據(jù)庫(kù)(SWISS-PROT)(SWISS-PROT),蛋白分析工具等,主要用來(lái)分析蛋,蛋白分析工具等,主要用來(lái)分析蛋白序列、白序列、結(jié)構(gòu)。結(jié)構(gòu)。標(biāo)有標(biāo)有 圖標(biāo)的軟件是圖標(biāo)的軟件是ExPASyExPASy服務(wù)器服務(wù)器提供的服務(wù),未標(biāo)的是其他提供的服務(wù),未標(biāo)的是其他服務(wù)器的服務(wù)服務(wù)器的服務(wù)。ExPASyExPASy網(wǎng)站包括蛋白質(zhì)組學(xué)、網(wǎng)站包括蛋白質(zhì)組學(xué)、基因組學(xué)、基因組學(xué)、系統(tǒng)發(fā)系統(tǒng)發(fā)育、育、系統(tǒng)生物學(xué)、系統(tǒng)生物學(xué)、進(jìn)化、進(jìn)化、群體遺傳學(xué)、群體遺傳學(xué)、轉(zhuǎn)錄組學(xué)轉(zhuǎn)錄組學(xué)等不同領(lǐng)域的數(shù)據(jù)庫(kù)和分析軟件。等不同領(lǐng)域的數(shù)據(jù)庫(kù)和分析軟件。蛋白質(zhì)特征識(shí)別蛋白質(zhì)特征識(shí)別AACompIdent主講教師:趙雨杰主講教師:趙雨杰AACompIdentAACompIdentAACompIdentAACompIdent是利用未知蛋白的氨基酸組成確認(rèn)未是利用未知蛋白的氨基酸組成確認(rèn)未知蛋白質(zhì)的計(jì)算工具。如果我們手中只有蛋白的氨基知蛋白質(zhì)的計(jì)算工具。如果我們手中只有蛋白的氨基酸組成、酸組成、PIPI值和分子量,就可以利用值和分子量,就可以利用AACompIdentAACompIdent尋找相似蛋白。尋找相似蛋白。AACompIdentAACompIdent將查詢(xún)蛋白與庫(kù)中已知蛋白進(jìn)行比較,將查詢(xún)蛋白與庫(kù)中已知蛋白進(jìn)行比較,給出相似蛋白及其所打分?jǐn)?shù),分?jǐn)?shù)越低,可能性越給出相似蛋白及其所打分?jǐn)?shù),分?jǐn)?shù)越低,可能性越大。該程序需要輸入蛋白質(zhì)的氨基酸組成、等電點(diǎn)大。該程序需要輸入蛋白質(zhì)的氨基酸組成、等電點(diǎn)pIpI和蛋白質(zhì)分子量、正確的物種分類(lèi)以及特別的關(guān)和蛋白質(zhì)分子量、正確的物種分類(lèi)以及特別的關(guān)鍵詞。鍵詞。對(duì)數(shù)據(jù)庫(kù)中的每一個(gè)序列,程序算法會(huì)根據(jù)序列組成與對(duì)數(shù)據(jù)庫(kù)中的每一個(gè)序列,程序算法會(huì)根據(jù)序列組成與所查詢(xún)的組成差異打分。查詢(xún)結(jié)果由電子郵件返回,共所查詢(xún)的組成差異打分。查詢(xún)結(jié)果由電子郵件返回,共有三級(jí)列表:有三級(jí)列表:1 1、所列蛋白只考慮物種分類(lèi)不考慮、所列蛋白只考慮物種分類(lèi)不考慮pIpI和和分子量;分子量;2 2、不考慮物種分類(lèi)、不考慮、不考慮物種分類(lèi)、不考慮pIpI和分子量的全和分子量的全體蛋白;體蛋白;3 3、所列蛋白即考慮物種分類(lèi),也考慮、所列蛋白即考慮物種分類(lèi),也考慮pIpI和分和分子量;零分表明查詢(xún)序列與提出的序列完全相符。子量;零分表明查詢(xún)序列與提出的序列完全相符?,F(xiàn)把蛋白質(zhì)現(xiàn)把蛋白質(zhì)RRF-ECOLIRRF-ECOLI(P16174,Ribosome recycling factorP16174,Ribosome recycling factor)為為未知蛋白,用未知蛋白,用AACompIdentAACompIdent進(jìn)行蛋白質(zhì)辯識(shí)。將其進(jìn)行蛋白質(zhì)辯識(shí)。將其pIpI、分子量、物種、氨基酸組成輸入,氨基酸的組合方、分子量、物種、氨基酸組成輸入,氨基酸的組合方式選式選constellation 0,constellation 0,進(jìn)行查詢(xún)。電子郵件返回的進(jìn)行查詢(xún)。電子郵件返回的查詢(xún)結(jié)果。在三組列表中查詢(xún)結(jié)果。在三組列表中RRF-ECOLIRRF-ECOLI的分值最低,表的分值最低,表明所提供的未知蛋白是明所提供的未知蛋白是RRF-ECOLIRRF-ECOLI的可能性最大。的可能性最大。以e-mail 返回的RRF-ECOLI查詢(xún)結(jié)果,圖中只列出只考慮物種分類(lèi)不考慮pI和分子量和不考慮物種分類(lèi)、不考慮pI和分子量的全體蛋白的兩部分結(jié)果,第三部分省略。蛋白質(zhì)特征識(shí)別蛋白質(zhì)特征識(shí)別AACompSim主講教師:趙雨杰主講教師:趙雨杰AACompSimAACompSim提供類(lèi)似的分析,但它與提供類(lèi)似的分析,但它與AACompIdentAACompIdent以實(shí)驗(yàn)室所得的氨基酸組成為依據(jù)進(jìn)行搜索不同,以實(shí)驗(yàn)室所得的氨基酸組成為依據(jù)進(jìn)行搜索不同,AACompSimAACompSim使用使用SWISS-PROTSWISS-PROT蛋白質(zhì)的序列為依蛋白質(zhì)的序列為依據(jù)(據(jù)(Wilkinsetal.,1996Wilkinsetal.,1996),將用戶(hù)要查詢(xún)的蛋白與),將用戶(hù)要查詢(xún)的蛋白與SWISS-PROTSWISS-PROT數(shù)據(jù)庫(kù)中的蛋白質(zhì)的序列進(jìn)行比較、數(shù)據(jù)庫(kù)中的蛋白質(zhì)的序列進(jìn)行比較、辯識(shí)。檢測(cè)蛋白質(zhì)之間的關(guān)系。辯識(shí)。檢測(cè)蛋白質(zhì)之間的關(guān)系。與與AACompIdentAACompIdent算法類(lèi)似,該算法也提供了算法類(lèi)似,該算法也提供了4 4種氨種氨基酸的組合方式(基酸的組合方式(constellationconstellation)供用戶(hù)選擇,查詢(xún))供用戶(hù)選擇,查詢(xún)時(shí)用戶(hù)需要在時(shí)用戶(hù)需要在4 4種氨基酸組合中挑選其一,輸入所要種氨基酸組合中挑選其一,輸入所要查詢(xún)蛋白的查詢(xún)蛋白的SWISS-PROTIDSWISS-PROTID,所需比較條目的物種,所需比較條目的物種,按按SUBMITSUBMIT鍵即完成查詢(xún)。鍵即完成查詢(xún)。The closest SWISS-PROT entries(in terms of AA composition)The closest SWISS-PROT entries(in terms of AA composition)for the species ECOLI:for the species ECOLI:Rank Score Protein (pI Mw)DescriptionRank Score Protein (pI Mw)Description=1 0 RRF_ECOLI 6.44 20639 Ribosome-recycling factor.1 0 RRF_ECOLI 6.44 20639 Ribosome-recycling factor.2 33 HFLC_ECOLI 6.30 37650 Modulator of FtsH protease 2 33 HFLC_ECOLI 6.30 37650 Modulator of FtsH protease HflC.HflC.3 33 DNAB_ECOLI 4.93 52390 Replicative DNA helicase.3 33 DNAB_ECOLI 4.93 52390 Replicative DNA helicase.4 37 INTA_ECOLI 9.61 46652 Prophage CP4-57 integrase.4 37 INTA_ECOLI 9.61 46652 Prophage CP4-57 integrase.The closest SWISS-PROT entries(in terms of AA composition)The closest SWISS-PROT entries(in terms of AA composition)for any species:for any species:Rank Score Protein (pI Mw)DescriptionRank Score Protein (pI Mw)Description=1 0 RRF_ECO24 6.44 20639 Ribosome-recycling factor.1 0 RRF_ECO24 6.44 20639 Ribosome-recycling factor.2 0 RRF_ECO27 6.44 20639 Ribosome-recycling factor.2 0 RRF_ECO27 6.44 20639 Ribosome-recycling factor.3 0 RRF_ECO45 6.44 20639 Ribosome-recycling factor.3 0 RRF_ECO45 6.44 20639 Ribosome-recycling factor.4 0 RRF_ECO55 6.44 20639 Ribosome-recycling factor.4 0 RRF_ECO55 6.44 20639 Ribosome-recycling factor.5 0 RRF_ECO57 6.44 20639 Ribosome-recycling factor.5 0 RRF_ECO57 6.44 20639 Ribosome-recycling factor.The closest SWISS-PROT entries(in terms of AA composition)The closest SWISS-PROT entries(in terms of AA composition)and having pI and Mw values in the specified rangeand having pI and Mw values in the specified range for the species ECOLI:for the species ECOLI:Rank Score Protein (pI Mw)DescriptionRank Score Protein (pI Mw)Description=1 0 RRF_ECOLI 6.44 20639 Ribosome-recycling factor.1 0 RRF_ECOLI 6.44 20639 Ribosome-recycling factor.2 75 IDNK_ECOLI 6.52 21004 Thermosensitive gluconokinase.2 75 IDNK_ECOLI 6.52 21004 Thermosensitive gluconokinase.3 78 HYCB_ECOLI 6.57 21873 Formate hydrogenlyase subunit 2.3 78 HYCB_ECOLI 6.57 21873 Formate hydrogenlyase subunit 2.4 82 YHJB_ECOLI 6.32 22604 Putative HTH-type transcriptional 4 82 YHJB_ECOLI 6.32 22604 Putative HTH-type transcriptional蛋白質(zhì)質(zhì)譜分析蛋白質(zhì)質(zhì)譜分析MS-Fit主講教師:趙雨杰主講教師:趙雨杰MS-FitMS-Fit(http(http:/prospector.ucsf.edu/prospector/cgi-bin/msform.cgi?form=msfitstandard):/prospector.ucsf.edu/prospector/cgi-bin/msform.cgi?form=msfitstandard)是是利用質(zhì)譜(利用質(zhì)譜(MSMS)技術(shù)獲得信息,通過(guò)測(cè)出被特定)技術(shù)獲得信息,通過(guò)測(cè)出被特定蛋白酶消化得到的肽段進(jìn)行數(shù)據(jù)庫(kù)比較來(lái)進(jìn)行蛋白蛋白酶消化得到的肽段進(jìn)行數(shù)據(jù)庫(kù)比較來(lái)進(jìn)行蛋白質(zhì)辯識(shí)的計(jì)算工具,由于該方法不需全部或部分測(cè)質(zhì)辯識(shí)的計(jì)算工具,由于該方法不需全部或部分測(cè)序,顯著的減少了實(shí)驗(yàn)時(shí)間。序,顯著的減少了實(shí)驗(yàn)時(shí)間。3861.7383127.8482669.3372391.2132204.2112052.0261660.6531377.4651307.6791266.5941239.6261208.6311120.4871113.591095.4891077.6281064.545978.4495956.5523875.4581864.4066853.3509823.358782.292752.3573729.4617709.4104653.3478611.326538.2732518.1962蛋白序列物理性質(zhì)計(jì)算蛋白序列物理性質(zhì)計(jì)算Compute pI/Mw主講教師:趙雨杰主講教師:趙雨杰Compute pI/MwCompute pI/Mw是計(jì)算輸入序列等電點(diǎn)和分子量的工是計(jì)算輸入序列等電點(diǎn)和分子量的工具。分子量的計(jì)算是把序列中每個(gè)氨基酸的平均分子具。分子量的計(jì)算是把序列中每個(gè)氨基酸的平均分子量加在一起,在加上一個(gè)水分子的分子量。該計(jì)算工量加在一起,在加上一個(gè)水分子的分子量。該計(jì)算工具使用時(shí)非常簡(jiǎn)單,用戶(hù)可上網(wǎng)輸入查詢(xún)序列。具使用時(shí)非常簡(jiǎn)單,用戶(hù)可上網(wǎng)輸入查詢(xún)序列??捎枚N方法輸入可用二種方法輸入 1 1、把序列整理為、把序列整理為FASTAFASTA格式,該工具會(huì)自動(dòng)計(jì)算全序列格式,該工具會(huì)自動(dòng)計(jì)算全序列的的pIpI值和分子量;值和分子量;2 2、提供、提供SWISS-PROTSWISS-PROT標(biāo)識(shí),即標(biāo)識(shí),即IDACIDAC(如:(如:P04406P04406)。結(jié))。結(jié)果中該工具不僅給出果中該工具不僅給出pIpI值和分子量,還提供該條目的描值和分子量,還提供該條目的描述和物種記錄。述和物種記錄?,F(xiàn)以現(xiàn)以3-3-磷酸甘油醛脫氫酶(磷酸甘油醛脫氫酶(G3P2-HUMANG3P2-HUMAN,P04406P04406)為例,查詢(xún)其分子量和為例,查詢(xún)其分子量和pIpI值,結(jié)果如下:值,結(jié)果如下:gi|120649|sp|P04406.3|G3P_HUMANRecName:Full=Glyceraldehyde-3-phosphatedehydrogenase;gi|120649|sp|P04406.3|G3P_HUMANRecName:Full=Glyceraldehyde-3-phosphatedehydrogenase;Short=GAPDH;AltName:Full=Peptidyl-cysteineS-nitrosylaseGAPDHShort=GAPDH;AltName:Full=Peptidyl-cysteineS-nitrosylaseGAPDHMGKVKVGVNGFGRIGRLVTRAAFNSGKVDIVAINDPFIDLNYMVYMFQYDSTHGKFHGTVKAENGKLVINMGKVKVGVNGFGRIGRLVTRAAFNSGKVDIVAINDPFIDLNYMVYMFQYDSTHGKFHGTVKAENGKLVINGNPITIFQERDPSKIKWGDAGAEYVVESTGVFTTMEKAGAHLQGGAKRVIISAPSADAPMFVMGVNHEKYGNPITIFQERDPSKIKWGDAGAEYVVESTGVFTTMEKAGAHLQGGAKRVIISAPSADAPMFVMGVNHEKYDNSLKIISNASCTTNCLAPLAKVIHDNFGIVEGLMTTVHAITATQKTVDGPSGKLWRDGRGALQNIIPASDNSLKIISNASCTTNCLAPLAKVIHDNFGIVEGLMTTVHAITATQKTVDGPSGKLWRDGRGALQNIIPASTGAAKAVGKVIPELNGKLTGMAFRVPTANVSVVDLTCRLEKPAKYDDIKKVVKQASEGPLKGILGYTEHQTGAAKAVGKVIPELNGKLTGMAFRVPTANVSVVDLTCRLEKPAKYDDIKKVVKQASEGPLKGILGYTEHQVVSSDFNSDTHSSTFDAGAGIALNDHFVKLISWYDNEFGYSNRVVDLMAHMASKEVVSSDFNSDTHSSTFDAGAGIALNDHFVKLISWYDNEFGYSNRVVDLMAHMASKE蛋白序列酶切分析蛋白序列酶切分析PeptideMass主講教師:趙雨杰主講教師:趙雨杰PeptideMassPeptideMass工具針對(duì)肽段圖譜進(jìn)行分析,主要用來(lái)工具針對(duì)肽段圖譜進(jìn)行分析,主要用來(lái)預(yù)測(cè)分析蛋白質(zhì)在與特定的蛋白酶或化學(xué)試劑作用預(yù)測(cè)分析蛋白質(zhì)在與特定的蛋白酶或化學(xué)試劑作用下的內(nèi)切產(chǎn)物(下的內(nèi)切產(chǎn)物(Wilkins et al.,1997Wilkins et al.,1997)。這些蛋)。這些蛋白酶和試劑包括:胰蛋白酶白酶和試劑包括:胰蛋白酶(trysin)(trysin)、糜蛋白酶、糜蛋白酶(chymotrypsin)(chymotrypsin)、LysCLysC、Arg CArg C、Asp NAsp N、Glu CGlu C(雙碳酸酯或磷酸酯)和溴化氰。半胱氨酸和甲硫(雙碳酸酯或磷酸酯)和溴化氰。半胱氨酸和甲硫氨酸可在計(jì)算產(chǎn)物肽段之前加以修飾。氨酸可在計(jì)算產(chǎn)物肽段之前加以修飾。蛋白質(zhì)序列統(tǒng)計(jì)分析蛋白質(zhì)序列統(tǒng)計(jì)分析ProtParam主講教師:趙雨杰主講教師:趙雨杰ProtParamProtParam是一個(gè)計(jì)算各種物理和化學(xué)的參數(shù)工具是一個(gè)計(jì)算各種物理和化學(xué)的參數(shù)工具,可以分析存儲(chǔ)在可以分析存儲(chǔ)在Swiss-ProtTrEMBLSwiss-ProtTrEMBL數(shù)據(jù)庫(kù)中的蛋白數(shù)據(jù)庫(kù)中的蛋白質(zhì)或用戶(hù)輸入的蛋白質(zhì)序列。計(jì)算參數(shù)包括分子量、質(zhì)或用戶(hù)輸入的蛋白質(zhì)序列。計(jì)算參數(shù)包括分子量、理論理論pIpI值、氨基酸組成、原子組成、消光系數(shù)、半值、氨基酸組成、原子組成、消光系數(shù)、半衰期衰期,不穩(wěn)定指數(shù)、脂肪指數(shù)和總體平均親水性。不穩(wěn)定指數(shù)、脂肪指數(shù)和總體平均親水性。gi|15718761|ref|NP_004976.2|c-K-ras2proteinisoformbgi|15718761|ref|NP_004976.2|c-K-ras2proteinisoformbprecursorHomosapiensprecursorHomosapiensMTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYMTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGETCLLDILDTAGQEEYSAMRDQRKQVVIDGETCLLDILDTAGQEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHHYREQIKRVKDSEDVPYMRTGEGFLCVFAINNTKSFEDIHHYREQIKRVKDSEDVPMVLVGNKCDLPSRTVDTKQAQDLARSYGIPMVLVGNKCDLPSRTVDTKQAQDLARSYGIPFIETSAKTRQGVDDAFYTLVREIRKHKEKMSKDGKKKKKKFIETSAKTRQGVDDAFYTLVREIRKHKEKMSKDGKKKKKKSKTKCVIMSKTKCVIM蛋白質(zhì)二級(jí)結(jié)構(gòu)分析蛋白質(zhì)二級(jí)結(jié)構(gòu)分析主講教師:趙雨杰主講教師:趙雨杰蛋白二級(jí)結(jié)構(gòu)和折疊類(lèi)型蛋白二級(jí)結(jié)構(gòu)和折疊類(lèi)型蛋白二級(jí)結(jié)構(gòu)和折疊類(lèi)型蛋白二級(jí)結(jié)構(gòu)和折疊類(lèi)型蛋白質(zhì)的二級(jí)結(jié)構(gòu)是指蛋白質(zhì)分子中某一段肽鏈的蛋白質(zhì)的二級(jí)結(jié)構(gòu)是指蛋白質(zhì)分子中某一段肽鏈的局部空間結(jié)構(gòu)。主要為局部空間結(jié)構(gòu)。主要為-螺旋螺旋(-helix)(-helix)、-折折疊疊(-pleated sheet)(-pleated sheet)、轉(zhuǎn)角轉(zhuǎn)角(-turn)(-turn)、無(wú)規(guī)則、無(wú)規(guī)則彎曲彎曲(random coil)(random coil)。在許多蛋白質(zhì)分子中,可發(fā)現(xiàn)二個(gè)或三個(gè)具有二級(jí)在許多蛋白質(zhì)分子中,可發(fā)現(xiàn)二個(gè)或三個(gè)具有二級(jí)結(jié)構(gòu)的肽段,在空間上相互接近,形成一個(gè)具有特結(jié)構(gòu)的肽段,在空間上相互接近,形成一個(gè)具有特殊功能的空間結(jié)構(gòu),殊功能的空間結(jié)構(gòu),稱(chēng)為稱(chēng)為模序模序(motifmotif)。一)。一個(gè)模序個(gè)模序總有其特征性的氨基酸序列,并發(fā)揮特殊的功能總有其特征性的氨基酸序列,并發(fā)揮特殊的功能。一級(jí)結(jié)構(gòu)是二級(jí)結(jié)構(gòu)的基礎(chǔ),有時(shí)蛋白質(zhì)分子中起一級(jí)結(jié)構(gòu)是二級(jí)結(jié)構(gòu)的基礎(chǔ),有時(shí)蛋白質(zhì)分子中起關(guān)鍵作用的氨基酸殘基缺失或被替代,都會(huì)嚴(yán)重影關(guān)鍵作用的氨基酸殘基缺失或被替代,都會(huì)嚴(yán)重影響空間構(gòu)象乃至生理功能,如由蛋白質(zhì)分子發(fā)生變響空間構(gòu)象乃至生理功能,如由蛋白質(zhì)分子發(fā)生變異產(chǎn)生的異產(chǎn)生的“分子病分子病”。研究蛋白質(zhì)的二級(jí)結(jié)構(gòu)對(duì)蛋。研究蛋白質(zhì)的二級(jí)結(jié)構(gòu)對(duì)蛋白質(zhì)空間結(jié)構(gòu)的確定、設(shè)計(jì)合理的生物化學(xué)實(shí)驗(yàn)有白質(zhì)空間結(jié)構(gòu)的確定、設(shè)計(jì)合理的生物化學(xué)實(shí)驗(yàn)有重要意義。重要意義。有關(guān)已知蛋白質(zhì)性質(zhì)和結(jié)構(gòu)的有關(guān)信息可以到有關(guān)已知蛋白質(zhì)性質(zhì)和結(jié)構(gòu)的有關(guān)信息可以到SWISS-PROTSWISS-PROT或或PHDPHD數(shù)據(jù)庫(kù)中查找。對(duì)新發(fā)現(xiàn)的蛋白數(shù)據(jù)庫(kù)中查找。對(duì)新發(fā)現(xiàn)的蛋白質(zhì)或未知功能的基因產(chǎn)物進(jìn)行分析,首先用質(zhì)或未知功能的基因產(chǎn)物進(jìn)行分析,首先用BLASTBLAST或其他工具在公共數(shù)據(jù)庫(kù)中進(jìn)行相似性搜索,尋或其他工具在公共數(shù)據(jù)庫(kù)中進(jìn)行相似性搜索,尋找相匹配的蛋白質(zhì),但很多時(shí)候無(wú)法找到匹配蛋找相匹配的蛋白質(zhì),但很多時(shí)候無(wú)法找到匹配蛋白質(zhì),有時(shí)雖然找到一個(gè)統(tǒng)計(jì)顯著的匹配蛋白質(zhì),白質(zhì),有時(shí)雖然找到一個(gè)統(tǒng)計(jì)顯著的匹配蛋白質(zhì),序列記錄中也沒(méi)有有關(guān)其二級(jí)結(jié)構(gòu)的信息。序列記錄中也沒(méi)有有關(guān)其二級(jí)結(jié)構(gòu)的信息。利用二級(jí)結(jié)構(gòu)和折疊類(lèi)型的預(yù)算工具可以預(yù)測(cè)出序利用二級(jí)結(jié)構(gòu)和折疊類(lèi)型的預(yù)算工具可以預(yù)測(cè)出序列折疊成列折疊成螺旋和螺旋和折疊的能力,可能存在的基序折疊的能力,可能存在的基序以及功能結(jié)構(gòu)域。以及功能結(jié)構(gòu)域。同核酸序列預(yù)測(cè)程序一樣,在蛋同核酸序列預(yù)測(cè)程序一樣,在蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)中許多計(jì)算程序采取了白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)中許多計(jì)算程序采取了“神經(jīng)網(wǎng)神經(jīng)網(wǎng)絡(luò)絡(luò)”技術(shù),即給計(jì)算過(guò)程賦予類(lèi)似人的學(xué)習(xí)能力,技術(shù),即給計(jì)算過(guò)程賦予類(lèi)似人的學(xué)習(xí)能力,使用了數(shù)據(jù)庫(kù)中的已知數(shù)據(jù)作為訓(xùn)練集使用了數(shù)據(jù)庫(kù)中的已知數(shù)據(jù)作為訓(xùn)練集。有關(guān)的二級(jí)結(jié)構(gòu)的計(jì)算程序有很多,其中有商用軟有關(guān)的二級(jí)結(jié)構(gòu)的計(jì)算程序有很多,其中有商用軟件,也有在線提供的免費(fèi)軟件,有些僅限用于件,也有在線提供的免費(fèi)軟件,有些僅限用于UNIXUNIX機(jī)上。如果不是大量序列分析,使用再線工具就夠機(jī)上。如果不是大量序列分析,使用再線工具就夠了。了。ExPASyExPASy上的上的protemics toolsprotemics tools提供了許多二級(jí)結(jié)提供了許多二級(jí)結(jié)構(gòu)預(yù)測(cè)工具,構(gòu)預(yù)測(cè)工具,這里只介紹這里只介紹Jpred 4Jpred 4、Scratch Scratch Protein PredictorProtein Predictor和和CFSSPCFSSP四種計(jì)算四種計(jì)算工具。工具。蛋白質(zhì)二級(jí)結(jié)構(gòu)分析蛋白質(zhì)二級(jí)結(jié)構(gòu)分析Jpred 4主講教師:趙雨杰主講教師:趙雨杰蛋白質(zhì)二級(jí)結(jié)構(gòu)分析蛋白質(zhì)二級(jí)結(jié)構(gòu)分析Scratch Protein Predictor主講教師:趙雨杰主講教師:趙雨杰蛋白質(zhì)二級(jí)結(jié)構(gòu)分析蛋白質(zhì)二級(jí)結(jié)構(gòu)分析CFSSP主講教師:趙雨杰主講教師:趙雨杰各種方法的比較各種方法的比較各種方法的比較各種方法的比較 上訴所有的方法在預(yù)測(cè)二級(jí)結(jié)構(gòu)方面都不錯(cuò),但均上訴所有的方法在預(yù)測(cè)二級(jí)結(jié)構(gòu)方面都不錯(cuò),但均不完美。各種方法對(duì)不同的實(shí)例表現(xiàn)不同,由于沒(méi)不完美。各種方法對(duì)不同的實(shí)例表現(xiàn)不同,由于沒(méi)有更多的信息可用來(lái)判斷哪種方法更好,最好是把有更多的信息可用來(lái)判斷哪種方法更好,最好是把序列提交給多個(gè)服務(wù)器,將結(jié)果匯集整理,通過(guò)人序列提交給多個(gè)服務(wù)器,將結(jié)果匯集整理,通過(guò)人為的比較來(lái)判斷哪種結(jié)果成立或不成立。為的比較來(lái)判斷哪種結(jié)果成立或不成立。蛋白跨膜區(qū)域預(yù)測(cè)蛋白跨膜區(qū)域預(yù)測(cè) 主講教師:趙雨杰主講教師:趙雨杰就象就象螺旋和螺旋和折疊的位置可以較為準(zhǔn)確地預(yù)測(cè)出折疊的位置可以較為準(zhǔn)確地預(yù)測(cè)出來(lái)一樣,其它特定的結(jié)構(gòu)或結(jié)構(gòu)特征,如跨膜區(qū)域來(lái)一樣,其它特定的結(jié)構(gòu)或結(jié)構(gòu)特征,如跨膜區(qū)域和信號(hào)肽等也可以預(yù)測(cè)出來(lái)。由于這些結(jié)構(gòu)或結(jié)構(gòu)和信號(hào)肽等也可以預(yù)測(cè)出來(lái)。由于這些結(jié)構(gòu)或結(jié)構(gòu)特征的折疊規(guī)律尚不十分清楚,有關(guān)軟件越來(lái)越多,特征的折疊規(guī)律尚不十分清楚,有關(guān)軟件越來(lái)越多,下面就下面就ExPASy ExPASy 上相關(guān)工具進(jìn)行介紹。上相關(guān)工具進(jìn)行介紹。對(duì)于跨膜蛋白中跨膜區(qū)域的預(yù)測(cè),對(duì)蛋白質(zhì)的性質(zhì)對(duì)于跨膜蛋白中跨膜區(qū)域的預(yù)測(cè),對(duì)蛋白質(zhì)的性質(zhì)十分重要。一旦確定了跨膜蛋白的跨膜區(qū)域,我們十分重要。一旦確定了跨膜蛋白的跨膜區(qū)域,我們就可以對(duì)跨膜區(qū)域的氨基酸殘基順序、官能團(tuán)性質(zhì)、就可以對(duì)跨膜區(qū)域的氨基酸殘基順序、官能團(tuán)性質(zhì)、可能的立體結(jié)構(gòu)進(jìn)行研究,以確定蛋白質(zhì)在細(xì)胞信可能的立體結(jié)構(gòu)進(jìn)行研究,以確定蛋白質(zhì)在細(xì)胞信號(hào)傳導(dǎo)機(jī)制、細(xì)胞識(shí)別等方面的生物功能,關(guān)于跨號(hào)傳導(dǎo)機(jī)制、細(xì)胞識(shí)別等方面的生物功能,關(guān)于跨膜區(qū)域,網(wǎng)上提供了許多專(zhuān)門(mén)預(yù)測(cè)軟件。膜區(qū)域,網(wǎng)上提供了許多專(zhuān)門(mén)預(yù)測(cè)軟件。已知已知G G蛋白偶聯(lián)受體有蛋白偶聯(lián)受體有7 7個(gè)跨膜區(qū)域,從個(gè)跨膜區(qū)域,從SWISS-PROTSWISS-PROT中查得這中查得這7 7個(gè)跨膜區(qū)域的位置分別在個(gè)跨膜區(qū)域的位置分別在82.32482.324。下面。下面以此為例分別用以此為例分別用DASDAS和和TMpredTMpred應(yīng)用程序預(yù)測(cè)跨膜區(qū)域。應(yīng)用程序預(yù)測(cè)跨膜區(qū)域。gi|2656121|gb|AAB88017.1|G-protein coupled receptor Homo sapiens gi|2656121|gb|AAB88017.1|G-protein coupled receptor Homo sapiens MDVTSQARGVGLEMYPGTAQPAAPNTTSPELNLSHPLLGTALANGTGELSEHQQYVIGLFLSCLYTIFLF MDVTSQARGVGLEMYPGTAQPAAPNTTSPELNLSHPLLGTALANGTGELSEHQQYVIGLFLSCLYTIFLF PIGFVGNILILVVNISFREKMTIPDLYFINLAVADLILVADSLIEVFNLHERYYDIAVLCTFMSLFLQVN PIGFVGNILILVVNISFREKMTIPDLYFINLAVADLILVADSLIEVFNLHERYYDIAVLCTFMSLFLQVN MYSSVFFLTWMSFDRYIALARAMRCSLFRTKHHARLSCGLIWMASVSATLVPFTAVHLQHTDEACFCFAD MYSSVFFLTWMSFDRYIALARAMRCSLFRTKHHARLSCGLIWMASVSATLVPFTAVHLQHTDEACFCFAD VREVQWLEVTLGFIVPFAIIGLCYSLIVRVLVRAHRHRGLRPRRQKALRMILAVVLVFFVCWLPENVFIS VREVQWLEVTLGFIVPFAIIGLCYSLIVRVLVRAHRHRGLRPRRQKALRMILAVVLVFFVCWLPENVFIS VHLLQRTQPGAAPCKQSFRHAHPLTGHIVNLAAFSNSCLNPLIYSFLGETFRDKLRLYIEQKTNLPALNR VHLLQRTQPGAAPCKQSFRHAHPLTGHIVNLAAFSNSCLNPLIYSFLGETFRDKLRLYIEQKTNLPALNR FCHAALKAVIPDSTEQSDVRFSSAVFCHAALKAVIPDSTEQSDVRFSSAVDASDASDASDAS的界面(的界面(http:/www.sbc.su.se/miklos/DAS/http:/www.sbc.su.se/miklos/DAS/)十分簡(jiǎn)潔,用戶(hù)只需將查詢(xún)序列輸入序列文本框即可。十分簡(jiǎn)潔,用戶(hù)只需將查詢(xún)序列輸入序列文本框即可。TMpredTMpredTMpredTMpred是專(zhuān)門(mén)預(yù)測(cè)跨膜區(qū)的方法:它依靠一個(gè)源自是專(zhuān)門(mén)預(yù)測(cè)跨膜區(qū)的方法:它依靠一個(gè)源自Swiss-ProtSwiss-Prot的跨膜蛋白數(shù)據(jù)庫(kù)的跨膜蛋白數(shù)據(jù)庫(kù)TMbaseTMbase,內(nèi)含每個(gè)序,內(nèi)含每個(gè)序列的一些附加信息:跨膜結(jié)構(gòu)區(qū)域的數(shù)量、跨膜結(jié)列的一些附加信息:跨膜結(jié)構(gòu)區(qū)域的數(shù)量、跨膜結(jié)構(gòu)域的位置及其側(cè)翼序列的情況。構(gòu)域的位置及其側(cè)翼序列的情況。TMpredTMpred利用這些利用這些信息并與若干加權(quán)矩陣結(jié)合起來(lái)進(jìn)行預(yù)測(cè)。信息并與若干加權(quán)矩陣結(jié)合起來(lái)進(jìn)行預(yù)測(cè)。預(yù)測(cè)在預(yù)測(cè)在TMpredTMpred的的WebWeb界面上完成。用戶(hù)輸入用單字符界面上完成。用戶(hù)輸入用單字符表示的查詢(xún)序列,并可以指定預(yù)測(cè)時(shí)采用的跨膜螺表示的查詢(xún)序列,并可以指定預(yù)測(cè)時(shí)采用的跨膜螺旋疏水區(qū)的最小長(zhǎng)度和最大長(zhǎng)度。旋疏水區(qū)的最小長(zhǎng)度和最大長(zhǎng)度。TMpredTMpred輸出結(jié)果輸出結(jié)果包括:可能的跨膜螺旋區(qū)、相關(guān)性列表、建議的跨包括:可能的跨膜螺旋區(qū)、相關(guān)性列表、建議的跨膜拓?fù)淠P鸵约笆疽鈭D。如果用膜拓?fù)淠P鸵约笆疽鈭D。如果用G G蛋白偶聯(lián)受體作查蛋白偶聯(lián)受體作查詢(xún)序列,得到如下結(jié)果:詢(xún)序列,得到如下結(jié)果:在在每每種種建建議議的的模模型型中中TMpredTMpred都都指指出出跨跨膜膜段段的的起起始始位位點(diǎn)點(diǎn)和和終終止止位位點(diǎn)點(diǎn),TMpredTMpred對(duì)對(duì)所所預(yù)預(yù)測(cè)測(cè)結(jié)結(jié)果果所所打打的的分分?jǐn)?shù)數(shù)(只只有有大大于于500500分分才才認(rèn)認(rèn)為為是是特特異異的的),膜膜的的取取向向:內(nèi)內(nèi)外外或或外外內(nèi)。算法假設(shè)全部跨膜區(qū)在預(yù)測(cè)中都被找到。內(nèi)。算法假設(shè)全部跨膜區(qū)在預(yù)測(cè)中都被找到。其它跨膜預(yù)測(cè)計(jì)算工具的應(yīng)用與上述兩個(gè)類(lèi)似,用戶(hù)其它跨膜預(yù)測(cè)計(jì)算工具的應(yīng)用與上述兩個(gè)類(lèi)似,用戶(hù)可以采用多種工具計(jì)算,然后進(jìn)行比較,以得到一個(gè)可以采用多種工具計(jì)算,然后進(jìn)行比較,以得到一個(gè)比較滿(mǎn)意的結(jié)果。比較滿(mǎn)意的結(jié)果。信號(hào)肽預(yù)測(cè)信號(hào)肽預(yù)測(cè) 主講教師:趙雨杰主講教師:趙雨杰信號(hào)肽信號(hào)肽信號(hào)肽信號(hào)肽信號(hào)肽是未成熟蛋白質(zhì)中,可被細(xì)胞轉(zhuǎn)運(yùn)系統(tǒng)識(shí)別信號(hào)肽是未成熟蛋白質(zhì)中,可被細(xì)胞轉(zhuǎn)運(yùn)系統(tǒng)識(shí)別的特征氨基酸序列。蛋白質(zhì)在核蛋白體合成后要靶的特征氨基酸序列。蛋白質(zhì)在核蛋白體合成后要靶向輸送到其執(zhí)行功能的目標(biāo)地點(diǎn)。穿過(guò)合成所在細(xì)向輸送到其執(zhí)行功能的目標(biāo)地點(diǎn)。穿過(guò)合成所在細(xì)胞到其他組織細(xì)胞中的蛋白質(zhì)統(tǒng)稱(chēng)為分泌性蛋白質(zhì)。胞到其他組織細(xì)胞中的蛋白質(zhì)統(tǒng)稱(chēng)為分泌性蛋白質(zhì)。分泌性蛋白上有一段疏水性氨基酸較多的肽段,稱(chēng)分泌性蛋白上有一段疏水性氨基酸較多的肽段,稱(chēng)為為信號(hào)肽信號(hào)肽(signal peptidesignal peptide),其作用是把合成的),其作用是把合成的蛋白質(zhì)移向細(xì)胞膜并與胞膜結(jié)合,然后把合成蛋白蛋白質(zhì)移向細(xì)胞膜并與胞膜結(jié)合,然后把合成蛋白送出胞外。送出胞外。對(duì)相當(dāng)多的信號(hào)肽進(jìn)行過(guò)一級(jí)結(jié)構(gòu)的分析,發(fā)現(xiàn)它們對(duì)相當(dāng)多的信號(hào)肽進(jìn)行過(guò)一級(jí)結(jié)構(gòu)的分析,發(fā)現(xiàn)它們的的共同特點(diǎn)共同特點(diǎn):一般由一般由1010多個(gè)至多個(gè)至4040多個(gè)氨基酸殘基組成,多個(gè)氨基酸殘基組成,大致分為三個(gè)區(qū)段。大致分為三個(gè)區(qū)段。N N端有帶正電荷的氨基酸,如賴(lài)端有帶正電荷的氨基酸,如賴(lài)氨酸和精氨酸,稱(chēng)為堿性氨基末端。中間較大的或更氨酸和精氨酸,稱(chēng)為堿性氨基末端。中間較大的或更多的以中性氨基酸為主組成疏水核心區(qū),常見(jiàn)有亮氨多的以中性氨基酸為主組成疏水核心區(qū),常見(jiàn)有亮氨酸、異亮氨酸等。酸、異亮氨酸等。C C端含有小分子如甘、丙、絲氨酸端含有小分子如甘、丙、絲氨酸較多,是被信號(hào)肽酶剪切的部位,稱(chēng)為加工區(qū)。較多,是被信號(hào)肽酶剪切的部位,稱(chēng)為加工區(qū)。SignalPSignalPSignalPSignalP是網(wǎng)上免費(fèi)使用用來(lái)檢測(cè)信號(hào)肽及其剪切位點(diǎn)是網(wǎng)上免費(fèi)使用用來(lái)檢測(cè)信號(hào)肽及其剪切位點(diǎn)的計(jì)算工具,主要適用于分泌型信號(hào)肽,而不是參與細(xì)的計(jì)算工具,主要適用于分泌型信號(hào)肽,而不是參與細(xì)胞內(nèi)信號(hào)傳遞的蛋白。它也采用了神經(jīng)網(wǎng)絡(luò)方法,用已胞內(nèi)信號(hào)傳遞的蛋白。它也采用了神經(jīng)網(wǎng)絡(luò)方法,用已知信號(hào)序列的革蘭氏陰性原核生物、革蘭氏陽(yáng)性原核生知信號(hào)序列的革蘭氏陰性原核生物、革蘭氏陽(yáng)性原核生物及真核生物的序列分別作為訓(xùn)練集。物及真核生物的序列分別作為訓(xùn)練集。http:/www.cbs.dtu.dk/services/SignalPhttp:/www.cbs.dtu.dk/services/SignalP用戶(hù)可以在序列輸入窗口里輸入待查詢(xún)的氨用戶(hù)可以在序列輸入窗口里輸入待查詢(xún)的氨基酸序列,也可以在選擇文件窗口輸入文本基酸序列,也可以在選擇文件窗口輸入文本格式的序列文件。利用該預(yù)測(cè)工具,用戶(hù)每格式的序列文件。利用該預(yù)測(cè)工具,用戶(hù)每天可處理天可處理20002000個(gè)氨基酸序列,每個(gè)序列不超個(gè)氨基酸序列,每個(gè)序列不超過(guò)過(guò)40004000個(gè)氨基酸??梢赃M(jìn)行多序列預(yù)測(cè)。個(gè)氨基酸。可以進(jìn)行多序列預(yù)測(cè)。SignalPSignalP給出三種輸出結(jié)果:革蘭氏陰性原核生物、給出三種輸出結(jié)果:革蘭氏陰性原核生物、革蘭氏陽(yáng)性原核生物及真核生物的序列作為訓(xùn)練集革蘭氏陽(yáng)性原核生物及真核生物的序列作為訓(xùn)練集的計(jì)算結(jié)果。輸出結(jié)果分為兩部分:的計(jì)算結(jié)果。輸出結(jié)果分為兩部分:1 1、SignalPSignalP對(duì)序列各個(gè)氨基酸位點(diǎn)打分。對(duì)序列各個(gè)氨基酸位點(diǎn)打分。2 2、SignalPSignalP最后的預(yù)測(cè)結(jié)果。最后的預(yù)測(cè)結(jié)果。第一部分中:第一部分中:C C是原始剪切位點(diǎn)的分值;是原始剪切位點(diǎn)的分值;S S是信號(hào)肽的是信號(hào)肽的分值;分值;Y Y是前兩項(xiàng)的綜合分值,表明該位點(diǎn)具有高是前兩項(xiàng)的綜合分值,表明該位點(diǎn)具有高C C分分而而S S分又從高轉(zhuǎn)低的特性。對(duì)于典型的信號(hào)肽,分又從高轉(zhuǎn)低的特性。對(duì)于典型的信號(hào)肽,C C和和Y Y的分值應(yīng)該在剪切點(diǎn)之后的分值應(yīng)該在剪切點(diǎn)之后+1+1位點(diǎn)高,同時(shí)位點(diǎn)高,同時(shí)S S分應(yīng)該在分應(yīng)該在剪切點(diǎn)之前分?jǐn)?shù)高。對(duì)于非典型的信號(hào)肽,單靠最大剪切點(diǎn)之前分?jǐn)?shù)高。對(duì)于非典型的信號(hào)肽,單靠最大C C分值不能準(zhǔn)確預(yù)測(cè)出信號(hào)肽,但結(jié)合分值不能準(zhǔn)確預(yù)測(cè)出信號(hào)肽,但結(jié)合Y Y分值后就能準(zhǔn)分值后就能準(zhǔn)確預(yù)測(cè)信號(hào)肽。確預(yù)測(cè)信號(hào)肽?,F(xiàn)以蛋白現(xiàn)以蛋白Egfr-human p00533Egfr-human p00533為例進(jìn)行為例進(jìn)行SignalPSignalP預(yù)測(cè),預(yù)測(cè),得到的預(yù)測(cè)結(jié)果如下,為簡(jiǎn)便起見(jiàn),只列出真核生得到的預(yù)測(cè)結(jié)果如下,為簡(jiǎn)便起見(jiàn),只列出真核生物的序列作為訓(xùn)練集物的序列作為訓(xùn)練集得到得到的預(yù)測(cè)的預(yù)測(cè)結(jié)果。結(jié)果。#gff-version2#sequence-namesourcefeaturestartendscoreN/A?#-SequenceSignalP-4.1SIGNAL 1240.868.YES從最后預(yù)測(cè)從最后預(yù)測(cè)結(jié)果中結(jié)果中看到:最大看到:最大C C值值Y Y值的位點(diǎn)在值的位點(diǎn)在2525位,位,最后計(jì)算的綜合結(jié)果:信號(hào)肽位點(diǎn)為最后計(jì)算的綜合結(jié)果:信號(hào)肽位點(diǎn)為1-241-24。Swiss-Swiss-ProtProt中對(duì)該蛋白的注解是:信號(hào)肽是從中對(duì)該蛋白的注解是:信號(hào)肽是從1-241-24,預(yù)測(cè),預(yù)測(cè)結(jié)果正好與之相符。結(jié)果正好與之相符。對(duì)于典型的非分泌蛋白,整個(gè)序列的各項(xiàng)分?jǐn)?shù)都很低。對(duì)于典型的非分泌蛋白,整個(gè)序列的各項(xiàng)分?jǐn)?shù)都很低。有的非分泌性蛋白,雖然有的非分泌性蛋白,雖然C分和分和S分都高于域值,分都高于域值,SignalP根據(jù)其根據(jù)其Y分和分和S分平均值仍能作出準(zhǔn)確判斷。分平均值仍能作出準(zhǔn)確判斷。線粒體定位蛋白預(yù)測(cè)線粒體定位蛋白預(yù)測(cè)主講教師:趙雨杰主講教師:趙雨杰MITOPROTMITOPROTMITOPROTMITOPROTMitoProtMitoProt預(yù)測(cè)蛋白氨基端區(qū)域預(yù)測(cè)蛋白氨基端區(qū)域,是否存在線粒體靶向是否存在線粒體靶向序列和裂解位點(diǎn)。該計(jì)算方法預(yù)測(cè)轉(zhuǎn)運(yùn)進(jìn)入線粒體序列和裂解位點(diǎn)。該計(jì)算方法預(yù)測(cè)轉(zhuǎn)運(yùn)進(jìn)入線粒體蛋白質(zhì)和他們的靶向序列。蛋白質(zhì)和他們的靶向序列。https:/ihg.gsf.de/ihg/mitoprot.htmlhttps:/ihg.gsf.de/ihg/mitoprot.htmlgi|29427676|sp|Q16891.1|IMMT_HUMANRecName:Full=Mitochondrialinnermembraneprotein;gi|29427676|sp|Q16891.1|IMMT_HUMANRecName:Full=Mitochondrialinnermembraneprotein;AltName:Full=Cellproliferation-inducinggene4/52protein;AltName:Full=Mitofilin;AltName:Full=p87/89AltName:Full=Cellproliferation-inducinggene4/52protein;AltName:Full=Mitofilin;AltName:Full=p87/89MLRACQLSGVTAAAQSCLCGKFVLRPLRPCRRYSTSGSSGLTTGKIAGAGLLFVGGGIGGTILYAKWDSHMLRACQLSGVTAAAQSCLCGKFVLRPLRPCRRYSTSGSSGLTTGKIAGAGLLFVGGGIGGTILYAKWDSHFRESVEKTIPYSDKLFEMVLGPAAYNVPLPKKSIQSGPLKISSVSEVMKESKQPASQLQKQKGDTPASATFRESVEKTIPYSDKLFEMVLGPAAYNVPLPKKSIQSGPLKISSVSEVMKESKQPASQLQKQKGDTPASATAPTEAAQIISAAGDTLSVPAPAVQPEESLKTDHPEIGEGKPTPALSEEASSSSIRERPPEEVAARLAQQEAPTEAAQIISAAGDTLSVPAPAVQPEESLKTDHPEIGEGKPTPALSEEASSSSIRERPPEEVAARLAQQEKQEQVKIESLAKSLEDALRQTASVTLQAIAAQNAAVQAVNAHSNILKAAMDNSEIAGEKKSAQWRTVEGAKQEQVKIESLAKSLEDALRQTASVTLQAIAAQNAAVQAVNAHSNILKAAMDNSEIAGEKKSAQWRTVEGALKERRKAVDEAADALLKAKEELEKMKSVIENAKKKEVAGAKPHITAAEGKLHNMIVDLDNVVKKVQAAQSLKERRKAVDEAADALLKAKEELEKMKSVIENAKKKEVAGAKPHITAAEGKLHNMIVDLDNVVKKVQAAQSEAKVVSQYHELVVQARDDFKRELDSITPEVLPGWKGMSVSDLADKLSTDDLNSLIAHAHRRIDQLNRELAEAKVVSQYHELVVQARDDFKRELDSITPEVLPGWKGMSVSDLADKLSTDDLNSLIAHAHRRIDQLNRELAEQKATEKQHITLALEKQKLEEKRAFDSAVAKALEHHRSEIQAEQDRKIEEVRDAMENEMRTQLRRQAAAHEQKATEKQHITLALEKQKLEEKRAFDSAVAKALEHHRSEIQAEQDRKIEEVRDAMENEMRTQLRRQAAAHTDHLRDVLRVQEQELKSEFEQNLSEKLSEQELQFRRLSQEQVDNFTLDINTAYARLRGIEQAVQSHAVAETDHLRDVLRVQEQELKSEFEQNLSEKLSEQELQFRRLSQEQVDNFTLDINTAYARLRGIEQAVQSHAVAEEEARKAHQLWLSVEALKYSMKTSSAETPTIPLGSAVEAIKANCSDNEFTQALTAAIPPESLTRGVYSEETEEARKAHQLWLSVEALKYSMKTSSAETPTIPLGSAVEAIKANCSDNEFTQALTAAIPPESLTRGVYSEETLRARFYAVQKLARRVAMIDETRNSLYQYFLSYLQSLLLFPPQQLKPPPELCPEDINTFKLLSYASYCIEHLRARFYAVQKLARRVAMIDETRNSLYQYFLSYLQSLLLFPPQQLKPPPELCPEDINTFKLLSYASYCIEHGDLELAAKFVNQLKGESRRVAQDWLKEARMTLETKQIVEILTAYASAVGIGTTQVQPEGDLELAAKFVNQLKGESRRVAQDWLKEARMTLETKQIVEILTAYASAVGIGTTQVQPE蛋白翻譯后修飾預(yù)測(cè)蛋白翻譯后修飾預(yù)測(cè)主講教師:趙雨杰主講教師:趙雨杰NetOGlyc 4.0 ServerNetOGlyc 4.0 ServerNetOGlyc 4.0 ServerNetOGlyc 4.0 ServerNetOglycNetOglyc服務(wù)器采用神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)哺乳動(dòng)物蛋服務(wù)器采用神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)哺乳動(dòng)物蛋服務(wù)器采用神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)哺乳動(dòng)物蛋服務(wù)器采用神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)哺乳動(dòng)物蛋白序列中白序列中白序列中白序列中O-O-乙酰半乳糖胺糖基化位點(diǎn)乙酰半乳糖胺糖基化位點(diǎn)乙酰半乳糖胺糖基化位點(diǎn)乙酰半乳糖胺糖基化位點(diǎn)(GalNAc O-GalNAc O-glycosylationglycosylation)。)。)。)。gi|973744097|pdb|5A7H|AChainA,ComparisonOfTheStructureAndActivityOfGlycosylatedAndAglycosylatedHumanCarboxylesterase1SPPVVDTVHGKVLGKFVSLEGFAQPVAIFLGIPFAKPPLGPLRFTPPQPAEPWSFVKQATSYPPMCTQDPKAGQLLSELFTNRKENIPLKLSEDCLYLNIYTPADLTKKNRLPVMVWIHGGGLMVGAASTYDGLALAAHENVVVVTIQYRLGIWGFFSTGDEHSRGNWGHLDQVAALRWVQDNIASFGGNPGSVTIFGESAGGESVSVLVLSPLAKNLFHRAISESGVALTSVLVKKGDVKPLAEQIAITAGCKTTTSAVMVHCLRQKTEEELLETTLKMKFLSLDLQGDPRESQPLLGTVIDGMLLLKTPEELQAERNFHTVPYMVGINKQEFGWLIPMLMSYPLSEGQLDQKTAMSLLWKSYPLVCIAKELIPEATEKYLGGTDDTVKKKDLFLDLIADVMFGVPSVIVARNHRDAGAPTYMYEFQYRPSFSSDMKPKTVIGDHGDELFSVFGAPFLKEGASEEEIRLSKMVMKFWANFARNGNPNGEGLPHWPEYNQKEGYLQIGANTQAAQKLKDKEVAFWTNLFAKNetNGlyc 1.0 ServerNetNGlyc 1.0 ServerNetNGlyc 1.0 ServerNetNGlyc 1.0 ServerNetNglycNetNglyc服務(wù)器使用神經(jīng)網(wǎng)絡(luò)軟件檢測(cè)服務(wù)器使用神經(jīng)網(wǎng)絡(luò)軟件檢測(cè)Asn-Xaa-Asn-Xaa-Ser/ThrSer/Thr特征序列,用于預(yù)測(cè)人類(lèi)蛋白序列中特征序列,用于預(yù)測(cè)人類(lèi)蛋白序列中N-N-糖基糖基化位點(diǎn)化位點(diǎn)。gi|29427676|sp|Q16891.1|IMMT_HUMANRecName:Full=Mitochondrialinnermembraneprotein;gi|29427676|sp|Q16891.1|IMMT_HUMANRecName:Full=Mitochondrialinnermembraneprotein;AltName:Full=Cellproliferation-inducinggene4/52protein;AltName:Full=Mitofilin;AltName:Full=p87/89AltName:Full=Cellproliferation-inducinggene4/52protein;AltName:Full=Mitofilin;AltName:Full=p87/89MLRACQLSGVTAAAQSCLCGKFVLRPLRPCRRYSTSGSSGLTTGKIAGAGLLFVGGGIGGTILYAKWDSHMLRACQLSGVTAAAQSCLCGKFVLRPLRPCRRYSTSGSSGLTTGKIAGAGLLFVGGGIGGTILYAKWDSHFRESVEKTIPYSDKLFEMVLGPAAYNVPLPKKSIQSGPLKISSVSEVMKESKQPASQLQKQKGDTPASATFRESVEKTIPYSDKLFEMVLGPAAYNVPLPKKSIQSGPLKISSVSEVMKESKQPASQLQKQKGDTPASATAPTEAAQIISAAGDTLSVPAPAVQPEESLKTDHPEIGEGKPTPALSEEASSSSIRERPPEEVAARLAQQEAPTEAAQIISAAGDTLSVPAPAVQPEESLKTDHPEIGEGKPTPALSEEASSSSIRERPPEEVAARLAQQEKQEQVKIESLAKSLEDALRQTASVTLQAIAAQNAAVQAVNAHSNILKAAMDNSEIAGEKKSAQWRTVEGAKQEQVKIESLAKSLEDALRQTASVTLQAIAAQNAAVQAVNAHSNILKAAMDNSEIAGEKKSAQWRTVEGALKERRKAVDEAADALLKAKEELEKMKSVIENAKKKEVAGAKPHITAAEGKLHNMIVDLDNVVKKVQAAQSLKERRKAVDEAADALLKAKEELEKMKSVIENAKKKEVAGAKPHITAAEGKLHNMIVDLDNVVKKVQAAQSEAKVVSQYHELVVQARDDFKRELDSITPEVLPGWKGMSVSDLADKLSTDDLNSLIAHAHRRIDQLNRELAEAKVVSQYHELVVQARDDFKRELDSITPEVLPGWKGMSVSDLADKLSTDDLNSLIAHAHRRIDQLNRELAEQKATEKQHITLALEKQKLEEKRAFDSAVAKALEHHRSEIQAEQDRKIEEVRDAMENEMRTQLRRQAAAHEQKATEKQHITLALEKQKLEEKRAFDSAVAKALEHHRSEIQAEQDRKIEEVRDAMENEMRTQLRRQAAAHTDHLRDVLRVQEQELKSEFEQNLSEKLSEQELQFRRLSQEQVDNFTLDINTAYARLRGIEQAVQSHAVAETDHLRDVLRVQEQELKSEFEQNLSEKLSEQELQFRRLSQEQVDNFTLDINTAYARLRGIEQAVQSH
收藏
編號(hào):73982957
類(lèi)型:共享資源
大?。?span id="bp1lbfd" class="font-tahoma">115.48MB
格式:ZIP
上傳時(shí)間:2022-04-12
35
積分
- 關(guān) 鍵 詞:
-
生物信息學(xué)
本科教學(xué)課件
生物
信息學(xué)
本科
教學(xué)
課件
- 資源描述:
-
生物信息學(xué)本科教學(xué)課件,生物信息學(xué),本科教學(xué)課件,生物,信息學(xué),本科,教學(xué),課件
展開(kāi)閱讀全文
- 溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
裝配圖網(wǎng)所有資源均是用戶(hù)自行上傳分享,僅供網(wǎng)友學(xué)習(xí)交流,未經(jīng)上傳用戶(hù)書(shū)面授權(quán),請(qǐng)勿作他用。