《生物信息學》PPT課件

上傳人:san****019 文檔編號:22487605 上傳時間:2021-05-26 格式:PPT 頁數(shù):40 大?。?47.50KB
收藏 版權(quán)申訴 舉報 下載
《生物信息學》PPT課件_第1頁
第1頁 / 共40頁
《生物信息學》PPT課件_第2頁
第2頁 / 共40頁
《生物信息學》PPT課件_第3頁
第3頁 / 共40頁

下載文檔到電腦,查找使用更方便

9.9 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《《生物信息學》PPT課件》由會員分享,可在線閱讀,更多相關(guān)《《生物信息學》PPT課件(40頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、簡 介 生 物 信 息 學 ( Bioinformatics) 是 20世 紀 80年 代 末 隨 著 人 類 基 因 組 計 劃 的 啟 動 而 興 起的 一 門 新 型 交 叉 學 科 , 它 體 現(xiàn) 了 生 物 學 、計 算 機 科 學 、 數(shù) 學 、 物 理 學 等 學 科 間 的 滲透 與 融 合 。 生 物 信 息 學 通 過 對 生 物 學 實 驗 數(shù) 據(jù) 的 獲 取 、加 工 、 存 儲 、 檢 索 與 分 析 , 達 到 揭 示 數(shù) 據(jù)所 蘊 含 的 生 物 學 意 義 從 而 解 讀 生 命 活 動 規(guī)律 的 目 的 。 生 物 信 息 學 不 僅 是 一 門 學 科 ,

2、更 是 一 種 重要 的 研 究 開 發(fā) 平 臺 與 工 具 , 是 今 后 進 行 幾乎 所 有 生 命 科 學 研 究 的 推 手 。 生 物 技 術(shù) 與 生 物 信 息 學 的 區(qū) 別 及聯(lián) 系生 物 技 術(shù) 生 物 信 息 學英 文 名 稱 Biotechnology Bioinformatics最 終 目 的 產(chǎn) 品 研 究方 法 利 用 生 物 的 特 性 和 功 能 ,設(shè) 計 構(gòu) 建 具 有 預(yù) 期 功 能 的 新 物 質(zhì) 或 品 系 對 生 物 信 息 進 行 采 集 、 處理 、 存 儲 、 分 析 和 解 釋涉 及 學 科 基 因 工 程 、 分 子 生 物 學 、 生物

3、化 學 、 遺 傳 學 、 細 胞 生 物學 、 胚 胎 學 、 免 疫 學 等 生 物 學 、 計 算 機 科 學 、 數(shù) 學 、物 理 學 等發(fā) 展 歷 程 可 追 溯 到 2000 B.C. 數(shù) 十 年 生 物 信 息 學 的 發(fā) 展 歷 史 人 類 基 因 組 計 劃 ( HGP)人 類 基 因 組 計 劃 由 美 國 科 學 家 于 1985年 提 出 , 1990年 啟 動 。 根 據(jù) 該 計 劃 ,在 2015年 要 把 人 體 約 4萬 個 基 因 的 密碼 全 部 揭 開 , 同 時 繪 制 出 人 類 基 因 的譜 圖 , 也 就 是 說 , 要 揭 開 組 成 人 體 4

4、萬個 基 因 的 30億 個 堿 基 對 的 秘 密 。 HGP與 曼 哈 頓 原 子 彈 計 劃 和 阿 波 羅 計 劃 并稱 為 三 大 科 學 計 劃 , 被 譽 為 生 命 科 學的 登 月 計 劃 。 隨 著 基 因 組 計 劃 的 不 斷 發(fā) 展 , 海 量 的 生 物 學 數(shù) 據(jù) 必 須 通 過 生 物 信 息 學的 手 段 進 行 收 集 、 分 析 和 整 理 后 , 才 能 成 為 有 用 的 信 息 和 知 識 。 換 句 話 說 ,人 類 基 因 組 計 劃 為 生 物 信 息 學 提 供 了 興 盛 的 契 機 。 上 文 所 說 的 基 因 、 堿 基對 、 遺 傳

5、 密 碼 子 等 術(shù) 語 都 是 生 物 信 息 學 需 要 著 重 研 究 的 地 方 。 數(shù) 據(jù) 與 信 息 數(shù) 據(jù) 是 人 們 為 了 反 映 客 觀 世 界 而 記 錄 下 來 的 可 鑒 別 的 各 種 符 號 , 而 信 息 則 是使 用 者 對 數(shù) 據(jù) 有 目 的 的 加 工 , 從 而 對 接 收 者 的 行 為 或 思 想 產(chǎn) 生 影 響 , 而 不 同接 收 者 對 于 相 同 數(shù) 據(jù) 可 能 存 在 不 同 的 解 釋 和 理 解 。 數(shù) 據(jù) 是 信 息 的 載 體 , 信 息 是 數(shù) 據(jù) 的 目 的“ 我 有 一 個 好 想 法 , 不 過 只 可 意 會 不 可 言

6、傳 ” 數(shù) 據(jù) 本 身 沒 有 價 值 用 戶 不 同 , 數(shù) 據(jù) 和 信 息 的 劃 分 也 不 同 數(shù) 據(jù) 和 信 息 可 以 相 互 轉(zhuǎn) 化 What is Data?10535185574雨 認 會 不 天 我 為 明 下 0100100101001100011011110111011001100101010110010110111101110101 What is Info?13805515574我 不 認 為 明 天 會 下 雨 y=ax-a 0100100101001100011011110111011001100101010110010110111101110101 73761

7、1111810189111117 ILoveYou 數(shù) 據(jù) 信 息RecognitionKnowledgement 什 么 是 數(shù) 據(jù) 庫 在 生 物 信 息 學 領(lǐng) 域 , 數(shù) 據(jù) 庫 的 主 要 功 能 是“ 存 儲 ” 、 “ 管 理 ” 以 及 “ 檢 索 ” 、 “ 調(diào)用 ” 常 見 數(shù) 據(jù) 庫 結(jié) 構(gòu) 類 型 : 平 面 文 件 (FLAT FILE)、 關(guān) 系 型 數(shù) 據(jù) 庫 (R-database)、 基 于Internet的 XML(Extensible Markup Language) 基 因 是 什 么 基 因 是 遺 傳 物 質(zhì) 的 基 本 單 位基 因 就 是 核 苷

8、 酸 序 列 。大 部 分 的 基 因 大 約 是 1000-4000個 核 苷 酸 那 么 長 。基 因 通 過 控 制 蛋 白 質(zhì) 的 合 成 , 從 微 觀 和 宏 觀 上 影 響 細 胞 、 組 織 和 器官 的 產(chǎn) 生 ?;?因 在 染 色 體 上 。 DNA的 結(jié) 構(gòu) 堿 基 ( 腺 嘌 呤 A、 鳥 嘌 呤 G、 胞 嘧 啶 C、 胸腺 嘧 啶 T) 核 苷 酸核 苷 酸 是 構(gòu) 成 DNA分 子 的 重 要 模 塊 。 每 個 核 苷 酸 分 子 由 一 分 子 稱 作 脫氧 核 糖 的 戊 糖 ( 五 碳 糖 ) 、 一 分 子 磷 酸 和 一 分 子 堿 基 構(gòu) 成 。 每

9、 種 核 苷酸 都 有 一 個 堿 基 對 , 也 就 是 A、 T、 C、 G DNA序 列 比 對 序 列 同 源 性 : 從 某 一 共 同 祖 先 經(jīng) 過 趨 異 進 化 而 形 成 的 不 同 序 列 序 列 相 似 性 : 指 序 列 比 對 過 程 中 檢 測 序 列 和 目 標 序 列 之 間 相 同 堿 基 或 氨 基 酸殘 基 序 列 所 占 比 例 的 大 小 序 列 比 對 定 義序 列 比 對 (Sequence Alignment)就 是 運 用 某 種 特 定 的 算 法 , 找 出 兩 個 或多 個 序 列 之 間 的 最 大 匹 配 堿 基 數(shù) 動 態(tài) 規(guī) 劃

10、 與 序 列 比 對 基 因 組 數(shù) 據(jù) 庫 保 存 了 海 量 的 原 始 數(shù) 據(jù) (Raw Data),人 類 基 因 有 接 近 30億 個 堿 基 對 。 為 了 查 遍 所 有 數(shù)據(jù) 并 找 到 其 中 有 意 義 的 關(guān) 系 , 我 們 便 需 要 依 賴 于高 效 的 計 算 機 科 學 字 符 串 算 法 。 動 態(tài) 規(guī) 劃 算 法 是 解 決 最 優(yōu) 化 問 題 的 一 種 高 級 的 算法 技 術(shù) , 它 自 下 而 上 尋 找 子 問 題 的 最 優(yōu) 解 , 從 而逐 步 得 到 最 終 問 題 的 解 。 本 課 程 將 利 用 Java實 現(xiàn) 動 態(tài) 規(guī) 劃 是 一

11、種 編 程 思 想 , 并 不 是 實 際 的 方 法 。掌 握 這 一 思 想 , 適 當 采 用 遞 歸 方 法 , 幾 乎 可 以 解決 所 有 最 優(yōu) 解 問 題 。 使 用 動 態(tài) 規(guī) 劃 兩 大 條 件 : 最 優(yōu) 子 結(jié) 構(gòu) , 重 疊 子 問題 遞 歸 (Recursion) 在 計 算 機 程 序 設(shè) 計 中 如 何 理 解 F(x)=ax+b 編 程 計 算 N! f(n) = n*f(n-1) n1 編 程 計 算 斐 波 那 契 數(shù) 列f(n) = f(n-1)+f(n-2) n21, 1, 2, 3, 5, 8 . n 動 態(tài) 規(guī) 劃 問 : 斐 波 那 契 數(shù) 列

12、當 n=5時 , 結(jié) 果 是 多 少 ?x=50呢 ? x=100呢 ?當 遇 到 重 疊 子 問 題 , 即 現(xiàn) 在 正 在 進 行 遞 歸 時 函 數(shù) 的 參 數(shù) 是 當 前 已 經(jīng) 計 算 過 的 參 數(shù) 值 , 那 么 再 進行 計 算 將 是 重 復 計 算 。 Fib(4) Fib(3) Finb(2) Fib(0)Finb(2) Fib(1)Fib(1) 動 態(tài) 規(guī) 劃 利 用 動 態(tài) 規(guī) 劃 思 想 解 決 之 前 的 問 題 。public int fib(int n) if ( n = 0) return 0;else if (n=1) return 1;else retu

13、rn fib(n-1)+fib(n-2); public int fib1(int n)int table = new int n+1for(i=0;itable.length;i+)if(i = 0) tablei=0;else if (i=1) tablei=1else tablei=tablei-2+tablei-1return tablen遞 歸 解 決 動 態(tài) 規(guī) 劃 解 決動 態(tài) 規(guī) 劃 算 法 將 已 經(jīng) 計 算 過 的 子 問題 的 解 保 存 ( 這 里 用 二 維 數(shù) 組 ) ,下 一 次 再 需 要 計 算 時 便 可 以 直 接 提取 使 用 最 長 公 共 子 序 列

14、 問 題 (LCS)S1: ACTT S2: AGCTA C T T0 0 0 0 0A 0 1 1 1 1 G 0 1 1 1 1C 0 1 2 2 2T 0 1 2 3 3 注 意 該 二 維 數(shù) 組 賦 值的 規(guī) 律 , 最 右 下 角 的數(shù) 值 即 為 這 兩 個 序 列的 LCS長 度 遺 傳 算 法 4.1 基 本 概 念 1. 個 體 與 種 群 個 體 就 是 模 擬 生 物 個 體 而 對 問 題 中 的 對 象 ( 一 般 就 是 問 題 的 解 ) 的 一 種 稱 呼 , 一 個 個 體 也 就 是 搜 索 空 間 中 的 一 個 點 。 種 群 (population)

15、就 是 模 擬 生 物 種 群 而 由 若 干 個 體 組 成 的 群 體 , 它 一 般 是 整 個 搜 索 空 間 的 一 個 很 小 的 子 集 。 2. 適 應(yīng) 度 與 適 應(yīng) 度 函 數(shù) 適 應(yīng) 度 (fitness)就 是 借 鑒 生 物 個 體 對 環(huán) 境 的 適 應(yīng) 程 度 ,而 對 問 題 中 的 個 體 對 象 所 設(shè) 計 的 表 征 其 優(yōu) 劣 的 一 種 測 度 。 適 應(yīng) 度 函 數(shù) (fitness function)就 是 問 題 中 的 全 體 個 體 與 其 適 應(yīng) 度 之 間 的 一 個 對 應(yīng) 關(guān) 系 。 它 一 般 是 一 個 實 值 函 數(shù) 。 該 函

16、 數(shù) 就 是 遺 傳算 法 中 指 導 搜 索 的 評 價 函 數(shù) 。 3. 染 色 體 與 基 因 染 色 體 ( chromosome) 就 是 問 題 中 個 體 的某 種 字 符 串 形 式 的 編 碼 表 示 。 字 符 串 中 的 字 符也 就 稱 為 基 因 ( gene) 。 例 如 : 個 體 染 色 體 9 - 1001 ( 2, 5, 6) - 010 101 110 4. 遺 傳 操 作 亦 稱 遺 傳 算 子 (genetic operator), 就 是 關(guān)于 染 色 體 的 運 算 。 遺 傳 算 法 中 有 三 種 遺 傳 操 作 : 選 擇 -復 制 (sel

17、ection-reproduction) 交 叉 (crossover, 亦 稱 交 換 、 交 配 或 雜 交 ) 變 異 (mutation, 亦 稱 突 變 ) 選 擇 -復 制 通 常 做 法 是 : 對 于 一 個 規(guī) 模 為 N的種 群 S,按 每 個 染 色 體 xi S的 選 擇 概 率 P(xi)所 決 定的 選 中 機 會 , 分 N次 從 S中 隨 機 選 定 N個 染 色 體 , 并進 行 復 制 。 Nj jii xfxfxP 1 )( )()( 這 里 的 選 擇 概 率 P(xi)的 計 算 公 式 為 交 叉 就 是 互 換 兩 個 染 色 體 某 些 位 上

18、的 基 因 。 s1=01000101, s2=10011011可 以 看 做 是 原 染 色 體 s 1和 s2的 子 代 染 色 體 。 例 如 , 設(shè) 染 色 體 s1=01001011, s2=10010101, 交 換 其 后 4位 基 因 , 即 變 異 就 是 改 變 染 色 體 某 個 (些 )位 上 的 基 因 。 例 如 , 設(shè) 染 色 體 s=11001101將 其 第 三 位 上 的 0變 為 1, 即 s=11001101 11101101= s。 s也 可 以 看 做 是 原 染 色 體 s的 子 代 染 色 體 。 4.2 基 本 遺 傳 算 法 遺 傳 算 法

19、基 本 流 程 框 圖 生 成 初 始 種 群計 算 適 應(yīng) 度選 擇 /復 制交 叉變 異生 成 新 一 代 種 群終 止 ? 結(jié) 束 算 法 中 的 一 些 控 制 參 數(shù) : 種 群 規(guī) 模 最 大 換 代 數(shù) 交 叉 率 (crossover rate)就是參加交叉運算的染色體個數(shù)占全體染色體總數(shù)的比例,記為Pc,取值范圍一般為0.40.99。 變 異 率 (mutation rate)是指發(fā)生變異的基因位數(shù)所占全體染色體的基因總位數(shù)的比例,記為P m,取值范圍一般為0.00010.1。 分 子 進 化 與 系 統(tǒng) 發(fā) 育 生 物 大 分 子 進 化 速 率 相 對 恒 定 蛋 白 質(zhì)

20、 和 核 酸 等 生 物 大 分 子 在 進 化 過 程 中氨 基 酸 或 核 苷 酸 隨 著 時 間 的 替 換 (改 變 )數(shù) 幾乎 是 恒 定 的 。 生 物 大 分 子 進 化 的 保 守 性 對 生 物 生 存 制 約 性 大 的 生 物 大 分 子 進 化 速 度 慢 生 物 大 分 子 內(nèi) 部 功 能 區(qū) 結(jié) 構(gòu) 變 化 速 率 較 慢 , 而 且功 能 越 重 要 的 區(qū) 域 變 化 速 率 越 慢 蛋 白 質(zhì) 中 越 重 要 的 氨 基 酸 變 化 越 慢 結(jié) 構(gòu) 和 化 學 性 質(zhì) 相 近 的 氨 基 酸 之 間 的 替 換 要 比 這兩 方 面 不 同 的 氨 基 酸 之

21、 間 的 替 換 共 容 易 發(fā) 生 分 子 系 統(tǒng) 發(fā) 育 樹如 何 構(gòu) 建 系 統(tǒng) 發(fā) 育 樹 請 參 照 書 本 UPGMA方 法 實 例注 意 要 能 夠 最 終 畫 出 系 統(tǒng) 發(fā) 育 樹 信 息 可 視 化 背 景 計 算 機 圖 形 學 的 產(chǎn) 生 和 發(fā) 展 為 可 視 化 的 誕生 奠 定 基 礎(chǔ) 1987年 正 式 將 可 視 化 分 為 : 數(shù) 據(jù) 可 視 化 、信 息 可 視 化 、 科 學 可 視 化大 數(shù) 據(jù) 時 代 的到 來 為 信 息 可 視 化 帶 來 了 新的 機 遇 和 挑 戰(zhàn) 。 信 息 可 視 化 模 型RawData Tables VISStruct

22、ure ViewsVisual FormData 可 視 化 結(jié) 構(gòu) 映 射數(shù) 據(jù) 轉(zhuǎn) 化 視 圖 轉(zhuǎn) 化 InteractionsData Analysis 信 息 可 視 化 常 用 可 視 化 結(jié) 構(gòu)( TreeMap)TreeMap是 一 種 在 有 限 空 間 里 對 分 層 結(jié) 構(gòu) 的 可 視 化 結(jié) 構(gòu) 模 型 。 通 過 對 形 狀大 小 和 顏 色 的 編 碼 , TreeMap可 以 非 常 有 效 的 展 現(xiàn) 屬 性 結(jié) 構(gòu) 中 葉 子 節(jié) 點 的屬 性 , 可 針 對 同 層 次 或 者 不 同 層 次 的 葉 子 節(jié) 點 進 行 比 較 。 充 分 利 用 空 間 。

23、F( 6)F( 5) F( 4)F( 4) F( 3) F( 3) F( 2) F( 3) F(2) F(2) F(1) F(2) F(1)F(2) F(1) 這 是 我 們 常 見 的 二叉 樹 結(jié) 構(gòu) , 表 示 Fib數(shù) 列 的 運 算 過 程 TreeMapF( 6)F( 5) F( 4)F( 4) F( 3) F( 3) F( 2)F( 3) F(2) F(2) F(1) F(2) F(1)F(2) F(1) F(2) F(2) F(1)F(2)F(2)F(2)F(1)F(1)在 TreeMap中 , 所 有的 不 可 分 割 的 矩 形 塊都 是 葉 子 節(jié) 點 , 而 這些 矩

24、形 塊 通 過 組 合 構(gòu)成 的 更 大 的 矩 形 塊 也就 是 葉 子 節(jié) 點 的 父 節(jié)點 , 以 此 類 推 , 從 而將 整 個 樹 形 結(jié) 構(gòu) 呈 現(xiàn) 信 息 可 視 化 常 用 可 視 化 結(jié) 構(gòu)( FishEye) Fisheye的 應(yīng) 用 Fisheye Menu魚 眼 菜 單 ( Fisheye menus ) 對 于 幫助 用 戶 瀏 覽 很 長 、 但 有 序 的 列 表 很 有用 處 。 該 菜 單 可 以 動 態(tài) 的 變 換 菜 單 條目 的 尺 寸 , 將 鼠 標 所 在 區(qū) 域 放 大 。 這樣 便 可 以 在 一 個 屏 幕 上 顯 示 并 操 作 整個 菜 單 了 , 而 無 需 傳 統(tǒng) 的 按 鈕 、 滾 動條 、 或 分 級 瀏 覽 結(jié) 構(gòu) 。 對 于 幫 助 用 戶輕 松 瀏 覽 很 長 的 列 表 , 魚 眼 菜 單 很 有潛 力 。 可視化人機交互技術(shù) http:/mbostock.github.io/protovis/ex/ 什 么 是 人 機 交 互 ? 輸 入 設(shè) 備 與 屏 幕 之 間 的 交 互 ? 人 與 屏 幕 之 間 的 交 互 ? 可 視 化 中 的 交 互 技 術(shù) Brushing Focus+context+magiclens pan+zoom Parallel Coordinates Index Charts

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!