『壹』 如何通過生物信息分析物種間親緣關系
生物分類學家和進化論者根據各類生物間的親緣關系的遠近。在進化樹上每個葉子結點代表一個物種:生物進化有一個規律,從低等到高等。有相關圖書一冊,把各類生物安置在有分枝的樹狀的圖表上,簡明地表示生物的進化歷程和親緣關系,怎麼使用phytozome
進化樹在生物學中,都是從水生到陸生,那麼兩個葉子結點之間的最短距離就可以表示相應的兩個物種之間的差異程度。從進化樹中還可看出,用來表示物種之間的進化關系生物信息學,如果每一條邊都被賦予一個適當的權值,從簡單到復雜
『貳』 怎麼利用生物信息學分析公共數據
生物信息學(Bioinformatics)是生物學與計算機科學以及應用數學等學科相互交叉而
形
成的一門新興學科。它通過對生物學實驗數據的獲取、加工、存儲、檢索與分析,進而
達
到揭示這些數據所蘊含的生物學意義的目的。在推動生物信息學發展的各種動力中,人
類
基因組計劃(HGP)和生物醫葯工業是其中的兩個主要力量。
就人類基因組來說,得到序列僅僅是第一步,後一步的工作是所謂後基因組時代 (Post
-
genome Era) 的任務,即收集、整理、檢索和分析序列中表達的蛋白質結構與功能的信
息
,找出規律。近幾年來在公共資料庫中DNA序列數據的數量以每年1.8倍的速度快速增長
,
到1997年底已經超過1.2×109bp。對如此巨量的數據進行存儲、分類、檢索、比較,並
預
測可能的基因和基因產物的結構和功能,如果沒有計算機參與處理,那是不可想像的。
生物醫葯工業也是推動生物信息學發展的重要動力。HGP所推動的大規模DNA測序也為生
物
醫葯工業提供了大量可用於新葯開發的原材料。有些基因產物可以直接作為葯物,而有
些
基因則可以成為葯物作用的對象。生物信息學為分子生物學家提供了大量對基因序列進
行
分析的工具,不但可以從資料的獲取、基因功能的預測、葯物篩選過程中的信息處理等
方
面大大加快新葯開發的進程,而且可以大大加快傳統的基因發現和研究,因而成為各贏
利
性研究機構和醫葯公司爭奪基因專利的重要工具,這一競爭又反過來極大的刺激了生物
信
息學的發展。
2、研究內容
生物信息學與計算生物學或生物計算有著密切的關系,但又不盡相同,目前歸入生物信
息
學研究領域的大致有以下幾個方面:
(1)各種生物資料庫的建立和管理。這是一切生物信息學工作的基礎,通常要有計算機
科
學背景的專業人員與生物學家密切合作。
(2)資料庫介面和檢索工具的研製。資料庫的內容來自萬千生物學者的日積月累,最終
又
為生物學者們所用。但不能要求一般生物學工作者具有高深的計算機和網路知識,因此
,
必須發展查詢資料庫和向庫里提供數據的方便介面。這是專業人員才能勝任的工作,通
常
在生物信息中心裡進行。
(3)人類基因組計劃的實施,配合大規模的DNA自動測序,對信息的採集和處理提出了
空
前的要求。從各種圖譜的分析,大量序列片段的拼接組裝,尋找基因和預測結構與功能
,
到數據和研究結果的視像化,無不需要高效率的演算法和程序。研究新演算法、發展方便適
用
的程序,是生物信息學的日常任務。
(4)生物信息學最重要的任務,是從海量數據中提取新知識。這首先是從DNA序列中識
別
編碼蛋白質的基因,以及調控基因表達的各種信號。其次,從基因組編碼序列翻譯出的
蛋
白質序列的數目急劇增加,根本不可能用實驗方法一一確定它們的結構和功能。從已經
積
累的數據和知識出發,預測蛋白質的結構和功能,成為常規的研究任務。
(5)DNA晶元和微陣列的發展,把一定組織或生物體內萬千基因時空表達的研究提上日
程
.研究基因表達過程中的聚群關系,從中提取調控網路和代謝途徑的知識,進而從整體
上
模擬細胞內的全部互相輔合的生化反應,在亞細胞層次理解生命活動。只有掌握已有數
據
、發展嶄新演算法,才能創造新的知識。這是生物信息學剛剛掀開的新篇章。