‘壹’ 如何通过生物信息分析物种间亲缘关系
生物分类学家和进化论者根据各类生物间的亲缘关系的远近。在进化树上每个叶子结点代表一个物种:生物进化有一个规律,从低等到高等。有相关图书一册,把各类生物安置在有分枝的树状的图表上,简明地表示生物的进化历程和亲缘关系,怎么使用phytozome
进化树在生物学中,都是从水生到陆生,那么两个叶子结点之间的最短距离就可以表示相应的两个物种之间的差异程度。从进化树中还可看出,用来表示物种之间的进化关系生物信息学,如果每一条边都被赋予一个适当的权值,从简单到复杂
‘贰’ 怎么利用生物信息学分析公共数据
生物信息学(Bioinformatics)是生物学与计算机科学以及应用数学等学科相互交叉而
形
成的一门新兴学科。它通过对生物学实验数据的获取、加工、存储、检索与分析,进而
达
到揭示这些数据所蕴含的生物学意义的目的。在推动生物信息学发展的各种动力中,人
类
基因组计划(HGP)和生物医药工业是其中的两个主要力量。
就人类基因组来说,得到序列仅仅是第一步,后一步的工作是所谓后基因组时代 (Post
-
genome Era) 的任务,即收集、整理、检索和分析序列中表达的蛋白质结构与功能的信
息
,找出规律。近几年来在公共数据库中DNA序列数据的数量以每年1.8倍的速度快速增长
,
到1997年底已经超过1.2×109bp。对如此巨量的数据进行存储、分类、检索、比较,并
预
测可能的基因和基因产物的结构和功能,如果没有计算机参与处理,那是不可想象的。
生物医药工业也是推动生物信息学发展的重要动力。HGP所推动的大规模DNA测序也为生
物
医药工业提供了大量可用于新药开发的原材料。有些基因产物可以直接作为药物,而有
些
基因则可以成为药物作用的对象。生物信息学为分子生物学家提供了大量对基因序列进
行
分析的工具,不但可以从资料的获取、基因功能的预测、药物筛选过程中的信息处理等
方
面大大加快新药开发的进程,而且可以大大加快传统的基因发现和研究,因而成为各赢
利
性研究机构和医药公司争夺基因专利的重要工具,这一竞争又反过来极大的刺激了生物
信
息学的发展。
2、研究内容
生物信息学与计算生物学或生物计算有着密切的关系,但又不尽相同,目前归入生物信
息
学研究领域的大致有以下几个方面:
(1)各种生物数据库的建立和管理。这是一切生物信息学工作的基础,通常要有计算机
科
学背景的专业人员与生物学家密切合作。
(2)数据库接口和检索工具的研制。数据库的内容来自万千生物学者的日积月累,最终
又
为生物学者们所用。但不能要求一般生物学工作者具有高深的计算机和网络知识,因此
,
必须发展查询数据库和向库里提供数据的方便接口。这是专业人员才能胜任的工作,通
常
在生物信息中心里进行。
(3)人类基因组计划的实施,配合大规模的DNA自动测序,对信息的采集和处理提出了
空
前的要求。从各种图谱的分析,大量序列片段的拼接组装,寻找基因和预测结构与功能
,
到数据和研究结果的视像化,无不需要高效率的算法和程序。研究新算法、发展方便适
用
的程序,是生物信息学的日常任务。
(4)生物信息学最重要的任务,是从海量数据中提取新知识。这首先是从DNA序列中识
别
编码蛋白质的基因,以及调控基因表达的各种信号。其次,从基因组编码序列翻译出的
蛋
白质序列的数目急剧增加,根本不可能用实验方法一一确定它们的结构和功能。从已经
积
累的数据和知识出发,预测蛋白质的结构和功能,成为常规的研究任务。
(5)DNA芯片和微阵列的发展,把一定组织或生物体内万千基因时空表达的研究提上日
程
.研究基因表达过程中的聚群关系,从中提取调控网络和代谢途径的知识,进而从整体
上
模拟细胞内的全部互相辅合的生化反应,在亚细胞层次理解生命活动。只有掌握已有数
据
、发展崭新算法,才能创造新的知识。这是生物信息学刚刚掀开的新篇章。