⑴ 简述蛋白组学的概念、研究技术和应用
概念
蛋白质组学(Proteomics)一词,源于蛋白质(protein)与 基因组学(genomics)两个词的组合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。蛋白质组本质上指的是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平,翻译后的修饰,蛋白与蛋白相互作用等,由此获得蛋白质水平上的关于疾病发生,细胞代谢等过程的整体而全面的认识
研究技术
二维电泳和质谱技术
应用
1.蛋白质鉴定:可以利用一维电泳和二维电泳并结合Western等技术,利用蛋白质芯片和抗体芯片及免疫共沉淀等技术对蛋白质进行鉴定研究。
2.翻译后修饰:很多mRNA表达产生的蛋白质要经历翻译后修饰如磷酸化,糖基化,酶原激活等。翻译后修饰是蛋白质调节功能的重要方式,因此对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重要作用。
3.蛋白质功能确定:如分析酶活性和确定酶底物,细胞因子的生物分析/配基-受体结合分析。可以利用基因敲除和反义技术分析基因表达产物-蛋白质的功能。另外对蛋白质表达出来后在细胞内的定位研究也在一定程度上有助于蛋白质功能的了解。Clontech的荧光蛋白表达系统就是研究蛋白质在细胞内定位的一个很好的工具。
4.对人类而言,蛋白质组学的研究最终要服务于人类的健康,主要指促进分子医学的发展。如寻找药物的靶分子。很多药物本身就是蛋白质,而很多药物的靶分子也是蛋白质。药物也可以干预蛋白质-蛋白质相互作用。
在基础医学和疾病机理研究中,了解人不同发育、生长期和不同生理、病理条件下及不同细胞类型的基因表达的特点具有特别重要的意义。这些研究可能找到直接与特定生理或病理状态相关的分子,进一步为设计作用于特定靶分子的药物奠定基础。
⑵ 组学技术发展迅速,比较基因组学的应用有哪些
近年来,一些模式生物如某些细菌和古菌、拟南芥、线虫、果蝇和人类等基因组序列分析的完成建立了基因组学和比较基因组学以及相关的技术(如DNA芯片技术),随之而来的是功能基因组学研究的兴起,只有了解了基因的结构和功能及其表达的调节机制,才能认识生命的发生和发展的过程,才可以有效的发现因某些基因缺陷而发生的遗传病,从而予以纠正,即所谓的基因治疗。基因组学已经过去了,下一步需要扩展,建立一系列技术,如DNA芯片等。
⑶ 组学技术—— CUT&Tag
蛋白质与DNA之间的相互作用具有十分重要的生物学意义,例如:转录因子与基因组DNA的相互作用对于基因的表达具有调控作用;基因组不同位置的不同类型的组蛋白往往会与基因的表达活性相关联等。
而在蛋白质与DNA之间的相互作用研究当中,ChIP-seq当属经典技术,可以说为后来一系列技术的发展开拓了很好的思路,但是传统的ChIP-seq也存在一些问题:
在2019年,美国弗雷德哈钦森癌症研究中心的 Henikoff 博士在 Nature Communications 上首次发布 CUT&Tag 技术 [1] ,相比较于ChIP-seq技术, CUT&Tag 在这些方面具有独特优势:
当然,整项技术还是基于抗原抗体结合反应进行构建的,上面的优势决定了 CUT&Tag 具有以下特点:
在ChIP-seq中常常使用到的甲醛交联主要是让蛋白质一蛋白质,蛋白质一DNA,蛋白质一RNA之间交联,最主要的目的还是让我们想研究的蛋白质与DNA之间的相互作用更加紧密,防止在后续的实验中导致脱落。但是这也会带来一些问题:
2014年发表在 Brief Funct Genomics 上的文章 In vivo formaldehyde cross-linking: it is time for black box analysis 就专门就甲醛交联在研究蛋白与DNA之间的相互作用提出了可能存在的问题,甲醛交联并不能交联所有蛋白与DNA之间的相互作用,例如 lac阻遏蛋白 和 NF-kB 就不会被交联 [2] 。总之就是大家不要把甲醛交联想的那么神,那么万能。
注意我前面提到的 CUT&Tag 一般不需要甲醛交联,为什么是一般?如果你所要研究的转录因子与基因组的结合较弱或者量很少,这个时候为了得到的更好的实验结果,你就可能需要使用甲醛进行轻交联,同样是美国弗雷德哈钦森癌症研究中心的 Henikoff 博士课题组,他们在2020年将 CUT&Tag 实验流程发表在 Nature Protocols 上,其中就提到了使用甲醛进行 轻交联 的可选步骤(0.1%的甲醛室温下交联2分钟) [3] , ChIP-seq 的甲醛交联可是使用1%的甲醛交联10-15分钟!
不同于传统的每次离心收集细胞, CUT&Tag 使用连有 刀豆蛋白A 的磁珠(concanavalin A beads)进行细胞的收集,刀豆蛋白能够与细胞进行结合(原理是与膜上的糖蛋白结合)。然后利用磁珠每次收集细胞。结合后还需要使用非离子去垢剂 洋地黄皂苷 (digitonin)对细胞膜进行通透(原理是与胆固醇分子结合),为抗体等的进入提供可能性。
这里的一抗就是针对你的研究靶蛋白所设计的特异性抗体,必要时需要辅助IP实验检验抗体的特异性。
这里一般使用Protein A/G-Tn5体系来实现Tn5转座酶的结合,proteinA/G对于IgG的Fc段具有很高的亲和性,常常被应用于IgG抗体的纯化,所以使用proteinA/G就能把Tn5转座酶带到IgG二抗结合的基因组位点。
通过添加含有镁离子的反应液使Tn5转座酶开始发挥作用,这里面的细节可以参考我前面的帖子 组学技术——ATAC-seq 。
如果你确实有设置对照组的需求,CUT&Tag一般会有两种对照:阳性对照一般选择与基因组DNA相互作用较高的蛋白,例如组蛋白;阴性对照可以使用不加入一抗而正常加入二抗和Tn5转座酶的体系,查看是否存在Tn5转座酶乱切的情况,或者也可加入非特异性的IgG作为阴性对照。
References
[1] Kaya-Okur, Hatice S et al. CUT&Tag for efficient epigenomic profiling of small samples and single cells. Nature communications vol. 10,1 1930. 29 Apr. 2019, doi:10.1038/s41467-019-09982-5.
[2] Gavrilov, Alexey et al. In vivo formaldehyde cross-linking: it is time for black box analysis. Briefings in functional genomics vol. 14,2 (2015): 163-5. doi:10.1093/bfgp/elu037.
[3] Kaya-Okur, Hatice S et al. Efficient low-cost chromatin profiling with CUT&Tag. Nature protocols vol. 15,10 (2020): 3264-3283. doi:10.1038/s41596-020-0373-x.
⑷ 前沿综述 | 利用机器学习进行多组学数据分析
随着高通量组学平台的发展,生物医学研究大多采取了多组学技术结合的方法,不同组学来源(如遗传学、蛋白质组学和代谢组学)的数据可以通过基于机器学习(Machine Learning,ML)的预测算法进行整合,以揭示系统生物学的复杂工作。 ML提供了整合和分析各种组学数据的新技术,从而发现新的生物标记物。 来自英国的研究人员在《 Biotechnology Advances 》发表综述文章, 探讨了多组学的数据整合机器学习方法及其应用(被用来深入了解正常生理功能和疾病存在时的生物系统),为计划在多组学研究中使用ML方法的跨学科专业人士提供见解和建议。
此篇综述关注ML中的两种主要学习策略,即有监督和无监督,这两种策略通常在多组学整合的背景下使用。
基于串联的整合方法考虑使用联合数据矩阵来开发模型,该联合数据矩阵是通过组合多组学数据集形成的。如上图基于串联的整合方法的一般流程为:阶段1包括来自单独组学(例如基因组学、蛋白质组学和代谢组学)的原始数据以及相应的表型信息。通常基于串联的整合不需要任何预处理,因此没有阶段2。在第3阶段,将来自各个组学的数据连接起来,形成多组学数据的单个大型矩阵。最后,在第4阶段,联合矩阵用于监督或非监督分析。 使用基于串联的方法的主要优点是,一旦完成所有单个组学的串联,就可以简单地使用ML分析连续或分类数据。这些方法平等地使用所有连接的特征,并且可以为给定表型选择最具辨别力的特征。
不同的基于串联的监督学习方法已被用于表型预测。 串联的多组学数据(以联合矩阵的形式)作为不同经典ML方法的输入,如DT(decision tree)、NB(naive Bayes)、ANN(artificial neural networks)、SVM(support vector machine)、KNN(k-nearest neighbors)、RF(random forest)和k-Star。例如,多组学特征(包括基因表达、拷贝数变异和突变)的联合矩阵与经典RF和SVM一起用于预测抗癌药物反应。同样,多变量的LASSO模型也被研究过。此外,Boosted trees和SVR(support vector regression)也被用于寻找血糖健康的纵向预测因素。除了经典的ML算法外,深度神经网络也被广泛用于分析串联的多组分数据。
各种基于串联的无监督方法已用于聚类和关联分析。 近年来基于矩阵分解的方法已经发展起来,联合NMF(non-negative matrix factorisation)被提出来整合具有非负值的多组学数据。iCluster框架使用了类似于NMF的原理,但允许集成具有负值的数据集。iCluster+框架提供了对iCluster框架的重大改进,iCluster+ 框架可以以发现模式并结合一系列具有二元、分类和连续值的组学,并通过结合来自结肠直肠癌数据集的基因组数据得到证明。NMF的另一个适应性被评估为JIVE(Joint and Indivial Variation Explained),它捕获了集成数据类型之间的联合变化和每种数据类型的结构变化以及残余噪声。MoCluster使用多区块多变量分析来突出不同输入组学数据的模式,然后找到其中的联合聚类。MoCluster通过整合蛋白质组学和转录组学数据进行验证,与Cluster和iCluster+相比,MoCluster显示出明显更高的聚类精度和更低的计算成本。LRAcluster被开发用于整合高维多组学数据。此外,还有最近提出的iClusterBayes,一种完全贝叶斯潜变量模型。它克服了iCluster+在统计推断和计算速度方面的局限性。
基于模型的整合方法为不同的组学数据创建多个中间模型,然后从各种中间模型构建最终模型。如上图基于模型的整合方法的一般流程为:第1阶段建立单独组的原始数据以及相应的表型信息。在第2阶段,为每个组学开发单独的模型,这些模型随后在第3阶段集成到联合模型中。在第4阶段中,对关节模型进行分析。 基于模型的集成方法的主要优点是,它们可以用于合并基于不同组学类型的模型,其中每个模型是从具有相同疾病信息的不同患者组开发的。
基于模型的监督学习方法包括用于开发模型的各种框架, 如多数投票算法(majority-based voting)、分层分类器(hierarchical classifiers)、基于集成的方法如XGBoost 和KNN。基于模型的监督学习也采用了深度学习方法,例如MOLI、DFNForest框架、Chaudhary等。ATHENA(Analysis Tool for Heritable and Environmental Network Associations)被开发用于分析多组学数据,其使用grammatical evolution neural networks以及Biofilter和Random Jungl来研究不同的分类和定量变量,并开发预测模型。最近,还开发了用于泛癌分析的MOSAE。
目前已经实现了各种 基于模型的无监督学习方法。 PSDF (Patient-Specific Data Fusion)是一种非参数贝叶斯模型,通过结合基因表达和拷贝数变异数据对预测癌症亚型进行聚类。类似地,CONEXIC还使用BN整合肿瘤样本的基因表达和拷贝数变化,以识别驱动突变。另一方面,诸如 FCA((Formal Concept Analysis)共识聚类、MDI(Multiple Dataset Integration)、PINS(Perturbation clustering for data integration and disease subtyping)、PINS+ 和 BCC(Bayesian consensus clustering)等聚类方法更加灵活,允许后期的聚类整合。不同的基于网络的方法也可用于关联分析,例如Lemon Tree和SNF(Similarity Network Fusion)等。
基于转换的整合方法首先将每个组学数据集转换为图形或核矩阵,然后在构建模型之前将所有数据集合并为一个。如上图基于转换的整合方法的一般流程为:第1阶段建立单独组的原始数据以及相应的表型信息。在第2阶段,为每个组学开发单独的转换(以图形或内核关系的形式),这些转换随后在第3阶段集成到联合转换中。最后,在第4阶段对其进行分析。 基于转换的整合方法的主要优点是,如果唯一信息(例如患者 ID)可用,它们可用于组合广泛的组学研究。
之前提出的基于转换的监督学习方法大多数是基于内核和基于图的算法, 其中基于内核的算法有SDP-SVM (Semi-Definite Programming SVM)、FSMKL (Multiple Kernel Learning with Feature Selection)、RVM (Relevance Vector Machine)和Ada-boost RVM等。此外,fMKL-DR (fast multiple kernel learning for dimensionality rection)已与SVM一起用于基因表达、miRNA表达和DNA甲基化数据。基于图的算法有SSL(semi-supervised learning )、graph sharpening、composite network和BN等。总体而言,从文献中可以明显看出,基于内核的算法比基于图的方法具有更好的性能。最近,引入了MORONET(Multi-Omics gRaph cOnvolutional NETworks) ,它利用组学特征和患者之间的关联使用图卷积网络来获得更好的分类结果。
基于转换的无监督方法, 例如rMKL LPP(regularised multiple kernel learning for Locality Preserving Projections)被用于聚类分析。类似地,PAMOGK也是利用图核、SmSPK(smoothed shortest path graph kernel)将多组学数据与通路整合起来。Meta-SVM (Meta-analytic SVM)整合了多种组学数据,能够检测与乳腺癌和特发性肺纤维化等疾病相关的一致基因。最近,NEMO(NEighborhood based Multi-Omics clustering)被引入,使用基于患者间相似性矩阵的距离度量来单独评估输入组学数据集。然后将这些组学矩阵组合成一个矩阵,使用基于光谱的聚类进行分析。
高通量组学的可用性提供了一个独特的机会来探索不同组学和表型目标之间的复杂关系。研究团队总结了已发表的基于表型目标的不同多组学研究,发现大多数多组学研究集中于不同形式的癌症。特别是与乳腺癌和卵巢癌相关的多组学研究突出了科学界在这些领域的研究重点。
许多组学内部研究已经成功地探索了基因表达和DNA甲基化的整合。LASSO的方法已分别应用于急性髓系白血病和乳腺癌,也被用于癌症预后。同样,分别使用Neural Fuzzy Network对结直肠癌、SVM对胰腺癌和RF对心脏组织老化和卵巢癌进行mRNA–miRNA整合研究。SVM还通过整合不同的转录组学(即mRNA、miRNA和IncRNA),用于口腔鳞状细胞癌的研究。
代谢组学和蛋白质组学已使用RF进行整合,用于分析前列腺癌和甲状腺功能。同样,代谢组学与mRNA相结合,用于研究溃疡性结肠炎和癌症存活率。另一方面,糖组学和表观基因组学仅在多组学环境中出现过一次(连同mRNA和代谢组学),相关研究使用RF的图形变体研究与年龄相关的合并症。最近,代谢组学和蛋白质组学也与脂质组学相结合,使用PLS-DA和Extra Trees来评估COVID-19患者。
在植物(马铃薯)和动物(如犬心脏病)中也成功地进行了多组学研究。总的来说,最近不同的多组学研究强调了整合方法在理解不同疾病的复杂性和从大量生成的多组学数据中发现潜在异常方面的优势。
*文献原文中表8汇总了已发表的基于表型目标的不同多组学研究,可通过文献原文获取详细信息。
为了便于方法选择过程,研究人员提出了推荐流程图,显示了为给定场景选择适当方法(或方法系列)所需的各种决策步骤。例如,要选择一种方法来整合两个组学进行无监督学习,如果两个组学是基因表达和CNV,则可以选择基于模型的方法,如“PSDF或Lemon-Tree”,否则可以使用“MDI或SNF”。类似地,“NEMO”可用于数据集部分重叠的场景,并且需要转换方法。因此,它可以用于生物医学分析,包括诊断、预后和生物标志物识别,将其作为有监督或无监督的学习问题。
首发公号:国家基因库大数据平台
参考文献
Reel P S, Reel S, Pearson E, et al. Using machine learning approaches for multi-omics data analysis: A review[J]. Biotechnology Advances, 2021: 107739.
⑸ 基因组学技术分别应用哪些分析手段
基因组学(英文genomics),研究生物基因组和如何利用基因的一门学问。用于概括涉及基因作图、测序和整个基因组功能分析的遗传学分支。该学科提供基因组信息以及相关数据系统利用,试图解决生物,医学,和工业领域的重大问题 基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics),又被称为后基因组(postgenome)研究,成为系统生物学的重要方法。 基因组学能为一些疾病提供新的诊断,治疗方法。例如,对刚诊断为乳腺癌的女性,一个名为“Oncotype DX”的基因组测试,能用来评估病人乳腺癌复发的个体危险率以及化疗效果,这有助于医生获得更多的治疗信息并进行个性化医疗。基因组学还被用于食品与农业部门。 基因组学的主要工具和方法包括: 生物信息学,遗传分析,基因表达测量和基因功能鉴定。 基因组学出现于1980年代,1990年代随着几个物种基因组计划的启动,基因组学取得长足发展。 相关领域是遗传学,其研究基因以及在遗传中的功能。 1980年,噬菌体Φ-X174;(5,368 碱基对)完全测序,成为第一个测定的基因组。
⑹ 怎么利用抗原组学等新技术发现新抗原
免疫系统识别并消除癌细胞的过程是复杂的。
并受许多因素的调控,这些因素中就包括癌细胞中突变发生的质量和数量。其中最重要的过程之一就是肿瘤新抗原的产生。
⑺ 目前常用的高通量组学技术方法有哪些
主要采用:激发兴趣法、问题引导法、指导归纳法、诵读法、自主探究法、合作交流法、相互质疑法等。
辅助手段:多媒体课件、录音机、图片模具等。
希望我的答案能帮到你。
⑻ 如何将蛋白质组学应用在自己的课题中
如何将蛋白质组学应用在自己的课题中
对分离的蛋白质 进行鉴定是蛋白质组研究的重要内容,蛋白质微量测序、氨基酸组成分析等传统的蛋白质鉴定技术不能满足高通量和高效率的要求,生物质谱技术是蛋白质组学(Proteomics)的另一支撑技术。
生物质谱技术在离子化方法上主要有两种软电离技术,即基质辅助激光解吸电离(matrix―assisted laser desorption/ionization,MALDl)和电喷雾电离(electrospray ionization,ESl)。MALDI是在激光脉冲的激发下,使样品从基质晶体中挥发并离子化。ESI使分析物从溶液相中电离,适合与液相分离手段(如液相色谱和毛细管电泳(capillary electrophoresis))联用。MALDI适于分析简单的肽混合物,而液相色谱与ESI―MS的联用(LC―MS)适合复杂样品的分析。
软电离技术的出现拓展了质谱的应用空间,而质量分析器的改善也推动了质谱仪技术的发展。生物质谱的质量分析器主要有4种:离子阱(iontrap,IT)、飞行时间(TOF)、四极杆(quadrupole)和傅立叶变换离子回旋共振(Fourier transform ion cyclotron resonance,FTICR)。它们的结构和性能各不相同,每一种都有自己的长处与不足。它们可以单独使用,也可以互相组合形成功能更强大的仪器。
离子阱质谱灵敏度较高,性能稳定,具备多级质谱能力,因此被广泛应用于蛋白质组学(Proteomics)研究,不足之处是质量精度较低。与离子阱相似,傅立叶变换离子回旋共振(FTICR)质谱也是一种可以“捕获”离子的仪器,但是其腔体内部为高真空和高磁场环境,具有高灵敏度、宽动态范围、高分辨率和质量精度(质量准确度可很容易地小于1mg/L),这使得它可以在一次分析中对数百个完整蛋白质分子进行质量测定和定量。FTICR―MS的一个重要功能是多元串级质谱,与通常的只能选一个母离子的串级质谱方式不同,FTICR―MS可以同时选择几个母离子进行解离,这无疑可以大大增加蛋白质鉴定工作的通量。但是它的缺点也很明显,操作复杂、肽段断裂效率低、价格昂贵等,这些缺点限制了它在蛋白质组学(Proteomics)中的广泛应用。MALDI通常与TOF质量分析器联用分析肽段的精确质量,而ESI常与离子阱或三级四极杆质谱联用,通过碰撞诱导解离(collision―inceddissociation,CID)获取肽段的碎片信息。
⑼ 组学技术——ATAC-seq
最近和很多小伙伴聊到ATAC-seq这个组学技术,正好趁此机会学习分享一下。
要想知道ATAC-seq的作用,首先必须知道染色质的结构,以human为例,有一定molecular biology背景的人都知道,人类的DNA并不是裸露的,长度惊人的DNA链是以一种特殊的结构被“收纳”在细胞中的:DNA缠绕在组蛋白上,形成串珠式的结构。这样的结构还能够进一步折叠、浓聚,并在其他架构蛋白的辅助下,进而形成染色体。
新的问题在于,这样的高级结构必然会导致转录的难以进行,那么细胞如何调整来进行正常的转录呢?答案就在于 染色质重塑 (chromatin remodeling),染色质重塑是通过对染色质结构的动态修饰,从而允许凝聚的基因组 DNA 与调控转录机制的相关蛋白相互作用,从而控制基因表达。[1]基于这样的调控机制,可以将染色质分为两类: 常染色质 (松散或开放染色质,euchromatin)结构可用于转录; 异染色质 (紧密或闭合染色质,heterochromatin)结构更紧凑,不易进行转录。
基于上面的描述,我们如何对基因组上不同的染色质结构进行研究呢?ATAC-seq给了我们这样的机会,ATAC-seq全称 A ssay for T ransposase- A ccessible C hromatin using seq uencing,是一种在全基因组范围内评估 染色质开放性 的组学技术,是表观遗传学研究的重要方法,该项技术于2013年被斯坦福大学William Greenleaf教授团队开发,相关论文发表在 Nature Methods 上。[3]
转座子 (transposons)是基因组上的一种元件,它能够改变自己在基因组上的位置,具有“跳跃性”,这个生物学过程就是由转座酶介导的(transposase),Tn5就是一种转座酶。 已经有研究表明,在体外例如转座子更倾向于插入开放染色质区域。 [4]所以ATAC-seq利用这个特点,将测序所用adaptor加在Tn5转座酶上,这样Tn5转座酶就可以将adaptor添加到开放染色质区域的DNA两端,这样就可以对这部分序列进行测序了。(当然作者们对其可行性进行了一波三折的评估,包括将其与之前经典的染色质结构研究组学技术 DNase-Seq 和 FAIRE-Seq 结果的比较)
还有其它的技术能够实现这样的目的,它们分别是 DNase-Seq 、 FAIRE-Seq 和 MNase-seq *,原理相通~
Reference:
[1] https://en.wikipedia.org/wiki/Chromatin_remodeling .
[2] Xu J, Liu Y. Probing Chromatin Compaction and Its Epigenetic States in situ With Single-Molecule Localization-Based Super-Resolution Micros. Front Cell Dev Biol . 2021;9:653077.
[3] Buenrostro JD, Giresi PG, Zaba LC, Chang HY, Greenleaf WJ. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nat Methods . 2013;10(12):1213-1218.
[4] Gangadharan S, Mularoni L, Fain-Thornton J, Wheelan SJ, Craig NL. DNA transposon Hermes inserts into DNA in nucleosome-free regions in vivo. Proc Natl Acad Sci . 2010;107(51):21966-21972.
⑽ 如何应用蛋白质组学技术进行肿瘤研究思路设计
双向凝胶电泳 双向凝胶电泳的原理是第一向基于蛋白质的等电点不同用等电聚焦分离,第二向则按分子量的不同用SDS-PAGE分离,把复杂蛋白混合物中的蛋白质在二维平面上分开。由于双向电泳技术在蛋白质组与医学研究中所处的重要位置,它可用于蛋白质转录及转录后修饰研究,蛋白质组的比较和蛋白质间的相互作用,细胞分化凋亡研究,致病机制及耐药机制的研究,疗效监测,新药开发,癌症研究,蛋白纯度检查,小量蛋白纯化,新替代疫苗的研制等许多方面。近年来经过多方面改进已成为研究蛋白质组的最有使用价值的核心方法。 等电聚焦 等电聚焦(isoelectric focusing,IEF)是60年代中期问世的一种利用有pH梯度的介质分离等电点不同的蛋白质的电泳技术。等电聚焦凝胶电泳依据蛋白质分子的静电荷或等电点进行分离,等电聚焦中,蛋白质分子在含有载体两性电解质形成的一个连续而稳定的线性pH梯度中电泳。载体两性电解质是脂肪族多氨基多羧酸,在电场中形成正极为酸性,负极为碱性的连续的pH梯度。蛋白质分子在偏离其等电点的pH条件下带有电荷,因此可以在电场中移动;当蛋白质迁移至其等电点位置时,其静电荷数为零,在电场中不再移动,据此将蛋白质分离。 生物质谱 生物质谱技术是蛋白质组学研究中最重要的鉴定技术,其基本原理是样品分子离子化后,根据不同离子之间的荷质比(M/E)的差异来分离并确定分子量。对于经过双向电泳分离的目标蛋白质用胰蛋白酶酶解(水解Lys或Arg的-C端形成的肽键)成肽段,对这些肽段用质谱进行鉴定与分析。目前常用的质谱包括两种:基质辅助激光解吸电离-飞行时间质谱(MALDI-TOF-MS)和电喷雾质谱(ESI- MS)。 飞行时间质谱 MALDI 的电离方式是 Karas和Hillenkamp于1988年提出。MALDI的基本原理是将分析物分散在基质分子(尼古丁酸及其同系物)中并形成晶体,当用激光(337nm的氮激光)照射晶体时,基质分子吸收激光能量,样品解吸附,基质-样品之间发生电荷转移使样品分子电离。它从固相标本中产生离子,并在飞行管中测定其分子量,MALDI-TOF-MS一般用于肽质量指纹图谱,非常快速(每次分析只需3~5min),灵敏(达到fmol水平),可以精确测量肽段质量,但是如果在分析前不修饰肽段,MALDI-TOF-MS不能给出肽片段的序列。 电喷雾质谱(ESI-MS) ESI- MS是利用高电场使质谱进样端的毛细管柱流出的液滴带电,在N2气流的作用下,液滴溶剂蒸发,表面积缩小,表面电荷密度不断增加,直至产生的库仑力与液滴表面张力达到雷利极限,液滴爆裂为带电的子液滴,这一过程不断重复使最终的液滴非常细小呈喷雾状,这时液滴表面的电场非常强大,使分析物离子化并以带单电荷或多电荷的离子形式进入质量分析器。ESI-MS从液相中产生离子,一般说来,肽段的混合物经过液相色谱分离后,经过偶联的与在线连接的离子阱质谱分析,给出肽片段的精确的氨基酸序列,但是 分析时间一般较长。 目前,许多实验室两种质谱方法连用,获得有意义的蛋白质的肽段序列,设计探针或引物来获得有意义的基因。随着蛋白质组研究的深入,又有多种新型质谱仪出现,主要是在上述质谱仪的基础上进行改进与重新组合。