『壹』 GO資料庫介紹(轉載)
類似於語義網路。是為了生物界有一個統一的數據交流語言。 因為在生物學界,存在在種種同名異義、異議同名的現象。為此產生了GO項目。
GO是用一套統一的詞彙表來描述生物學中的分子功能、生物過程和細胞成分。其思想大概過程:對於一個基因產品(蛋白質或RNA),用某些詞彙來描述它是干什麼的或位於細胞哪裡、或者參與了哪個生物過程,而這些詞彙就是來自GO的Term。
(1)提供生物學功能(術語)的邏輯結構及其相互之間的關系,表現為有向無環圖
(2)給特定的基因產辯友舉物(蛋白質,非編碼RNA或大分子復合體,簡稱為'基因')起一個特定的名字(唯一標識該基因)
Gene Ontology(GO)中最基本的概念是term。GO裡面的每一個entry都有一個唯一的數字標記,形如GO:nnnnnnn,還有一個term名,比如"cell", "fibroblast growth factor receptor binding",或者"signal transction"。每個term都屬於一個ontology,總共有三個ontology,它們分別是
細胞成分:細胞的部分或其細胞外環境;
分子功能:基因產物在分子水平上的元素活性,例如結合或催化;
生物過程:具有確定開始和結束的分子事件的操作或集合,與綜合生活單元的功能有關
理由一:
在基因表達譜分析中,GO常用於提供基因功能分類標簽和基因功能研究的背景知識。利用GO的知識體系和結構特點,旨在發掘與基因差異表達現象關聯的單個特徵基因功能類或多個特徵功能類的組合。
根據GO的知識體系,使用「功能類」(或者叫做「功能模塊」)這一概念具有以下優點:我們認為,單個基因的表達情況的改變不足以反映特定功能/通路的整體變化情況。因為類似人類社會的組織結構,生物體的功能的實現決不僅僅是依靠一兩個基因功能的改變來實現的。因此過分著重單個基因表達變化,將會在後期結果處理中嚴重攜碧干擾對於結果的合理分析,導致偏倚性加大,而且是無法避免的。因此利用GO的結構體系,把參與同樣功能/通路的基因進行「功能類」層面的抽象和整合,提供比基因更高一層次的抽象結論,對理解疾病的發病機制或葯物的作用機理等更有幫助。
但是該方法也存在一定的不足,由於生物體內部的調控網路可能具有「scale-free network」的特點,個別功能重要的基因(主效基因)具有「Hub節點」的重要特性,它的功能改變可能對於整個網路來說是至關重要的,在這告凳點上,這些重要的基因又具有一定的「自私獨裁」特點。而「功能類」之觀點模糊了這種差別特性,過於強調「共性」,而忽視了「個性」,這也是「功能類」的一個不足之處,這就需要結合相關的生物學知識才能夠實現
理由二:
GO(gene ontology)對大家而言也許會是一個相對陌生的名詞,但是它已經成為生物信息領域中一個極為重要的方法和工具,並正在逐步改變著我們對 biological data的組織和理解方式,它的存在已經大大加快了我們對所擁有的生物數據的整合和利用,我們應該逐步學會理解和掌握這種思想和工具。
眾所周知,sequence based biology中的核心內容即是對序列的Annotation(注釋),其中主要包含structural annotation和functional annotation,前者涉及分析sequence在genome中的locus以及exon,intron,promoter等的location,而後者則是推斷序列編碼產物的功能
隨著多種生物genome的相繼解碼,同時大量ESTs以及gene expression profile date的積累,使得annotation的工作量和復雜度大大增加。然而另一方面,大多數基因在不同真核生物中擁有共同的主要生物功能,通過在某些物種中獲得的基因或者蛋白質(shared protein)的生物學信息,可以用以解釋其他物種中對應的基因或蛋白(especially in comparative genomics)。由於這些繁復的功能信息主要是包含在積累的文獻之中,如何有效的提取和綜合這些信息就是我們面臨的核心困難,這也是GO所要著力解決的問題。通過建立一套具有動態形式的控制字集(controlled vocabulary),來解釋真核基因及蛋白在細胞內所扮演的角色,並隨著生命科學研究的進步,不斷積累和更新。一個ontology會被一個控制字集來描述並給予一定的名稱,通過制定「本體」ontologies並運用統計學方法及自然語言處理技術,可以實現知識管理的專家系統控制
總結:
Gene Ontology(GO)包含了基因參與的生物過程,所處的細胞位置,發揮的分子功能三方面功能信息,並將概念粗細不同的功能概念組織成DAG(有向無環圖)的結構。
Gene Ontology是一個使用有控制的詞彙表和嚴格定義的概念關系,以有向無環圖的形式統一表示各物種的基因功能分類體系,從而較全面地概括了基因的功能信息,糾正了傳統功能分類體系中常見的維度混淆問題。
在基因表達譜分析中,GO常用於提供基因功能分類標簽和基因功能研究的背景知識。利用GO的知識體系和結構特點,旨在發掘與基因差異表達現象關聯的單個特徵基因功能類或多個特徵功能類的組合。
原文: https://mp.weixin.qq.com/s/e4BkqkMt7L9ZS_KBuv2rvQ
『貳』 GO 和 KEGG 的區別
1、屬性不同
Go(又稱 Golang)是 Google 的 Robert Griesemer,Rob Pike 及 Ken Thompson 開發的一種靜態強類型、編譯型語言。功能:內存安全,GC(垃圾回收),結構形態及 CSP-style 並發計算。
KEGG 是了解高級功能和生物系統(如細胞、 生物和生態系統),從分子水平信息,尤其是大型分子數據集生成的基因組測序和其他高通量實驗技術的實用程序資料庫資源,是國際最常用的生物信息資料庫之一,以「理解生物系統的高級功能和實用程序資源庫」著稱。
2、性質不同
go是計算機編程語言。
KEGG基因組破譯方面的資料庫。
(2)go在資料庫里是什麼擴展閱讀:
Go的語法接近C語言,但對於變數的聲明有所不同。Go支持垃圾回收功能。Go的並行模型是以東尼·霍爾的通信順序進程(CSP)為基礎,採取類似模型的其他語言包括Occam和Limbo。
但它也具有Pi運算的特徵,比如通道傳輸。在1.8版本中開放插件(Plugin)的支持,這意味著現在能從Go中動態載入部分函數。
與C++相比,Go並不包括如枚舉、異常處理、繼承、泛型、斷言、虛函數等功能,但增加了 切片(Slice) 型、並發、管道、垃圾回收、介面(Interface)等特性的語言級支持。Go 2.0版本將支持泛型,對於斷言的存在,則持負面態度,同時也為自己不提供類型繼承來辯護。
不同於Java,Go內嵌了關聯數組(也稱為哈希表(Hashes)或字典(Dictionaries)),就像字元串類型一樣。
KEGG是一個整合了基因組、化學和系統功能信息的資料庫。把從已經完整測序的基因組中得到的基因目錄與更高級別的細胞、物種和生態系統水平的系統功能關聯起來是KEGG資料庫的特色之一。
人工創建了一個知識庫,這個知識庫是基於使用一種可計算的形式捕捉和組織實驗得到的知識而形成的系統功能知識庫。它是一個生物系統的計算機模擬。
與其他資料庫相比,KEGG 的一個顯著特點就是具有強大的圖形功能,它利用圖形而不是繁縟的文字來介紹眾多的代謝途徑以及各途徑之間的關系,這樣可以使研究者能夠對其所要研究的代謝途徑有一個直觀全面的了解。
『叄』 晶元分析中的go分析 和 pathway分析 怎麼解讀
晶元分析中的go分析解讀:
基因本體(gene ontology),簡稱GO,是一種描述基因或基因產物基本特性的詞彙,由基因本體協會開發。
GO資料庫在建立注釋基因和蛋白質知識的標准詞彙體系,使各資料庫中基因產物功能描述相一致,隨著研究的深入,基因本體語義詞彙也在不斷更新。
Gene Ontology的分析,就是把你的基因的功能歸類注釋。
晶元分析中的pathway分析解讀 :
Pathway Analysis就是把基因、蛋白或者分子放到「Map」到某個特定的經典代謝或者調控網路,或者自己根據你的分子集的作用關系與功能,形成自己的特異的pathway。這對於闡釋分子作用機理,找到Biomarker等非常重要。
1.Pathway功能分析及顯著性判斷
對差異表達基因進行Pathway功能分析,並計算Pvalue進行顯著性判斷,Pvalue越小,表明該pathway變化越顯著,並可對每條Pathway通路圖進行展示,同時在相應的位置標注差異表達基因。
2. Pathway中基因相關性分析
根據每兩個基因共出現在同一pathway中的次數統計,繪制基因共相關點線圖,進而得到不同pathway上基因的關聯情況。在分析工具上點擊「cell differentiation」,在「Term Information」中描述了細胞分化術語的基本信息,包括樹形及與父結點、子節點關系。
對於未知基因名的序列,可以用序列直接檢索GO資料庫。點擊AmiGO首頁上方的「BLAST」,進入檢索界面。在檢索框輸入氨基酸或核酸序列或上傳序列文件,檢索工具能自動識別並相應地選擇BLASTP或BLASTX來與資料庫中的序列進行比對。以大腸桿菌DNA聚合酶Ⅱ基因polB為例,「High Scoring Gene Procts」欄內顯示基因產物的名稱、物種信息、p值。
擴展:
GO的局限性:
GO不是基因序列或基因產物資料庫,它強調基因產物在細胞中的功能。
GO是對基因功能的注釋,不能反映此基因的表達情況,即是否在特定細胞中、特定組織中、特定發育階段或與某種疾病相關。
GO不對生物學的每個方面進行描述,如功能域的結構、進化特性等。
『肆』 sqlserver中go語句有什麼作用
GO表示一個批處理的前局結束, SQLSERVER遇到Go以後就會將GO之前的語句作為一整批進行處理x0dx0a你在SSMS里執行的時候, 通常加不加都可以,但是如果實森沒在SQLCMD下慧春讓執行, GO就是一個執行命令了x0dx0a另外GO後面可以跟參數, 讓整批語句執行N次, 比如x0dx0aGO 100