導航:首頁 > 數據處理 > 怎麼獲取數據進化

怎麼獲取數據進化

發布時間:2023-02-21 09:45:04

A. 數據分析進化階段有哪些這才是數據分析師變強的必經之路

我們經常使用商業收益率來定位數據分析的不同階段,所以我們將其劃分為四個階段。


1、數據分析進化階段有哪些——到目前為止,觀測數據發生了什麼變化?


首先,基本數據表示可以告訴我們發生了什麼。例如,該公司上周為一個新的搜索引擎發布了一則廣告,它想在一周內比較新渠道和現有渠道B的性能,A和B帶來了多少流量,以及轉換效果如何?例如,有多少用戶喜歡這個新產品,有多少人在新的注冊流中注冊。根據數據本身提供的內容,需要數據來顯示結果。


2、數據分析進化階段有哪些——明白為什麼會這樣嗎?


如果我們看到為什麼A渠道比B渠道帶來更多的流量,我們應該根據業務進一步判斷這種現象的原因。此時,我們可以通過數據信息進一步進行深度分離,也許是流量帶來的一個關鍵字,也許是通過渠道更多地訪問移動終端用戶。這種對數據的深入分析和判斷已經成為商業分析的第二高級水平,也可以提供更多的商業價值。


3、數據分析進化階段有哪些——預測未來會發生什麼?


當我們知道了A和B頻道半年的銷量不到100萬台所產生的流量後,蘋果會放棄印度市場嗎?低,基於過去的知識來預測未來會發生什麼。當發布通道C和D時,最好的猜測是通道C比通道D好。當新的注冊流和新的優化上線時,我們可以知道哪些節點更有可能出現問題。我們還可以通過數據挖掘自動預測和確定C和D通道的差異,這是數據分析的第三個高級階段,可以預測未來的結果。


4、數據分析進化階段有哪些——業務決策


最有意義的工作是做出業務決策,使用數據來確定應該做什麼。業務數據分析的目的是業務結果。只有將數據分析的輸出直接轉化為決策,或者將數據直接用於決策,才能直接體現數據分析的價值。


數據分析進化階段有哪些?這才是數據分析師變強的必經之路,最有意義的工作是做出業務決策,使用數據來確定應該做什麼。業務數據分析的目的是業務結果。只有將數據分析的輸出直接轉化為決策,你能處理好嗎?如果您還擔心自己入門不順利,也可以點擊本站的其他文章進行學習。

B. qq飛車手游數碼進化怎麼玩

1. 基本技巧
起步:超級起步、段位起步
小噴:點噴、刮噴、空噴、落地噴
出彎:單噴、雙噴、link噴、段位雙噴、段位單噴
2. 進階技巧
適應性漂移:側身漂移、甩尾漂移、連續漂移
調整性漂移:停滯漂移、三段式漂移、拖漂
技巧性漂移:撞牆點漂、撞牆拖漂
3. 高級技巧
測卡、松前、牽引、點卡、段位拉車頭

除了以上技巧,要想成為車神,其他方面也很重要:
1. 掌握賽車數據
賽車數據並不難獲取,在車庫中就能得到性能六邊形數據初步圖,再根據自己想要得到的數據,在賽道中進行測試就能夠得到該車的准確數值。
2. 選擇一輛好的車
目前版本所有A車中就是狗車最強,因為他的特性能提升小噴的能力,每個彎道都有個雙噴,觸發幾率很大,能與其他車拉開差距。
B車的話,小編推薦只買卓越和大Q吧,其他都不要買,卓越作為曾經的B車之王,雖然現在的卓越已經被削弱,但還是比其他車強力,是沖刺性的極品賽車,大Q吧是B車的性價比之王。
3. 如果有可能,你可以選擇電腦虐手機黨
玩過端游QQ飛車的都知道,那操作手感是用手機玩不能相提並論的。想像一下你的對手是手機黨,而你用電腦,是不是可以完爆對手了?
如果你電腦配置足夠高的話,你可以嘗試模擬器!如果電腦配置不夠高,小編推薦可以把手機投屏到電腦上讓後用電腦來玩(如現在比較火的tcgames),滑鼠鍵盤玩QQ飛車手游,讓你瞬間變車神!好吧,我們跑道上再會.

C. 口袋妖怪怎麼通訊進化

如下:

1、先要確認自己需要進化的寶可夢的進化方法是否是通訊進化。

2、找到可以和你進行通訊進化的好友。

3、商量之後確認對方信息,按y鍵進入交流界面,選擇連接交換。

4、把你需要通訊進化的寶可夢和對方交換,寶可夢就會在交換給對方之後通訊進化。

5、再次聯系游戲好友,把通訊進化成功的寶可夢再次通訊交換回來就能獲得該寶可夢了。

游戲世代:

所有由寶可夢公司監制的正版寶可夢游戲可以大致被分為數個世代。這些世代大致按照發售的年代排序,當主系列游戲在發售時引入了新的寶可夢、角色和游戲玩法時,這一游戲被認為是系列的新一時代。主系列游戲和旁支游戲、動畫、漫畫和集換式卡片游戲均會在新世代開始之時進行升級。

D. html怎麼獲取後端數據獲取方法介紹

1、首先先創建一個HTML,html是前端頁面骨架,然後通過javascript調用後端接。口,接受返回的response,這里通過前端的一個select下拉框,調用後台的介面填充數據。
2、html中的需求是在頁面在完成後select獲取資料庫中的值並填充其中,這里定義ajax方法。
3、然後編寫後台的程序,編寫servlet/controller中的獲取資料庫值的方法。
4、在前端根據servlet/controller返回的值在js中渲染標簽中的值。
5、通過ajax的方式先移除原先的元素,然後再把資料庫的值填充進去。
6、因為html中引用了jquery,所以一定要引入jquery腳本。
7、開發servlet/controller時要注意返回數據的格式。

E. 數碼寶貝新世紀手游數據源在那裡可以得到

數碼寶貝新世紀手游數據源在以下地方可以得到:
1、挖礦可以卡等級,挖礦先收集材料,這里可以獲取很多鑽石和進化材料數據源。
2、支線任務:沒做完章節主線任務時是可以反復完成支線任務再獲取數據源。

F. TBtools | 快速(以分鍾計)且准確地獲取家族進化分支成員

生物信息數據下游分析,是一個非常復雜,且幾乎沒有也不可能流程化的操作。究其原因, 但凡貼近生物學問題,需要更多生物學視角,甚至是研究人員的直覺 。而這,恰恰又是工作亮點挖掘,做出有意義工作的關鍵;甚至說實際一點,paper 發得好不好的關鍵。解決,是不可能解決的。但是加速,是存在可能的。TBtools 的相當部分功能,也正是其這個作用。簡而言之, TBtools,打輔助。

在數據中,挖掘生物學故事的時候+,我們常常會拿一些已知基因更或者是已知通路為參考,大體可以分為兩種操作:

兩種操作,各有千秋。不過,從某種角度來說,往往從傳統視角出發,可以發現更多東西,畢竟這是比較solid地站在巨人的肩膀上。那麼問題來了,ARF本身在植物的每個物種中都是基因家族,擬南芥在ARF3對應我們材料中,哪一個ARF?如何去確定?解決辦法一般有三:

其實快速的解決辦法還是有的。這幾天,為了搞好學位論文,我刷了不少個papers,整理了與課題 可能 相關的通路(以及基因)。對著自己的數據,就需要做前述工作。鑒定了五個轉錄因子家族之後,不想再整了(Sad...真的挺麻煩)。可能搞分析的會提出,你怎麼不用orthofinder之類的?還是不要來搞笑了。一是計算量和時間;二是精度。好吧,那咋辦?我不想幹了。那就只能突發奇想,......, 既然又是生信大佬們都看不上的,那就我自己來

分析第一步,打開TBtools

來個示例

其他的都設置完畢,填上一個ID介面,點擊 Start,大概過了 一分鍾...(注意,如果按照鑒定家族 + 構建進化樹,半天或者一兩天是正常的,因為還有許多坑....)。結果出來了,直接右鍵復制就可以用了。連你自己想辦法去截取分支,拿到ID,都幫你搞定了。

Emmm,這是一個問題,我也不知道。不過我有不是沒有 參考答案 。在這個工具寫出來之前,我鑒定了這個家族成員R2R2MYB,同時把100來個序列和擬南芥的100來個R2R3MYB一起建了顆ML樹。結果如下:

不對啊,怎麼會跟預期不符合啊。Emmm....

OK,Confirmed ! 也就是說,我。。。鑒定 R2R3MYB的時候,漏掉了。Sad,因為,我只看了Pfam,而Pfam,不夠優秀,敏感度決定了他只挖掘到一個domain。所以,基於domain的篩選,其實不要搞太早,不然反而會過濾掉正確的結果。當然,如果我還結合 MEME 的結果,應該就不會漏吧。

但是,話說回來,我現在有了「FindBestHomology」這個功能,還搞家族鑒定幹啥?新功能,確實可以, 更靈敏,更靠譜! ,又快又好,真香!

前天晚上鼓搗了下思路,搞了功能;昨天早上8點出門前開始寫了點推文;晚上23點左右回來繼續整理下,現在是24點04分。時間過得真快。之所以寫了一個來小時,因為網頁崩潰了,推文歷史記錄差點找不回來。最後我是通過URL反轉義回來,然後再手動調整。或許,如果沒找回來,這個推文也就不會出來了。
很久沒有增加新功能了,主要還是我課題上沒有太多新的 迫切的 需求。
PS:早前提過,TBtools論文沒有被接收之前,不做更新;前幾天更新了,於是多少大家猜到了目前情況;前前後後十來人問要新的 doi號,大體是 預印本大家還是不太認可或者加引用不方便... 不過,確實暫時木有新doi,繼續bioRxiv吧。新的doi出來了,自然公告一下。謝謝各位支持了。

G. 口袋妖怪修改器怎麼弄進化啊我用的是口袋妖怪黑白2的修改器

很久沒有玩模擬器了,我印象中你需要知道每個精靈的進化條件,等級進化的你就修改經驗值或者修改到進化前的一級,然後升級進化,如果是條件進化就修改道具滿足進化條件,如果是其他條件進化,則需要修改相應數據,達到進化條件然後升級進化。其實等級進化的,你修改下經驗值進化下就得了,其他條件進化的,除了需要道具的外,還是自己慢慢培養有意思,我當年擁有第一隻美麗龍的時候興奮了好久的說,那時候我沒有用模擬器或者金手指的,但是游戲的樂趣就在這里了嘛。

H. 方舟生存進化怎麼下載生存者數據

1、首先打開電腦,打開網頁搜索游戲《方舟生存進化》官網。
2、其次進入官網後,點擊數據下載。
3、最後在數據下載中找到生存者數據,點擊下載即可。

I. 分子進化樹構建及數據分析方法介紹【轉】

首先是方法的選擇。
基於距離的方法有UPGMA、ME(Minimum Evolution,最小 進化 法)和NJ(Neighbor-Joining,鄰接法)等。其他的幾種方法包括MP(Maximum parsimony,最大簡約法)、ML(Maximum likelihood,最大似然法)以及貝葉斯(Bayesian)推斷等方法。其中UPGMA法已經較少使用。
一般來講,如果模型合適,ML的效果較好。對近緣序列,有人喜歡MP,因為用的假設最少。MP一般不用在遠緣序列上,這時一般用NJ或ML。對相似度很低的序列,NJ往往出現Long-branch attraction(LBA,長枝吸引現象),有時嚴重干擾 進化樹 的構建。貝葉斯的方法則太慢。對於各種方法構建分子 進化樹 的准確性,一篇綜述(Hall BG. Mol Biol Evol 2005, 22(3):792-802)認為貝葉斯的方法最好,其次是ML,然後是MP。其實如果序列的相似性較高,各種方法都會得到不錯的結果,模型間的差別也不大。
對於NJ和ML,是需要選擇模型的。對於各種模型之間的理論上的區別,這里不作深入的探討,可以參看Nei的書。對於蛋白質序列以及DNA序列,兩者模型的選擇是不同的。以作者的經驗來說,對於蛋白質的序列,一般選擇Poisson Correction(泊松修正)這一模型。而對於核酸序列,一般選擇Kimura 2-parameter(Kimura-2參數)模型。如果對各種模型的理解並不深入,作者並不推薦初學者使用其他復雜的模型。
Bootstrap幾乎是一個必須的選項。一般Bootstrap的值>70,則認為構建的 進化樹 較為可靠。如果Bootstrap的值太低,則有可能 進化樹 的拓撲結構有錯誤, 進化樹 是不可靠的。
對於 進化樹 的構建,如果對理論的了解並不深入,作者推薦使用預設的參數。需要選擇模型的時候(例如用NJ或者ML建樹),對於蛋白序列使用Poisson Correction模型,對於核酸序列使用Kimura-2參數模型。另外需要做Bootstrap檢驗,當Bootstrap值過低時,所構建的 進化樹 其拓撲結構可能存在問題。並且,一般推薦用兩種不同的方法構建 進化 樹,如果所得到的 進化 樹類似,則結果較為可靠。
軟體的選擇 表1中列出了一些與構建分子 進化 樹相關的軟體。
構建NJ樹,可以用PHYLIP(寫得有點問題,例如比較慢,並且Bootstrap檢驗不方便)或者MEGA。MEGA是Nei開發的方法並設計的圖形化的軟體,使用非常方便。作者推薦MEGA軟體為初學者的首選。雖然多雪列比對工具ClustalW/X自帶了一個NJ的建樹程序,但是該程序只有p-distance模型,而且構建的樹不夠准確,一般不用來構建 進化 樹。
構建MP樹,最好的工具是PAUP,但該程序屬於商業軟體,並不對學術免費。因此,作者並不建議使用PAUP。而MEGA和PHYLIP也可以用來構建 進化 樹。這里,作者推薦使用MEGA來構建MP樹。理由是,MEGA是圖形化的軟體,使用方便,而PHYLIP則是命令行格式的軟體,使用較為繁瑣。對於近緣序列的進化樹構建,MP方法幾乎是最好的。構建ML樹可以使用PHYML,速度最快。或者使用Tree-puzzle,速度也較快,並且該程序做蛋白質序列的進化樹效果比較好。而PAML則並不適合構建進化樹。
ML的模型選擇是看構出的樹的likelihood值,從參數少,簡單的模型試起,到likelihood值最大為止。ML也可以使用PAUP或者PHYLIP來構建。這里作者推薦的工具是BioEdit。BioEdit集成了一些PHYLIP的程序,用來構建進化樹。Tree-puzzle是另外一個不錯的選擇,不過該程序是命令行格式的,需要學習DOS命令。PHYML的不足之處是沒有win32的版本,只有適用於64位的版本,因此不推薦使用。值得注意的是,構建ML樹,不需要事先的多序列比對,而直接使用FASTA格式的序列即可。
貝葉斯的演算法以MrBayes為代表,不過速度較慢。一般的進化樹分析中較少應用。由於該方法需要很多背景的知識,這里不作介紹。
表1 構建分子進化樹相關的軟體
軟體

網址

說明

ClustalX

http://bips.u-strasbg.fr/fr/Documentation/ClustalX/

圖形化的多序列比對工具

ClustalW

http://www.cf.ac.uk/biosi/research/biosoft/Downloads/clustalw.html

命令行格式的多序列比對工具

GeneDoc

http://www.psc.e/biomed/genedoc/

多序列比對結果的美化工具

BioEdit

http://www.mbio.ncsu.e/BioEdit/bioedit.html

序列分析的綜合工具

MEGA

http://www.megasoftware.net/

圖形化、集成的進化分析工具,不包括ML

PAUP

http://paup.csit.fsu.e/

商業軟體,集成的進化分析工具

PHYLIP

http://evolution.genetics.washington.e/phylip.html

免費的、集成的進化分析工具

PHYML

http://atgc.lirmm.fr/phyml/

最快的ML建樹工具

PAML

http://abacus.gene.ucl.ac.uk/software/paml.html

ML建樹工具

Tree-puzzle

http://www.tree-puzzle.de/

較快的ML建樹工具

MrBayes

http://mrbayes.csit.fsu.e/

基於貝葉斯方法的建樹工具

MAC5

http://www.agapow.net/software/mac5/

基於貝葉斯方法的建樹工具

TreeView

http://taxonomy.zoology.gla.ac.uk/rod/treeview.html

進化樹顯示工具

需要注意的幾個問題是:
其一,如果對核酸序列進行分析,並且是CDS編碼區的核酸序列,一般需要將核酸序列分別先翻譯成氨基酸序列,進行比對,然後再對應到核酸序列上。這一流程可以通過MEGA 3.0以後的版本實現。MEGA3現在允許兩條核苷酸,先翻成蛋白序列比對之後再倒回去,做後續計算。
其二,無論是核酸序列還是蛋白序列,一般應當先做成FASTA格式。FASTA格式的序列,第一行由符號「>」開頭,後面跟著序列的名稱,可以自定義,例如user1,protein1等等。將所有的FASTA格式的序列存放在同一個文件中。文件的編輯可用Windows自帶的記事本工具,或者EditPlus(google搜索可得)來操作。
文件格式如圖1所示:
圖1 FASTA格式的序列

NCBI的COG介紹:
什麼是 COG ?
「 COG 」是Cluster of Orthologous Groups of proteins(蛋白相鄰類的聚簇)的縮寫。構成每個 COG 的蛋白都是被假定為來自於一個祖先蛋白,並且因此或者是 orthologs 或者是paralogs。Orthologs是指來自於不同物種的由垂直家系(物種形成)進化而來的蛋白,並且典型的保留與原始蛋白有相同的功能。Paralogs是那些在一定物種中的來源於基因復制的蛋白,可能會進化出新的與原來有關的功能。請參考文獻獲得更多的信息。
COG 分類是如何構建的?
COG 是通過把所有完整測序的基因組的編碼蛋白一個一個的互相比較確定的。在考慮來自一個給定基因組的蛋白時,這種比較將給出每個其他基因組的一個最相似的蛋白(因此需要用完整的基因組來定義 COG 。注1)這些基因的每一個都輪番的被考慮。如果在這些蛋白(或子集)之間一個相互的最佳匹配關系被發現,那麼那些相互的最佳匹配將形成一個 COG (注2)。這樣,一個 COG 中的成員將與這個 COG 中的其他成員比起被比較的基因組中的其他蛋白更相像,盡管如果絕對相似性比較的。最佳匹配原則的使用,沒有了人為選擇的統計切除的限制,這就兼顧了進化慢和進化快的蛋白。然而,還有一個加的限制就是一個COG必須包含來自於3個種系發生上遠的基因組的一個蛋白。
注1:僅僅應用在形成COG時,不包含新蛋白的信息。
注2:為了簡化,許多步驟都省略的,請參考文獻。
使用COG可以得到什麼樣的信息?
簡單的說,有三方面的信息:
1,蛋白的註解。COG的一個蛋白成員的已知功能(以及二維或三維結構)可以直接應用到COG的其他成員上去。然而,這里也要警告,因為有些COG含有paralogs,它們的功能並非對應與那些已知蛋白。
2,種系發生圖譜。這給出在一個特定的COG中一個給定物種是否存在某些蛋白。系統使用,這些圖譜可以用來確定在一個物種中是否一個特定的代謝途徑。
3,多重對齊。每一個COG頁麵包括了一個鏈接到COG成員的一個多重對齊,那可以被用來確定保守序列殘基和分析成員蛋白的進化關系。
COG分類有哪些?
目前COG分類中每個字母代表的功能分類含義:
INFORMATION STORAGE AND PROCESSING
[J] Translation, ribosomal structure and biogenesis
[A] RNA processing and modification
[K] Transcription
[L] Replication, recombination and repair
[B] Chromatin structure and dynamics
CELLULAR PROCESSES AND SIGNALING
[D] Cell cycle control, cell division, chromosome partitioning
[Y] Nuclear structure
[V] Defense mechanisms
[T] Signal transction mechanisms
[M] Cell wall/membrane/envelope biogenesis
[N] Cell motility
[Z] Cytoskeleton
[W] Extracellular structures
[U] Intracellular trafficking, secretion, and vesicular transport
[O] Posttranslational modification, protein turnover, chaperones
METABOLISM
[C] Energy proction and conversion
[G] Carbohydrate transport and metabolism
[E] Amino acid transport and metabolism
[F] Nucleotide transport and metabolism
[H] Coenzyme transport and metabolism
[I] Lipid transport and metabolism
[P] Inorganic ion transport and metabolism
[Q] Secondary metabolites biosynthesis, transport and catabolism
POORLY CHARACTERIZED
[R] General function prediction only
[S] Function unknown

遺傳密碼的新排列和起源探討
肖景發, 於軍 中國科學院北京基因組研究所, 中國科學院「基因組科學及信息」重點實驗室
摘要根據DNA核苷酸組分的動態變化規律將遺傳密碼的傳統排列按 密碼子 對GC和嘌呤含量的敏感性進行了重排. 新密碼表可劃分為兩個半區(或1/2區)和四個四分區(或1/4區). 就原核生物基因組而言, 當 GC含量 增加時, 物種蛋白質組所含的氨基酸傾向於使用GC富集區和嘌呤不敏感半區所編碼的氨基酸, 它們均使用四重簡並密碼, 對DNA序列的突變具有相對魯棒性(Robustness). 當 GC含量 降低時, 大多數 密碼子 處於AU富集區和嘌呤敏感半區, 這個區域編碼的氨基酸具有物理化學性質的多樣性. 因為當 密碼子 第三位核苷酸(CP3)在嘌呤和嘧啶之間發生轉換時, 密碼子 所編碼的氨基酸也傾向於發生變化.
關於遺傳密碼的 進化 存在多種假說, 包括凝固事件假說、共 進化 假說和立體化學假說等, 每種假說均試圖解釋遺傳密碼所表現出來的某些化學和生物學規律. 基於遺傳密碼的物理化學性質、基因組變異的規律和相關的生物學假說, 我們提出了遺傳密碼 分步進化假說 (The Stepwise Evolution Hypothesis for the Genetic Code). 在人們推斷的最原始的RNA世界裡, 原初(Primordial)遺傳密碼從只能識別嘌呤和嘧啶開始, 編碼一個或兩個簡單而功能明確的氨基酸. 由於胞嘧啶C的化學不穩定性, 最初形成的遺傳密碼應該僅僅由腺嘌呤A和尿嘧啶U來編碼, 卻可得到一組七個多元化的氨基酸. 隨著生命復雜性的增加, 鳥嘌呤G從主載操作信號的功能中釋放出來, 再伴隨著C的引入, 使遺傳密碼逐步擴展到12、15和20個氨基酸, 最終完成全部 進化 步驟.
遺傳密碼的 進化 過程同時也伴隨以蛋白質為主體的分子機制和細胞過程的 進化 , 包括氨醯tRNA合成酶(AARS)從初始翻譯機器上的脫離、DNA作為信息載體而取代RNA以及AARS和tRNA共 進化 等基本過程. 分子機制和細胞過程是生命的基本組成元件, 它們不但自己不斷地趨於完善, 也促使生命體走著不盡相同的道路, 要麼維持魯棒性(Robustness, 如細菌), 要麼尋覓多元化(Diversity, 如節肢動物和植物), 要麼追求綜合性(Complexity, 如脊椎動物).
自從 密碼子 被全部發現以來, Crick[1]
就將遺傳密碼表排列成化學家所認可的形式. 盡管後來有些特殊表現形式的列方式(如同心圓、八卦式和二元密碼等), 但其基本排布一直延續至今[1~3]
. 遺傳密碼以4個脫氧核糖核苷酸作為基本符號來組成遺傳信息, 並以20個氨基酸作為基本結構單元來構建蛋白質. 遺傳密碼是使用4個鹼基(兩個嘌呤: 腺嘌呤A和鳥嘌呤G; 2個嘧啶: 尿嘧啶U和胞嘧啶C)構成的三聯體 密碼子 , 共64個, 分別對應20個氨基酸或翻譯起始和終止信號. 生物體要將DNA分子中儲存的信息內涵轉變成功能內涵, 就要利用信使mRNA、解碼分子tRNA和完整翻譯機器等多重功能. 各種復雜分子機制和細胞過程的誕生和成熟一定會反映生命從RNA世界到RNA-蛋白質世界, 再到RNA-蛋白質-DNA世界逐漸轉變的過程, 遺傳密碼作為一個獨立的生物學機制也一定是漫長生命 進化 過程中的一個必然產物.
20世紀60年代初, 實驗分子生物學最大的進展就是解碼遺傳密碼, 發現它在生命有機體中, 基本是統一的. 自此不同的假設均試圖解釋遺傳密碼的信息和化學特性, 從簡單的凝固事件假說到更復雜的統計學、共 進化 和立體化學理論. 凝固事件假說認為 密碼子 與氨基酸的對應關系是在某個生命發生時段里被固定下來, 並且很難被改變[2]
, 這個假說一直被基於適應性、歷史性和化學性的不同論點所挑戰[4]
. 盡管關於遺傳密碼的 進化 也有人提出過不同的假設, 但是解釋 密碼子 的分配原則、物理化學性質的相關性和DNA組分變化對 密碼子 使用頻率的牽動, 從而揭示遺傳密碼表的生物學本質仍然是一個不小的挑戰[2,5]
.
1 重排遺傳密碼表
重排遺傳密碼表有3個重要原因. 首先, DNA序列有4個最基本的可度量的變化, 即核苷酸序列、序列長度、 GC含量 和嘌呤(R或AG)含量. 假如把核苷酸序列和長度相對於時間的變化暫時不考慮, 那麼只有後面的兩個變數對於傳統的遺傳密碼表具有影響力, 所以重排應該以GC和嘌呤含量的變化為主線. 但以前大家熟知的密碼表排列只是為了簡明和清晰地顯示 密碼子 和氨基酸的一一對應關系, 卻忽略了密碼表本身對氨基酸物理化學性質多樣性的表現和DNA編碼承受突變的魯棒性等明顯信息. 因此, 有必要把傳統的密碼表進行重新排列[6]
, 使其能夠表現信息內涵和功能內涵之間的基本關系. 其次, 當 GC含量 和嘌呤含量變化時, 希望從密碼表中找出相應蛋白質組成變化的線索. 圖1展示了 GC含量 和嘌呤含量在極端狀態下4個微生物基因組的氨基酸組分分布.

(1) RNA世界和早期遺傳密碼. RNA世界的存在首先被RNA分子具有相應催化功能的生物學特性所支持[22~26]
. 在RNA世界裡, RNA具有雙重的功能, 既是信息載體也是功能載體. 因為生命的基本分子機制和細胞過程起源於RNA世界, 所以沒有理由說遺傳密碼不起源於RNA世界. 在RNA世界裡RNA分子可以組成簡單的核苷酸多聚物, 這種多聚物在近億年的成熟期里, 為生命提供了足夠的功能上的復雜性和多樣性. 原始細胞可以通過相互爭斗和吞噬獲得基本的組成成分,因此基於模板的RNA合成可能對於生命的初始不是必需的. 可以想像這些RNA分子可以通過簡單的聚合酶來合成, 通過自身剪接或化學修飾轉變為其他相似的結構, 從而達到結構的可變性和功能的多樣性. 此外, RNA的編輯(RNA Editing)也一定起了非常重要的作用, 這一分子機制一直延續到現在, 在包括人類在內的高級物種中仍然存在.
在現代生物世界裡, 剪接體(Spliceosome)通常是用於RNA分子的剪接, 由蛋白質和RNA分子組成. 可以做兩個假設, 生命可能起源於類真核有機體的原型細胞(在DNA引入之前)而不是類原核有機體的原型細胞. 在RNA組成的翻譯機器(Translational Machinery)沒有形成之前, 初始遺傳密碼可能不是必需的. 一旦這個初始生命進入到RNA-蛋白質組成的世界時, 多肽才逐漸按照密碼子開始有序合成, 遺傳密碼就開始發揮其作用了. 可以認為有序的生命可以在與相對無序生命的爭斗中更容易獲勝和取得繁衍的空間.
現在可以推測初始遺傳密碼在RNA世界存在和 進化 的基本過程和起源時的基本邏輯關系. 初始生命一定比較簡單, 分子間相互作用也比較寬松, 最小的編碼系統可能只要區分嘌呤R和嘧啶Y就夠了. 假定現代密碼在生命的早期階段已經被統一並相對忠實地繼承了RNA密碼的基本關系, 這個可能的原始編碼就至少有7個氨基酸(I和M視為等同; 圖5), 同時也有起始和終止密碼子. 這7個氨基酸的側鏈具有廣泛的物理化學性質(氨基、醯基、苯環、羥基、酚基、烴鏈和甲硫基等), 但是沒有小的和酸性的氨基酸. 可以推測: 體積小的氨基酸在初始蛋白質相互作用中的作用顯然不如大的重要, 而鹼性氨基酸的功能對於酸性DNA則是顯而易見的. 另外的一種可能性是氨基酸與tRNA以及AARS之間的關系不是十分明確, 一個密碼子對應多氨基酸的情況可能在遺傳密碼成熟前是普遍存在的[27]
. 由於7個氨基酸的編碼區處於現代密碼表的AU富集區, 可以確信初始密碼子始於這個區域, 後來擴展到嘌呤敏感區即所謂趨變半區. 這個階段的存在既復合由簡到繁的邏輯, 也迎合了實驗的證據, 那就是C的不穩定性和G在RNA操作功能上的作用[21, 28~29]
.

(3) 遺傳密碼的第二次拓展. 當GU和AG從作為剪接信號功能釋放出來以後(剪接體的結構和功能隨著蛋白質的演變而復雜化和精密化), 遺傳密碼引入了Arg, Ser和Val. 氨基酸的個數變成15個, 這次擴展是對已經存在的氨基酸物理化學性質和二級結構特性的擴展. Arg是Lys的替代體, Ser則對應Tyr, Val是疏水性氨基酸Leu, Ile和Met的補充[32~35]
.
最具吸引力的是六重簡並的3個氨基酸Arg, Leu和Ser. 這些氨基酸在被引入後, 又由於核苷酸C在RNA世界的應用而擴展出各自的新四聯碼, 成為六重簡並. 首先, Leu是在現代基因組中包括所有三界生物在內最豐富的氨基酸, Ser是真核生物第二豐富的氨基酸, Arg也是一個富有的氨基酸, 通常在細菌基因組中位於前10位. 其次, Leu在二重簡並密碼和四重簡並之間最容易轉換, 只需要通過簡單U到C轉換(UUR-CUR)即可, 這也說明Leu對於大多數蛋白質來說是用於當 GC含量 增加時維持蛋白質功能的完整性. 這些觀察引出相應的假設: 這3個氨基酸的附加密碼是為了當 GC含量 或AG含量增加時平衡富有氨基酸, 相應的密碼分布按照平衡遺傳密碼的蛋白質多樣性和蛋白質魯棒性二等分. 這種平衡能力用於當編碼序列突變發生時穩定蛋白質的氨基酸組成, 從而維護蛋白質結構的完整性.
(4) 遺傳密碼的最終拓展. 遺傳密碼的最終拓展是在DNA作為信息載體取代RNA使得信息載體具有更高的准確性和穩定性, 同時也產生了最為關鍵的從RNA到DNA的逆轉錄機制. 基於模板的DNA復制機制開辟了新的DNA-蛋白質-RNA世界. 很多新分子機制的 進化 包括DNA復制和修復、RNA的轉錄等, 使這個生物界里分子機制和細胞過程更趨於多元和完善. 同時當C和其脫氧衍生物分別作為結構模板加入RNA和DNA時, 標准遺傳密碼也就隨之產生並被固定下來. 遺傳密碼本身得到新的補充並且編碼能力有了很大提高. 組氨酸(His)和Glu立刻加入進來, 主要是由於它們具有相應的催化性質以及和原有的兩個鹼性氨基酸的相似性, Thr擴展了Ser的功能, 同時使蛋白質的結構增加了精細度, Ala同Ser相比具有類似的體積和尺度, 但其和Ser比具有很強的疏水性質[32,33]
. 這些新引入的氨基酸在蛋白質結構和功能多樣性上起到非常關鍵的作用. 不容懷疑的是Pro的最後加入, 它具有其他氨基酸所不具備的性質, 即通過特有的方式使蛋白質的骨架結構扭曲達到蛋白質結構的緊密折疊. 相應的擴展模式在AARS同樣得到支持遺傳密碼擴展的假設, 除了3個六重簡並的遺傳密碼外, 這次共有六組遺傳密碼最終被引入, 同時編碼6個氨基酸. 這6個氨基酸的AARS分類按照G和I 的配對原則延伸而來. 例如AARS對於雙重編碼的氨基酸His(CAR)和Gln(CAY)的對應, Glu(GAR)和Asp(GAY)的對應等.
遺傳密碼的 進化 就是密碼子的有序發生和合理分布, 這個分布的合理性一定經過一個復雜選擇過程. 首先, 通過長時間的創造和優化, 使其在基因組核苷酸序列發生突變時對蛋白質的結構起到緩沖的作用; 第二, 密碼子採取這樣一種特殊的排布方式: 當DNA組成從AU富集區到GC富集區改變時, 氨基酸的分布傾向於從具有催化性質的氨基酸轉到具有結構性質的氨基酸; 第三, 充分利用密碼子第三位多變的優勢(通常體現在R和Y之間的轉換), 來改變編碼氨基酸的物理化學性質, 致使在趨變半區里大約有15個氨基酸對第三個位置R和Y之間的轉換呈現敏感.
(5) 分子機制與細胞過程的 進化 . 盡管分子機制與細胞過程的根本界限有時會很模糊, 但還是將它們分開: 前者強調物理性的相互作用、發生的空間和組分的存在, 後者強調化學反應的結果、發生的時間和過程. 從一方面講, DNA的變異顯然是細胞過程的產物, 遺傳密碼的發生和最終形成也是它的產物. 從另一方面講, 密碼子與氨基酸的關系影響到細胞的蛋白質組分的變化, 即分子機制的變化[21]
. 比如, 如果在RNA世界需要產生多個拷貝的RNA分子, 一定需要一個分子機制來實現. 在現代生物世界裡, 通常是由以DNA為模板的轉錄機制來完成, 但在RNA世界裡沒有RNA的復制, 多個RNA分子產生是由多聚酶和編輯體(Editosome)共同來完成的. 也許就是那個最原始的細胞機制. RNA世界的第二個分子機制發明可能是就剪接體, 這個分子機制在現代生物世界裡仍然在發揮其重要的作用. 第三個分子機制也許是翻譯體(Translatosome)的形成, 其用於直接進行蛋白質分子的加工, 這一分子機制是從原始的RNA世界到成熟的RNA世界再到現代生物世界裡轉折的重要標志. 在轉折期里, 分子機制在蛋白質精確度的變化中不斷完善和復雜, 直到DNA通過RNA和蛋白質的復合體引進到生命世界

閱讀全文

與怎麼獲取數據進化相關的資料

熱點內容
代理補繳社保如何辦理 瀏覽:820
配送招投標信息網哪個最全 瀏覽:130
出版書籍需要什麼程序 瀏覽:919
怎麼鑒別美瞳的代理 瀏覽:561
條碼技術為什麼流行 瀏覽:26
三體什麼技術最好 瀏覽:497
在網上賣產品怎麼選品 瀏覽:538
什麼軟體可以查看jpg的數據 瀏覽:127
德州批發市場有哪些 瀏覽:437
80後學點什麼技術謀生 瀏覽:384
一卡通業務怎麼找代理 瀏覽:335
python如何替換excel單元格數據 瀏覽:275
紅米版本信息在哪裡 瀏覽:285
qq怎麼樣設置時間信息 瀏覽:540
容桂代理記賬有哪些 瀏覽:735
立邦代理怎麼做 瀏覽:301
要做程序員該怎麼選方向 瀏覽:875
招聘代理商怎麼操作 瀏覽:417
產品正常損耗如何計算 瀏覽:717
qq如何查群活躍數據 瀏覽:143