導航:首頁 > 信息系統 > 生物信息學中家族成員怎麼找

生物信息學中家族成員怎麼找

發布時間：2023-06-12 00:00:53

A. TBtools | 快速（以分鍾計）且准確地獲取家族進化分支成員

生物信息數據下游分析，是一個非常復雜，且幾乎沒有也不可能流程化的操作。究其原因， 但凡貼近生物學問題，需要更多生物學視角，甚至是研究人員的直覺 。而這，恰恰又是工作亮點挖掘，做出有意義工作的關鍵；甚至說實際一點，paper 發得好不好的關鍵。解決，是不可能解決的。但是加速，是存在可能的。TBtools 的相當部分功能，也正是其這個作用。簡而言之， TBtools，打輔助。

在數據中，挖掘生物學故事的時候+，我們常常會拿一些已知基因更或者是已知通路為參考，大體可以分為兩種操作：

兩種操作，各有千秋。不過，從某種角度來說，往往從傳統視角出發，可以發現更多東西，畢竟這是比較solid地站在巨人的肩膀上。那麼問題來了，ARF本身在植物的每個物種中都是基因家族，擬南芥在ARF3對應我們材料中，哪一個ARF？如何去確定？解決辦法一般有三：

其實快速的解決辦法還是有的。這幾天，為了搞好學位論文，我刷了不少個papers，整理了與課題可能相關的通路（以及基因）。對著自己的數據，就需要做前述工作。鑒定了五個轉錄因子家族之後，不想再整了（Sad...真的挺麻煩）。可能搞分析的會提出，你怎麼不用orthofinder之類的？還是不要來搞笑了。一是計算量和時間；二是精度。好吧，那咋辦？我不想幹了。那就只能突發奇想，......， 既然又是生信大佬們都看不上的，那就我自己來 。

分析第一步，打開TBtools

來個示例

其他的都設置完畢，填上一個ID介面，點擊 Start，大概過了一分鍾...（注意，如果按照鑒定家族 + 構建進化樹，半天或者一兩天是正常的，因為還有許多坑....）。結果出來了，直接右鍵復制就可以用了。連你自己想辦法去截取分支，拿到ID，都幫你搞定了。

Emmm，這是一個問題，我也不知道。不過我有不是沒有 參考答案 。在這個工具寫出來之前，我鑒定了這個家族成員R2R2MYB，同時把100來個序列和擬南芥的100來個R2R3MYB一起建了顆ML樹。結果如下：

不對啊，怎麼會跟預期不符合啊。Emmm....

OK，Confirmed ! 也就是說，我。。。鑒定 R2R3MYB的時候，漏掉了。Sad，因為，我只看了Pfam，而Pfam，不夠優秀，敏感度決定了他只挖掘到一個domain。所以，基於domain的篩選，其實不要搞太早，不然反而會過濾掉正確的結果。當然，如果我還結合 MEME 的結果，應該就不會漏吧。

但是，話說回來，我現在有了「FindBestHomology」這個功能，還搞家族鑒定幹啥？新功能，確實可以， 更靈敏，更靠譜！ ，又快又好，真香！

前天晚上鼓搗了下思路，搞了功能；昨天早上8點出門前開始寫了點推文；晚上23點左右回來繼續整理下，現在是24點04分。時間過得真快。之所以寫了一個來小時，因為網頁崩潰了，推文歷史記錄差點找不回來。最後我是通過URL反轉義回來，然後再手動調整。或許，如果沒找回來，這個推文也就不會出來了。
很久沒有增加新功能了，主要還是我課題上沒有太多新的 迫切的 需求。
PS：早前提過，TBtools論文沒有被接收之前，不做更新；前幾天更新了，於是多少大家猜到了目前情況；前前後後十來人問要新的 doi號，大體是預印本大家還是不太認可或者加引用不方便... 不過，確實暫時木有新doi，繼續bioRxiv吧。新的doi出來了，自然公告一下。謝謝各位支持了。

B. 用生物信息學軟體解決一個生物學問題

下個mega4.1
去NCBI或者Eztaxon或者www.bacterio.cict.fr或者其他能鏈接到資料庫地方下載一些細菌的16sDNA序列。
然後用mega比對就可以做一個系統樹了。

比如可以做一個假單胞菌屬的系統發育樹，選擇幾個假單胞菌的序列，選擇合適的計算方法，用軟體計算出系統樹。記得還要放一個屬外種作為參考啊。

別指望有多人回答，這里大多都是中學生。

C. 在你看來學習生物信息學有哪些比較好的網站或論壇

國外與生物信息學相關的網站有哪些
生物信息學高度依賴於網路。實際上，你需要的幾乎所有資源，都可以從網上下到。你需要關注你研究領域所需要的那些，而不是全部的資源。
我原來常用的：
NCBI：持有INSDC的節點。網站上有核酸、蛋白、基因名、基因組名等等的搜索工具，以及BLAST序列比對搜索工具，PUBMED文獻資料庫，Taxonomy數據，COG蛋白家族庫等等。FTP可以下到它全部的資料庫，BLAST的單機程序，以及各種工具程序。
EBI：和NCBI類似，歐洲搞的對等物。感覺EBI網站比NCBI要清楚簡潔。另外EBI網站整合了更多的工具，比如多序列比對。
Uniprot：全蛋白庫。NCBI和EBI的蛋白庫來源於此。目前包括兩部分：SwissProt是人工校對過的，TrEMBL是自動校對的。
Pfam：蛋白家族庫。可以使用配套的HMMER進行搜索。比BLAST能找到更遠緣的東西，而且找到的東西是結構域。
Rfam：RNA的，類似Pfam。
RDP：16S rRNA庫。除了序列，它還有一個基於K-mer naive Bayesian model的rdp classifier，可以對輸入序列進行物種分類，效率和准確性較直接使用BLAST更高。
GreenGenes：也是16S庫，不過它只收集比較全的序列。它提供了一個16S的標准化比對，並基於這個東西搞了個物種分類工具。
EMBOSS：一個工具包，提供了幾百個進行序列操作的工具。
BioPerl、BioPython：Perl和Python的生物學模塊。
R：類似matlab的語言，有一大堆的生物學包。
SOAP：華大基因搞的高通量測序工具包，有de-novo拼接的，有mapping的，還有一些後續分析的。
bowtie：一個用於序列mapping的軟體。
samtools：用於操縱、分析高通量序列mapping的結果。功能非常靈活，但有點復雜。
fastx toolkit：用來操縱高通量測序序列的工具包。

閱讀全文

與生物信息學中家族成員怎麼找相關的資料

熱點內容

按照計劃的交易是什麼意思發布：2025-03-05 09:48:44 瀏覽：577

報名需要填哪些信息發布：2025-03-05 09:42:17 瀏覽：404

沙井碼頭海鮮市場在哪裡發布：2025-03-05 09:24:30 瀏覽：540

小程序為什麼點不動發布：2025-03-05 09:22:06 瀏覽：363

數據透析快遞總票數怎麼做發布：2025-03-05 09:22:00 瀏覽：90

交友信息注冊商標是什麼意思發布：2025-03-05 09:18:03 瀏覽：522

如何購買國外的樹脂產品發布：2025-03-05 09:13:40 瀏覽：250

微信怎麼設置崩潰程序發布：2025-03-05 09:05:47 瀏覽：10

如何應對推新產品的失敗發布：2025-03-05 09:05:45 瀏覽：682

怎麼通過華數酷喵下載當貝市場發布：2025-03-05 09:00:49 瀏覽：809

ok鏈上的去中心化交易所有哪些發布：2025-03-05 08:58:31 瀏覽：620

申請代理公司有什麼好處發布：2025-03-05 08:57:11 瀏覽：338

什麼地方能查到交通事故信息發布：2025-03-05 08:43:46 瀏覽：634

炒黃金雙向交易意味什麼發布：2025-03-05 08:22:47 瀏覽：340

更改手機開屏密碼在哪個程序里發布：2025-03-05 08:00:48 瀏覽：635

批發市場和采購網哪個便宜發布：2025-03-05 07:55:42 瀏覽：494

在哪裡查看自己的檔案信息發布：2025-03-05 07:45:02 瀏覽：571

如何查看佔用獨顯程序發布：2025-03-05 07:37:43 瀏覽：501

安全隱患培訓小程序怎麼做發布：2025-03-05 07:19:16 瀏覽：337

我國債券市場建立多少年了發布：2025-03-05 07:18:09 瀏覽：957