導航:首頁 > 信息系統 > 生物信息學中家族成員怎麼找

生物信息學中家族成員怎麼找

發布時間:2023-06-12 00:00:53

A. TBtools | 快速(以分鍾計)且准確地獲取家族進化分支成員

生物信息數據下游分析,是一個非常復雜,且幾乎沒有也不可能流程化的操作。究其原因, 但凡貼近生物學問題,需要更多生物學視角,甚至是研究人員的直覺 。而這,恰恰又是工作亮點挖掘,做出有意義工作的關鍵;甚至說實際一點,paper 發得好不好的關鍵。解決,是不可能解決的。但是加速,是存在可能的。TBtools 的相當部分功能,也正是其這個作用。簡而言之, TBtools,打輔助。

在數據中,挖掘生物學故事的時候+,我們常常會拿一些已知基因更或者是已知通路為參考,大體可以分為兩種操作:

兩種操作,各有千秋。不過,從某種角度來說,往往從傳統視角出發,可以發現更多東西,畢竟這是比較solid地站在巨人的肩膀上。那麼問題來了,ARF本身在植物的每個物種中都是基因家族,擬南芥在ARF3對應我們材料中,哪一個ARF?如何去確定?解決辦法一般有三:

其實快速的解決辦法還是有的。這幾天,為了搞好學位論文,我刷了不少個papers,整理了與課題 可能 相關的通路(以及基因)。對著自己的數據,就需要做前述工作。鑒定了五個轉錄因子家族之後,不想再整了(Sad...真的挺麻煩)。可能搞分析的會提出,你怎麼不用orthofinder之類的?還是不要來搞笑了。一是計算量和時間;二是精度。好吧,那咋辦?我不想幹了。那就只能突發奇想,......, 既然又是生信大佬們都看不上的,那就我自己來

分析第一步,打開TBtools

來個示例

其他的都設置完畢,填上一個ID介面,點擊 Start,大概過了 一分鍾...(注意,如果按照鑒定家族 + 構建進化樹,半天或者一兩天是正常的,因為還有許多坑....)。結果出來了,直接右鍵復制就可以用了。連你自己想辦法去截取分支,拿到ID,都幫你搞定了。

Emmm,這是一個問題,我也不知道。不過我有不是沒有 參考答案 。在這個工具寫出來之前,我鑒定了這個家族成員R2R2MYB,同時把100來個序列和擬南芥的100來個R2R3MYB一起建了顆ML樹。結果如下:

不對啊,怎麼會跟預期不符合啊。Emmm....

OK,Confirmed ! 也就是說,我。。。鑒定 R2R3MYB的時候,漏掉了。Sad,因為,我只看了Pfam,而Pfam,不夠優秀,敏感度決定了他只挖掘到一個domain。所以,基於domain的篩選,其實不要搞太早,不然反而會過濾掉正確的結果。當然,如果我還結合 MEME 的結果,應該就不會漏吧。

但是,話說回來,我現在有了「FindBestHomology」這個功能,還搞家族鑒定幹啥?新功能,確實可以, 更靈敏,更靠譜! ,又快又好,真香!

前天晚上鼓搗了下思路,搞了功能;昨天早上8點出門前開始寫了點推文;晚上23點左右回來繼續整理下,現在是24點04分。時間過得真快。之所以寫了一個來小時,因為網頁崩潰了,推文歷史記錄差點找不回來。最後我是通過URL反轉義回來,然後再手動調整。或許,如果沒找回來,這個推文也就不會出來了。
很久沒有增加新功能了,主要還是我課題上沒有太多新的 迫切的 需求。
PS:早前提過,TBtools論文沒有被接收之前,不做更新;前幾天更新了,於是多少大家猜到了目前情況;前前後後十來人問要新的 doi號,大體是 預印本大家還是不太認可或者加引用不方便... 不過,確實暫時木有新doi,繼續bioRxiv吧。新的doi出來了,自然公告一下。謝謝各位支持了。

B. 用 生物信息學軟體 解決 一個生物學問題

下個mega4.1
去NCBI或者Eztaxon或者www.bacterio.cict.fr或者其他能鏈接到資料庫地方下載一些細菌的16sDNA序列。
然後用mega比對就可以做一個系統樹了。

比如可以做一個假單胞菌屬的系統發育樹,選擇幾個假單胞菌的序列,選擇合適的計算方法,用軟體計算出系統樹。記得還要放一個屬外種作為參考啊。

別指望有多人回答,這里大多都是中學生。

C. 在你看來學習生物信息學有哪些比較好的網站或論壇

國外與生物信息學相關的網站有哪些
生物信息學高度依賴於網路。實際上,你需要的幾乎所有資源,都可以從網上下到。你需要關注你研究領域所需要的那些,而不是全部的資源。
我原來常用的:
NCBI:持有INSDC的節點。網站上有核酸、蛋白、基因名、基因組名等等的搜索工具,以及BLAST序列比對搜索工具,PUBMED文獻資料庫,Taxonomy數據,COG蛋白家族庫等等。FTP可以下到它全部的資料庫,BLAST的單機程序,以及各種工具程序。
EBI:和NCBI類似,歐洲搞的對等物。感覺EBI網站比NCBI要清楚簡潔。另外EBI網站整合了更多的工具,比如多序列比對。
Uniprot:全蛋白庫。NCBI和EBI的蛋白庫來源於此。目前包括兩部分:SwissProt是人工校對過的,TrEMBL是自動校對的。
Pfam:蛋白家族庫。可以使用配套的HMMER進行搜索。比BLAST能找到更遠緣的東西,而且找到的東西是結構域。
Rfam:RNA的,類似Pfam。
RDP:16S rRNA庫。除了序列,它還有一個基於K-mer naive Bayesian model的rdp classifier,可以對輸入序列進行物種分類,效率和准確性較直接使用BLAST更高。
GreenGenes:也是16S庫,不過它只收集比較全的序列。它提供了一個16S的標准化比對,並基於這個東西搞了個物種分類工具。
EMBOSS:一個工具包,提供了幾百個進行序列操作的工具。
BioPerl、BioPython:Perl和Python的生物學模塊。
R:類似matlab的語言,有一大堆的生物學包。
SOAP:華大基因搞的高通量測序工具包,有de-novo拼接的,有mapping的,還有一些後續分析的。
bowtie:一個用於序列mapping的軟體。
samtools:用於操縱、分析高通量序列mapping的結果。功能非常靈活,但有點復雜。
fastx toolkit:用來操縱高通量測序序列的工具包。

閱讀全文

與生物信息學中家族成員怎麼找相關的資料

熱點內容
實體店怎麼做洗衣液代理 瀏覽:416
2k22怎麼交易球隊 瀏覽:292
普通人做什麼產品最賺錢 瀏覽:660
2010年市場金如意多少一克 瀏覽:89
家庭理財產品如何統計 瀏覽:743
暫停交易和臨時停牌有什麼區別 瀏覽:765
菜市場買的菇叫什麼名字好吃 瀏覽:345
如何惹怒一個女程序員 瀏覽:299
速度時間圖像能提供哪些信息 瀏覽:781
快手小程序里發布了視頻怎麼刪掉 瀏覽:182
委託全程代理起訴書怎麼寫 瀏覽:95
代理一個公司需要哪些條件 瀏覽:297
重慶板材交易市場有哪些 瀏覽:304
表的數據結構有哪些 瀏覽:850
年輕人該學什麼技術好 瀏覽:490
牛奶下沉市場在哪裡 瀏覽:619
產品專員是什麼單位 瀏覽:636
我們應該如何解決假冒產品問題 瀏覽:732
泰安批發襪子的市場在哪裡 瀏覽:170
多個年份的數據如何分析 瀏覽:811