⑴ 求自學生物信息學相關的課程
我現在在讀生物信息學的博士,
編程語言十分推薦 python,非常易學易用。
統計學課程很重要,經典的統計檢驗,概率論,統計建模等
統計學編程語言推薦R
歡迎到我的博客看看,生物信息,python,R,linux相關
http://i.azpala.com/
可以在我博客上留言交流 :)
我很少上Q
⑵ 如何自學生物信息學
一、計算機基礎,需要看三本書,一步步的學會學通,不需要刻意去找哪個書,一般linux是鳥哥私房菜,perl是小駱駝咯,R是R in action,但是看一本書只能入門,真正想成為菜鳥,必須每個要看五本書以上!我雲盤裡面有這基本上的高清列印版,大家可以去淘寶列印一下才幾十塊錢還包郵,對書比較講究的也可以買正版,也不過是一百多塊錢而已!
二、生信基礎知識,測序方面,在網路文庫找十幾篇一代二代三代測序儀資料仔細研讀,然後去優酷下載各大主流測序儀的動畫講解,再看看陳巍學基因的講解;資料庫先看看三大主流資料庫——NCBI,ENSEMBL,UCSC,還有一些也可以了解一些(uniprot,IMGT,KEGG,OMIN,TIGR,GO)同樣也是網路文庫自己搜索資料,但是這次需要自己去官網一個個頁面點擊看,一個個翻譯成中文理解吃透;數據格式講起了就多了,這個主要是在項目流程中慢慢學,或者你有機會去上課,不然你看來也是立馬忘記的,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等。
三、生信研究領域,各個領域主要是軟體繁多,合起來常用的估計有上百個軟體了,一般只有從業五六年以上的人才有可能把它們全部用過一遍,而且這也完全需要項目來訓練,而不能僅僅是看看軟體手冊,但是研究領域最重要的是背後的原理,需要看各大牛的綜述。
a) 生信基礎軟體(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)。
b) snp-calling相關軟體(bwa,bowtie,samtools,GATK,VarScan.jar,annovar)。
c) 基因組相關軟體(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)。
d) 轉錄組相關軟體(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)。
四、生信應用領域,講這一塊其實已經脫離了生信菜鳥的解釋范圍了,主要是想說社會上為什麼需要搞生信的人才,全是因為在腫瘤篩查,產前診斷,流行病學,個性化醫療等領域有所應用,可以造福人類!這方面政策不確定,產業不定型,所以也這絕對是藍海,但是也絕對不會有現成的資料直接培訓人才,我們必須關注各種微信公眾號,逛各種測序,醫學相關論壇,緊跟業界精英的腳本,同時追著大牛的文獻閱讀,如此這般才能保住菜鳥的身份!
⑶ 自學生物信息學是種怎樣的體驗
應該是生物類裡面就業最好的了,雖然也是不怎麼能看,不過其他生物類更是不行,完全渣。本行就是做生物信息的工作,分析基因組,疾病之類,把數據和生物聯系起來,雖然現在還沒發展好,不過幾年以後應該還是有一定前景的。編程能力好的也可以做程序員去IT或者通信,不過生信不太強調編程能力,主要是生物概念和軟體,所以要自學一些。
⑷ 請教如何學習生物信息學
首先得了解生物信息學做什麼。推薦一本入門的書:《探索基因組學、蛋白質組學和生物信息學》,這本書基本上把現在用到的生物信息的基本技術講了一遍。
然後是學會如何應用現有的工具。現在有很多已經寫好的工具,只要會看幫助文檔,對於解決手頭的工作是提供了相當大的幫助。
學習一門語言。python,perl,R,都可以,只要能夠幫自己解決問題就好。
⑸ 如何自學生物信息學
第一階段是基礎知識學習,找一本覆蓋面廣但是又不是很難啃的教材先對生物信息所涉及各個方面有所了解,比如人衛版李霞主編那本《生物信息學》,當然我只是隨便舉例,這本書很多章節的內容就是直接翻譯的網站文檔……
第二階段是一個逐步深入的過程,這個過程中要學會工具的使用。比如編程是學Perl還是Python,現在R也得學了。演算法方面最基本的那幾個比如Smith-Waterman、Needleman-Wunsch、Dynamic Programming等要了解清楚,結合一些工具比如blast來學習。一些資料庫網站也是需要了解清楚的比如NCBI之類的就不用說了,比如很多人都用DAVID來進行生物模式識別分析了當碰到來與你討論的人時你也要有所了解才行,合理地尋找和利用資源。多看e文書和文檔吧,多動手寫,一定要動手寫。
第三階段是進行研究,就你個人的興趣或者你的工作需要選定一個/些領域來研究,進一步學習更多東西,這就學無止境了,HMM啦Bayes啦ANN啦……比如我就對高通量測序和腫瘤遺傳學感興趣那麼我就來研究這個。
⑹ 如何自學生物信息學
先說一下自己吧,我碩士讀的是細胞生物學,今年4月開始在boss要求下自學perl,打聽了下,這本書不錯,就買來開始看,等5月份去北京參加公司的培訓班時,讀了一遍,看了一部分。培訓回來,我們的項目就開始做了,9月拿到所有原始數據和分析結果。然後,我對照著公司的分析報告,試著自己走一邊分析流程,中間遇到問題,自己解決不了的,就發郵件求助。有幾點需要注意:
1. 我能理解你想早些玩兒數據的願望,但是在這之前,最好要有一個outline.需要知道數據從哪兒來的,怎麼產生的?其實就是測序儀的工作原理。然後是數據質量檢驗,為什麼需要數據過濾?接著是reads拼接和組裝。總之,要對整個流程有一個認識,而後在學習的過程中,再不斷回頭對比這個流程,這樣才不會有迷失的感覺。[這本書](BioInformatics for High Throughput Sequencing)推薦看一下。
2. 有了基礎知識的鋪墊,就可以嘗試著自己做些練習了,paper上面都會給出他們的數據、原碼地址,可以找來自己試試,先看看自己能不能做出一樣的效果。當然,這時要是你手裡正好有項目,那就更好了。
3. 學生物信息,paper肯定是要跟蹤的。這兩個網站可以經常看一下:
[homologous](Homologus - Frontier in Bioinformatics) 覆蓋生物信息有趣的論文, 演算法,以及生物科學問題。這個網站還匯集了很多生物信息領域科學家的博客。再如BGI的主程羅瑞邦, SAMtools、BWA的作者Heng Li都有在這里出現。
[rna-seq Blog](RNA-Seq Blog) 推薦新的論文、工作、培訓課程、大型會議等。
如果你是生物背景的,那麼計算機方面的知識需要補一下:
- 需要能在linux環境下舒服的工作。比如從源碼編譯安裝軟體、PATH配置,再比如舒服地使用google找到問題的答案 :-)
- 學會使用python/perl。比如有的時候運行一個軟體老是報錯,可能就是因為在一個包含幾十萬行的文本文件里,有隨機的那麼幾千行的末個位置,多一個冒號,[就像這里](using HTSeq | popucui), 這時候你知道需要怎麼做了?
- 學會R。要從一大堆基因裡面找出表達水平變化的基因來,需要統計分析和顯著檢驗;而要把我們的數據更直觀地展示出來,最好的方式就是圖形了吧。這兩個需要,R都能滿足。當然matlab也是可以的,區別在於R是開源工具。
- 具備了上述技能,那麼常用的軟體就能用起來了。隨著學習的深入,可能你的問題別人也沒遇到過,這時候就需要自己動手,要麼修改現成的工具,要麼自己做一個出來。這時候,除了python/perl,或許還可以學學C/C++/java,或許需要研究下比如BWT、De Bruijn Graph背後的原理。
⑺ 如何自學生物信息學
1,從現有的生物信息學工具開始,要熟悉如何利用先用的軟體、網路伺服器、資料庫等等,為生物研究服務,不要做重復工作,能用現成的就不自己開發。
2,熟悉命令行的操作系統,DOS,Linux,可以編寫簡單的shell;進而能安裝命令行級的程序,跑一些常規的流程。要學習如何尋找和安裝軟體,這是最重要也是最基本的技能。其實很多問題,如果找到合適的軟體包,都是迎刃而解的。
3,熟悉一種簡單的腳本語言,個人推薦用python,具體原因可以見我的帖子。在沒有現成工具時,或需要數據格式轉換時,小的腳本是非常有用的。一般的應用無需自己寫太多的代碼,要相信我們通常遇到的問題,別的高手可能早就遇到了,所以網路上有大量的工具包。至於更多的編程語言,一門精則門門通,R,perl等都是類似的。
4,熟悉簡單的演算法和數據結構的知識,這樣就可以理解很多程序的內在機制,進而知道它們的優點和缺點,對自己寫程序也有幫助。有精力的話,進而學習統計、機器學習等。。
5,在自己的生物領域內擴展,調研,分析,開發。
⑻ 如何學好生物信息學大家有什麼建議
最好要有一個outline.需要知道數據從哪兒來的,怎麼產生的?其實就是測序儀的工作原理。然後是數據質量檢驗,為什麼需要數據過濾?接著是reads拼接和組裝。總之,要對整個流程有一個認識,而後在學習的過程中,再不斷回頭對比這個流程,這樣才不會有迷失的感覺。有了基礎知識的鋪墊,就可以嘗試著自己做些練習了,paper上面都會給出他們的數據、原碼地址,可以找來自己試試,先看看自己能不能做出一樣的效果。當然,這時要是你手裡正好有項目,那就更好了。學生物信息,paper肯定是要跟蹤的。
⑼ 自學生物信息學真的有效嗎
計算機基礎,需要看三本書,一步步的學會學通,不需要刻意去找哪個書,一般linux是鳥哥私房菜,perl是小駱駝咯,R是R in action,但是看一本書只能入門,真正想成為菜鳥,必須每個要看五本書以上,生信基礎知識,測序方面,在網路文庫找十幾篇一代二代三代測序儀資料仔細研讀,然後去優酷下載各大主流測序儀的動畫講解,再看看陳巍學基因的講解;資料庫先看看三大主流資料庫,NCBI,ENSEMBL,UCSC,還有一些也可以了解一些,同樣也是網路文庫自己搜索資料,但是這次需要自己去官網一個個頁面點擊看,一個個翻譯成中文理解吃透;數據格式講起了就多了,這個主要是在項目流程中慢慢學,或者你有機會去上課,不然你看來也是立馬忘記主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl。