導航:首頁 > 信息系統 > 生物信息分析軟體哪個好

生物信息分析軟體哪個好

發布時間:2023-01-17 17:37:36

Ⅰ 【生信知識】---Nanopore測序分析軟體nanopolish

前言: nanopolish是開源的綜合性分析軟體,集成了非常多的三代測序數據分析小工具。

1.軟體安裝:
通過Github源碼安裝:

或者,通過conda安裝:

2.主要功能:

構建索引

與參考基因組比對

利用nanopolish檢測甲基化位點

對結果進行過濾

Ⅱ 列舉常用的生物信息學資料庫及序列對比常用軟體及特點

一般來說所用的分析工具有在線跟下載的 下面簡要列舉一些常用在線軟體的使用 1、使用VecScreen工具,分析下列未知序列,輸出序列長度、載體序列的區域、可能使用的克隆載體都有哪些。一、步驟:
打開google 首頁,搜索VecScreen,進入VecScreen首頁,復制序列,運行,View report。
二、結果:
輸出序列長度918bp,
載體序列的區域456bp——854bp.
克隆載體:M13mp18 phage,pGEM-13Zf(+),pBR322,pRKW2。
2、使用相應工具,分析下列未知序列的重復序列情況,輸出重復序列的區域、包含的所有重復序列的類型、重復序列的總長度及Masked Sequence。
一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST。得出序列是human的。
進入google首頁,搜索RepeatMasker,進入RepeatMasker主頁,進入RepeatMasking,復制序列,DNA source選擇human,運行!點擊超鏈接,在結果中選擇
Annotation File :RM2sequpload_1287631711.out.html
3、使用CpGPlot/CpGReport/Isochore工具,分析下列未知序列,輸出CpG島的長度、區域、GC數量、所佔的百分比及Obs/Exp值。一、步驟:
進入google首頁,搜索CpGPlot,進入CpGPlot主頁,program中選擇cpgreport復制序列,運行!
二、結果:

CpG島的長度:385bp
區域:48——432;
GC數量:Sum C+G=297,百分數=77.14
Obs/Exp:1.01
4、預測下面序列的啟動子,輸出可能的啟動子序列及相應的位置。一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST。得出序列是human的
進入google首頁,搜索Neural Network Promoter Prediction,進入主頁,復制序列,選擇eukaryote,運行!
二、結果:

位置:711—761 ,1388—1438,1755—1805;
5、運用Splice Site Prediction工具分析下面序列,分別輸出內含子-外顯子剪接位點給體和受體的區域及剪接處位置的鹼基。一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST。得出序列是human的
進入google首頁,搜索Splice Site Prediction,進入主頁,復制序列。Organism選擇Human or other。其他默認,運行!
二、結果:
供體:

受體:
6、對下面序列進行六框翻譯,利用GENESCAN綜合分析(首先確定給定序列的物種來源)哪個ORF是正確的,輸出六框翻譯(抓圖)和GENESCAN結果(包括predicted genes/exons 和 predicted peptide sequence(s) 兩個部分)。一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST。得出序列是Zea的
進入google首頁;搜索NCBI,進入主頁,選擇all resources(A~Z),選擇O,選擇ORF finder。復制序列,默認,運行!
二、結果:ORF圖
三、步驟:進入google首頁,搜索GENESCAN,進入主頁,Organism:Maize, ,其他默認,運行!
四、結果:
G7、進入REBASE限制性內切酶資料庫,輸出AluI、MboI、EcoI三種內酶的Recognition Sequence和Type。
一、步驟:進入google首頁,google in English,搜索REBASE,進入主頁, 分別輸入AluI、MboI、EcoI,運行!
在MboI中選擇第一個,EcoI選擇第二個。
二、結果:
ENSCAN圖
8、使用引物設計工具,針對下列未知序列設計一對引物,要求引物長度為20-25bp,擴增產物長度300-500bp,退火溫度為50-60℃。請寫出選擇的一對引物(Forward Primer and Reverse Primer)、及相應的GC含量、引物的位點、Tm值和產物長度。一、步驟:進入google首頁,搜索genefisher,進入主頁,復制fasta格式,chechk input, sunmit, ; ;設置一下引物長度為20-25bp,擴增產物長度300-500bp,退火溫度為50-60℃; 。
二、結果:

GC含量:

引物的位點:

Tm值:

產物長度:。

9、將下面的序列用NEBcutter 2.0工具分析,用產生平末端及有四個酶切位點的酶進行酶切,並用抓圖提交膠圖(view gel),要求1.4% agarose和Marker為100bp DNA Ladder。
一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST,得知是linear。
進入google首頁,搜索NEBcutter 2.0,進入主頁,選擇linear,運行!選擇custom digest, ,把「1」改為「4」,選擇平末端,後digest。View gel。選擇1.4% agarose和Marker為100bp。
二、結果:

然後就是蛋白質的了一般都在expasy里swiss-prot 適用於檢索的 compute pi/mw 求理論分子量 分子量 protparam物理化學性質 protscale親水性疏水性 peptidemass分析蛋白酶和化學試劑處理後的內切產物
NCBI(www.ncbi.nlm.nih.gov)-GenBank資料庫

資料庫相似性搜索——核酸序列與核酸資料庫比較(BLASTN)
蛋白質序列與資料庫中蛋白質序列比較(BLASTP)
兩序列比對(Align two sequences)

DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)

分析實驗序列外顯子部分——GENSCAN(http://genes.mit.e/GENSCAN.html)
分析實驗序列的可能酶切位點——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
註: Custom digest -- view gel

限制性內切酶資料庫——REBASE(http://rebase.neb.com/rebase/rebase.html)

設計引物擴增實驗序列——Genefisher
Primer 3

蛋白質序列分析及結構預測:
1.預測蛋白質的分子量及等電點:ExPASy(Compute pI/Mw)
2.分析蛋白質的基本物理化學性質:ExPASy(ProtParam)
3.分析蛋白質的親水性和疏水性:ExPASy(ProtScale)
4.分析蛋白質在各種蛋白酶和各種化學試劑處理後的內切產物:ExPASy(PeptideMass) [* :kinase K]
5.分析蛋白質的信號肽:ExPASy(SignalP)
6.預測蛋白質的二級結構:ExPASy(Jpred 3)

多物種分子系統發育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W

人脂聯素蛋白質序列:NP_004788
人類胰島素生長因子IB前體:P05019

Ⅲ 我導師給了我一段DNA序列,是word格式,他讓我進行生物信息學分析,請問,用什麼好呢

用相關的軟體分析比如DNAMAN,oligo.然後上NCBI網站進行比對(blast)

Ⅳ 生信分析軟體總結合集

持續更新中
EDTA :TE 注釋工具。是一個可以從頭注釋全基因組中的TE並且評估已有TE庫注釋優劣的工具包。該工具的主要步驟是過濾掉原始TE中注釋錯誤的,從而注釋出全基因組中較高質量的非冗餘TE庫。
OrthoFinder :做進化、基因家族分析、比較基因組使用。它查找直系群和直系同源物,推斷所有直系群的根源基因樹,並識別這些基因樹中的所有基因重復事件。 它還為要分析的物種推斷出一個有根的物種樹,並將基因復制事件從基因樹映射到物種樹中的分支。
TRF :是基因組注釋中常用於檢測序列中串聯重復序列的軟體。
cafe :基因家族收縮和擴張。
GMATA :分析基因組中的SSR序列(SSR:微衛星序列,串聯重復)
RepeatMasker :鑒別轉座子(TE)屏蔽轉座子(TE)。
PASA :是一種真核生物基因組注釋工具,利用轉錄組數據的可變剪接比對自動構建的基因結構模型,從而保持基因結構注釋與轉錄組實驗數據一致。(基於轉錄組測序)
GeMoMa :是基於同源性進行基因預測的軟體。通過近緣物種蛋白編碼基因對本物種的序列進行基因結構的預測,主要是根據氨基酸和內含子的保守性。此外,也可以整合轉錄組比對數據進行可變剪接位點的分析。
AUGUSTUS :是真核基因組結構從頭預測軟體,主要運用廣義隱馬爾可夫的概率模型(GHMM)進行基因結構的預測。通過分析DNA序列在概率模型中最有可能的基因結構,從而發現目標DNA序列中的基因。此外軟體自身包含常見模式生物訓練集,可利用這些物種直接進行基因預測;也可以利用同源預測和轉錄組最優結果生成訓練集,預測基因。
EVM :對收集到的這些數據進行整合,獲得非冗餘外顯子集合,從而定義出更加可靠的基因結構。(整合基因結構)
fastp :最新的質控軟體。
Hisat2 :質控之後的比對軟體。
Stringtie :將比對信息轉為轉錄本坐標文件。
MUSCLE :蛋白質水平多序列比對軟體,和ClustalW、T-coffee相比速度最快。
hasit2、STRA :基因組比對軟體,STRA更准確,但計算速度慢,所需內存大。
bowtie2 :轉錄組比對軟體。

Ⅳ 生物信息學一些基本的常用軟體有哪些

序列拼接軟體:velvet,SOAPdenvoo,SSAKE,ABySS,Trinity 等
短序列比對軟體: bwa,bowtie,tophat,SOAPAligner 等
局部比對軟體:Blast,blat,CorssMatch 等
多序列全局比對軟體:Muscle,clustalw 等
基因預測軟體:Glimmer,GeneMark,Augustus,FgeneSH,SNAP,GeneScan,EuGENE,Glean等
重復序列預測軟體:RepeatMasker,TRF等
聚類軟體:MCL,hcluster_sg等
統計軟體:pLINK,TASSEL,R,SPSS等

Ⅵ 生物信息學一些基本的常用軟體有哪些

你講的是生物信息學的哪一方面?要是所有的常用軟體,建議你看看《生物信息學分析實踐》這本書,2010年科學出版社出版的圖書,由吳祖建,高芳鑾,沈建國編著,綠色封面。裡面有常用軟體的用法及例子,若是你要電子鏈接,我這也有,你可以留下郵箱,我可以傳給你。如果你要是想問某一方面的軟體,我也可以給訴你的更詳細些,比如引物設計、蛋白質二級三級結構預測、基因注釋分析以及RNA結構預測軟體,就是不知道你想要了解哪方面?

Ⅶ 生物信息學一些基本的常用軟體有哪些

必學:1、計算機基礎(linux+perl+R 或者 python+matlab)
2、生信基礎知識(測序+資料庫+數據格式)
3、生信研究領域(全基因組,全轉錄組,全外顯子組,捕獲目標區域測序)
4、生信應用領域(腫瘤篩查,產前診斷,流行病學,個性化醫療)
分而治之:
一、計算機基礎,需要看三本書,一步步的學會學通,不需要刻意去找哪個書,一般linux是鳥哥私房菜,perl是小駱駝咯,R是R in action,但是看一本書只能入門,真正想成為菜鳥,必須每個要看五本書以上!我雲盤裡面有這基本上的高清列印版,大家可以去淘寶列印一下才幾十塊錢還包郵,對書比較講究的也可以買正版,也不過是一百多塊錢而已!
二、生信基礎知識,測序方面,在網路文庫找十幾篇一代二代三代測序儀資料仔細研讀,然後去優酷下載各大主流測序儀的動畫講解,再看看陳巍學基因的講解;資料庫先看看三大主流資料庫——NCBI,ENSEMBL,UCSC,還有一些也可以了解一些(uniprot,IMGT,KEGG,OMIN,TIGR,GO)同樣也是網路文庫自己搜索資料,但是這次需要自己去官網一個個頁面點擊看,一個個翻譯成中文理解吃透;數據格式講起了就多了,這個主要是在項目流程中慢慢學,或者你有機會去上課,不然你看來也是立馬忘記的,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等等
三、生信研究領域,各個領域主要是軟體繁多,合起來常用的估計有上百個軟體了,一般只有從業五六年以上的人才有可能把它們全部用過一遍,而且這也完全需要項目來訓練,而不能僅僅是看看軟體手冊,但是研究領域最重要的是背後的原理,需要看各大牛的綜述。
a) 生信基礎軟體(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)
b) snp-calling相關軟體(bwa,bowtie,samtools,GATK,VarScan.jar,annovar)
c) 基因組相關軟體(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)
d) 轉錄組相關軟體(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)

Ⅷ 生物信息學常用的軟體有哪些

NCBI(www.ncbi.nlm.nih.gov)-GenBank資料庫

資料庫相似性搜索——核酸序列與核酸資料庫比較(BLASTN)
蛋白質序列與資料庫中蛋白質序列比較(BLASTP)
兩序列比對(Align two sequences)

DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)

分析實驗序列外顯子部分——GENSCAN(http://genes.mit.e/GENSCAN.html)
分析實驗序列的可能酶切位點——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
註: Custom digest -- view gel

限制性內切酶資料庫——REBASE(http://rebase.neb.com/rebase/rebase.html)

設計引物擴增實驗序列——Genefisher
Primer 3

蛋白質序列分析及結構預測:
1.預測蛋白質的分子量及等電點:ExPASy(Compute pI/Mw)
2.分析蛋白質的基本物理化學性質:ExPASy(ProtParam)
3.分析蛋白質的親水性和疏水性:ExPASy(ProtScale)
4.分析蛋白質在各種蛋白酶和各種化學試劑處理後的內切產物:ExPASy(PeptideMass) [* :kinase K]
5.分析蛋白質的信號肽:ExPASy(SignalP)
6.預測蛋白質的二級結構:ExPASy(Jpred 3)

多物種分子系統發育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W

人脂聯素蛋白質序列:NP_004788
人類胰島素生長因子IB前體:P05019

閱讀全文

與生物信息分析軟體哪個好相關的資料

熱點內容
為什麼數據網路延遲一直100 瀏覽:989
喜雲怎麼添加自己的產品 瀏覽:368
車易升obd怎麼看數據 瀏覽:483
WEB應用程序設計專業學什麼 瀏覽:177
旅遊卡代理費用多少 瀏覽:191
網上怎麼代理五穀磨房 瀏覽:534
杭州職業技術學院附近哪裡住宿好 瀏覽:648
地平線3怎麼終結連續技術 瀏覽:705
如何免費試用電子產品 瀏覽:996
為什麼程序下載總是失敗 瀏覽:241
刷票小程序哪個好用 瀏覽:383
蘋果手機如何刪除定位信息 瀏覽:953
什麼樣的是面板數據 瀏覽:767
京深海鮮大市場在哪個區 瀏覽:15
流量產品券怎麼用 瀏覽:994
寧波凍品市場在哪裡 瀏覽:947
什麼是威望數據 瀏覽:575
知道公司怎麼買產品 瀏覽:189
監理員如何學習施工技術 瀏覽:731
稅收信息採集多久通知 瀏覽:929