导航:首页 > 信息系统 > 生物信息分析软件哪个好

生物信息分析软件哪个好

发布时间:2023-01-17 17:37:36

Ⅰ 【生信知识】---Nanopore测序分析软件nanopolish

前言: nanopolish是开源的综合性分析软件,集成了非常多的三代测序数据分析小工具。

1.软件安装:
通过Github源码安装:

或者,通过conda安装:

2.主要功能:

构建索引

与参考基因组比对

利用nanopolish检测甲基化位点

对结果进行过滤

Ⅱ 列举常用的生物信息学数据库及序列对比常用软件及特点

一般来说所用的分析工具有在线跟下载的 下面简要列举一些常用在线软件的使用 1、使用VecScreen工具,分析下列未知序列,输出序列长度、载体序列的区域、可能使用的克隆载体都有哪些。一、步骤:
打开google 首页,搜索VecScreen,进入VecScreen首页,复制序列,运行,View report。
二、结果:
输出序列长度918bp,
载体序列的区域456bp——854bp.
克隆载体:M13mp18 phage,pGEM-13Zf(+),pBR322,pRKW2。
2、使用相应工具,分析下列未知序列的重复序列情况,输出重复序列的区域、包含的所有重复序列的类型、重复序列的总长度及Masked Sequence。
一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的。
进入google首页,搜索RepeatMasker,进入RepeatMasker主页,进入RepeatMasking,复制序列,DNA source选择human,运行!点击超链接,在结果中选择
Annotation File :RM2sequpload_1287631711.out.html
3、使用CpGPlot/CpGReport/Isochore工具,分析下列未知序列,输出CpG岛的长度、区域、GC数量、所占的百分比及Obs/Exp值。一、步骤:
进入google首页,搜索CpGPlot,进入CpGPlot主页,program中选择cpgreport复制序列,运行!
二、结果:

CpG岛的长度:385bp
区域:48——432;
GC数量:Sum C+G=297,百分数=77.14
Obs/Exp:1.01
4、预测下面序列的启动子,输出可能的启动子序列及相应的位置。一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的
进入google首页,搜索Neural Network Promoter Prediction,进入主页,复制序列,选择eukaryote,运行!
二、结果:

位置:711—761 ,1388—1438,1755—1805;
5、运用Splice Site Prediction工具分析下面序列,分别输出内含子-外显子剪接位点给体和受体的区域及剪接处位置的碱基。一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的
进入google首页,搜索Splice Site Prediction,进入主页,复制序列。Organism选择Human or other。其他默认,运行!
二、结果:
供体:

受体:
6、对下面序列进行六框翻译,利用GENESCAN综合分析(首先确定给定序列的物种来源)哪个ORF是正确的,输出六框翻译(抓图)和GENESCAN结果(包括predicted genes/exons 和 predicted peptide sequence(s) 两个部分)。一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是Zea的
进入google首页;搜索NCBI,进入主页,选择all resources(A~Z),选择O,选择ORF finder。复制序列,默认,运行!
二、结果:ORF图
三、步骤:进入google首页,搜索GENESCAN,进入主页,Organism:Maize, ,其他默认,运行!
四、结果:
G7、进入REBASE限制性内切酶数据库,输出AluI、MboI、EcoI三种内酶的Recognition Sequence和Type。
一、步骤:进入google首页,google in English,搜索REBASE,进入主页, 分别输入AluI、MboI、EcoI,运行!
在MboI中选择第一个,EcoI选择第二个。
二、结果:
ENSCAN图
8、使用引物设计工具,针对下列未知序列设计一对引物,要求引物长度为20-25bp,扩增产物长度300-500bp,退火温度为50-60℃。请写出选择的一对引物(Forward Primer and Reverse Primer)、及相应的GC含量、引物的位点、Tm值和产物长度。一、步骤:进入google首页,搜索genefisher,进入主页,复制fasta格式,chechk input, sunmit, ; ;设置一下引物长度为20-25bp,扩增产物长度300-500bp,退火温度为50-60℃; 。
二、结果:

GC含量:

引物的位点:

Tm值:

产物长度:。

9、将下面的序列用NEBcutter 2.0工具分析,用产生平末端及有四个酶切位点的酶进行酶切,并用抓图提交胶图(view gel),要求1.4% agarose和Marker为100bp DNA Ladder。
一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST,得知是linear。
进入google首页,搜索NEBcutter 2.0,进入主页,选择linear,运行!选择custom digest, ,把“1”改为“4”,选择平末端,后digest。View gel。选择1.4% agarose和Marker为100bp。
二、结果:

然后就是蛋白质的了一般都在expasy里swiss-prot 适用于检索的 compute pi/mw 求理论分子量 分子量 protparam物理化学性质 protscale亲水性疏水性 peptidemass分析蛋白酶和化学试剂处理后的内切产物
NCBI(www.ncbi.nlm.nih.gov)-GenBank数据库

数据库相似性搜索——核酸序列与核酸数据库比较(BLASTN)
蛋白质序列与数据库中蛋白质序列比较(BLASTP)
两序列比对(Align two sequences)

DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)

分析实验序列外显子部分——GENSCAN(http://genes.mit.e/GENSCAN.html)
分析实验序列的可能酶切位点——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
注: Custom digest -- view gel

限制性内切酶数据库——REBASE(http://rebase.neb.com/rebase/rebase.html)

设计引物扩增实验序列——Genefisher
Primer 3

蛋白质序列分析及结构预测:
1.预测蛋白质的分子量及等电点:ExPASy(Compute pI/Mw)
2.分析蛋白质的基本物理化学性质:ExPASy(ProtParam)
3.分析蛋白质的亲水性和疏水性:ExPASy(ProtScale)
4.分析蛋白质在各种蛋白酶和各种化学试剂处理后的内切产物:ExPASy(PeptideMass) [* :kinase K]
5.分析蛋白质的信号肽:ExPASy(SignalP)
6.预测蛋白质的二级结构:ExPASy(Jpred 3)

多物种分子系统发育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W

人脂联素蛋白质序列:NP_004788
人类胰岛素生长因子IB前体:P05019

Ⅲ 我导师给了我一段DNA序列,是word格式,他让我进行生物信息学分析,请问,用什么好呢

用相关的软件分析比如DNAMAN,oligo.然后上NCBI网站进行比对(blast)

Ⅳ 生信分析软件总结合集

持续更新中
EDTA :TE 注释工具。是一个可以从头注释全基因组中的TE并且评估已有TE库注释优劣的工具包。该工具的主要步骤是过滤掉原始TE中注释错误的,从而注释出全基因组中较高质量的非冗余TE库。
OrthoFinder :做进化、基因家族分析、比较基因组使用。它查找直系群和直系同源物,推断所有直系群的根源基因树,并识别这些基因树中的所有基因重复事件。 它还为要分析的物种推断出一个有根的物种树,并将基因复制事件从基因树映射到物种树中的分支。
TRF :是基因组注释中常用于检测序列中串联重复序列的软件。
cafe :基因家族收缩和扩张。
GMATA :分析基因组中的SSR序列(SSR:微卫星序列,串联重复)
RepeatMasker :鉴别转座子(TE)屏蔽转座子(TE)。
PASA :是一种真核生物基因组注释工具,利用转录组数据的可变剪接比对自动构建的基因结构模型,从而保持基因结构注释与转录组实验数据一致。(基于转录组测序)
GeMoMa :是基于同源性进行基因预测的软件。通过近缘物种蛋白编码基因对本物种的序列进行基因结构的预测,主要是根据氨基酸和内含子的保守性。此外,也可以整合转录组比对数据进行可变剪接位点的分析。
AUGUSTUS :是真核基因组结构从头预测软件,主要运用广义隐马尔可夫的概率模型(GHMM)进行基因结构的预测。通过分析DNA序列在概率模型中最有可能的基因结构,从而发现目标DNA序列中的基因。此外软件自身包含常见模式生物训练集,可利用这些物种直接进行基因预测;也可以利用同源预测和转录组最优结果生成训练集,预测基因。
EVM :对收集到的这些数据进行整合,获得非冗余外显子集合,从而定义出更加可靠的基因结构。(整合基因结构)
fastp :最新的质控软件。
Hisat2 :质控之后的比对软件。
Stringtie :将比对信息转为转录本坐标文件。
MUSCLE :蛋白质水平多序列比对软件,和ClustalW、T-coffee相比速度最快。
hasit2、STRA :基因组比对软件,STRA更准确,但计算速度慢,所需内存大。
bowtie2 :转录组比对软件。

Ⅳ 生物信息学一些基本的常用软件有哪些

序列拼接软件:velvet,SOAPdenvoo,SSAKE,ABySS,Trinity 等
短序列比对软件: bwa,bowtie,tophat,SOAPAligner 等
局部比对软件:Blast,blat,CorssMatch 等
多序列全局比对软件:Muscle,clustalw 等
基因预测软件:Glimmer,GeneMark,Augustus,FgeneSH,SNAP,GeneScan,EuGENE,Glean等
重复序列预测软件:RepeatMasker,TRF等
聚类软件:MCL,hcluster_sg等
统计软件:pLINK,TASSEL,R,SPSS等

Ⅵ 生物信息学一些基本的常用软件有哪些

你讲的是生物信息学的哪一方面?要是所有的常用软件,建议你看看《生物信息学分析实践》这本书,2010年科学出版社出版的图书,由吴祖建,高芳銮,沈建国编着,绿色封面。里面有常用软件的用法及例子,若是你要电子链接,我这也有,你可以留下邮箱,我可以传给你。如果你要是想问某一方面的软件,我也可以给诉你的更详细些,比如引物设计、蛋白质二级三级结构预测、基因注释分析以及RNA结构预测软件,就是不知道你想要了解哪方面?

Ⅶ 生物信息学一些基本的常用软件有哪些

必学:1、计算机基础(linux+perl+R 或者 python+matlab)
2、生信基础知识(测序+数据库+数据格式)
3、生信研究领域(全基因组,全转录组,全外显子组,捕获目标区域测序)
4、生信应用领域(肿瘤筛查,产前诊断,流行病学,个性化医疗)
分而治之:
一、计算机基础,需要看三本书,一步步的学会学通,不需要刻意去找哪个书,一般linux是鸟哥私房菜,perl是小骆驼咯,R是R in action,但是看一本书只能入门,真正想成为菜鸟,必须每个要看五本书以上!我云盘里面有这基本上的高清打印版,大家可以去淘宝打印一下才几十块钱还包邮,对书比较讲究的也可以买正版,也不过是一百多块钱而已!
二、生信基础知识,测序方面,在网络文库找十几篇一代二代三代测序仪资料仔细研读,然后去优酷下载各大主流测序仪的动画讲解,再看看陈巍学基因的讲解;数据库先看看三大主流数据库——NCBI,ENSEMBL,UCSC,还有一些也可以了解一些(uniprot,IMGT,KEGG,OMIN,TIGR,GO)同样也是网络文库自己搜索资料,但是这次需要自己去官网一个个页面点击看,一个个翻译成中文理解吃透;数据格式讲起了就多了,这个主要是在项目流程中慢慢学,或者你有机会去上课,不然你看来也是立马忘记的,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等等
三、生信研究领域,各个领域主要是软件繁多,合起来常用的估计有上百个软件了,一般只有从业五六年以上的人才有可能把它们全部用过一遍,而且这也完全需要项目来训练,而不能仅仅是看看软件手册,但是研究领域最重要的是背后的原理,需要看各大牛的综述。
a) 生信基础软件(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)
b) snp-calling相关软件(bwa,bowtie,samtools,GATK,VarScan.jar,annovar)
c) 基因组相关软件(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)
d) 转录组相关软件(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)

Ⅷ 生物信息学常用的软件有哪些

NCBI(www.ncbi.nlm.nih.gov)-GenBank数据库

数据库相似性搜索——核酸序列与核酸数据库比较(BLASTN)
蛋白质序列与数据库中蛋白质序列比较(BLASTP)
两序列比对(Align two sequences)

DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)

分析实验序列外显子部分——GENSCAN(http://genes.mit.e/GENSCAN.html)
分析实验序列的可能酶切位点——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
注: Custom digest -- view gel

限制性内切酶数据库——REBASE(http://rebase.neb.com/rebase/rebase.html)

设计引物扩增实验序列——Genefisher
Primer 3

蛋白质序列分析及结构预测:
1.预测蛋白质的分子量及等电点:ExPASy(Compute pI/Mw)
2.分析蛋白质的基本物理化学性质:ExPASy(ProtParam)
3.分析蛋白质的亲水性和疏水性:ExPASy(ProtScale)
4.分析蛋白质在各种蛋白酶和各种化学试剂处理后的内切产物:ExPASy(PeptideMass) [* :kinase K]
5.分析蛋白质的信号肽:ExPASy(SignalP)
6.预测蛋白质的二级结构:ExPASy(Jpred 3)

多物种分子系统发育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W

人脂联素蛋白质序列:NP_004788
人类胰岛素生长因子IB前体:P05019

阅读全文

与生物信息分析软件哪个好相关的资料

热点内容
京深海鲜大市场在哪个区 浏览:15
流量产品券怎么用 浏览:994
宁波冻品市场在哪里 浏览:945
什么是威望数据 浏览:575
知道公司怎么买产品 浏览:189
监理员如何学习施工技术 浏览:731
税收信息采集多久通知 浏览:928
产后丰胸什么产品好 浏览:84
为什么会收到etc收费信息 浏览:750
为什么直播间看不到信息 浏览:964
提前进入左转待转区多久收到信息 浏览:20
渤海交易所怎么样 浏览:132
皮肤发痒用什么化工产品 浏览:83
没技术的人如何养家糊口 浏览:880
什么叫退市交易整理期 浏览:7
身份信息发到多少人的群里算侵权 浏览:598
modbustcp如何读取数据的 浏览:211
有什么好项目可以做代理商理财 浏览:637
上征信要什么程序 浏览:951
小学教资信息技术是什么 浏览:766