導航:首頁 > 信息系統 > 生物信息學離線工具有哪些

生物信息學離線工具有哪些

發布時間:2022-12-25 13:51:18

『壹』 生物信息學中分析lncRNA的工具有哪些

給你一個大致的篩選標准:
(1)選擇長度≥200bp,Exon個數≥2的轉錄本;
(2)通過計算每條轉錄本的Reads覆蓋度,選擇Reads最小覆蓋
度≥3的轉錄本;
(3)去除已知的mRNA轉錄本(通過和已有注釋文件比對)
(4)去除已知的非編碼RNA轉錄本(比對一些已有的lncRNA資料庫了)
(5)去除有蛋白家族的轉錄本(能夠注釋到Pfam資料庫);
(6)去除有編碼潛能的RNA(CNCI,CPC,這兩款都可以給出一個編碼能力的預測)

『貳』 常用生物信息學在線分析工具匯總(記錄中...)

NCBI主站: https://www.ncbi.nlm.nih.gov/
擬南芥: https://www.arabidopsis.org/
AmiGO2
STRING
Pham

BLAST: https://blast.ncbi.nlm.nih.gov/Blast.cgi

ProParam: https://us.expasy.org/tools/protparam.html

ProScale: http://expasy.org/cgi-bin/protscale.pl/

TMHMM2.0: http://www.cbs.dtu.dk/services/TMHMM-2.0/

TMPred: http://www.ch.embnet.org/software/TMPRED_form.html

PSORT: http://psort.hgc.jp//

Prosite: http://www.expasy.org/prosite/

ProScan: http://www.ebi.ac.uk/InterProScan/

SMART: http://smart.embl-heidelberg.de/#

MEME: http://meme-suite.org/tools/meme

SOMPA: http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html

SWISS-MODEL: http://swissmodel.expasy.org/

『叄』 常用的生物信息學python庫有哪些

常用的生物信息學python庫:
Tkinter
Python默認的圖形界面介面。Tkinter是一個和Tk介面的Python模塊,Tkinter庫提供了對Tk API的介面,它屬於Tcl/Tk的GUI工具組。
PyGTK
用於python GUI程序開發的GTK+庫。GTK就是用來實現GIMP和Gnome的庫。
PyQt
用於python的Qt開發庫。QT就是實現了KDE環境的那個庫,由一系列的模塊組成,有qt, qtcanvas, qtgl, qtnetwork, qtsql, qttable, qtui and qtxml,包含有300個類和超過5750個的函數和方法。PyQt還支持一個叫qtext的模塊,它包含一個QScintilla庫。該庫是Scintillar編輯器類的Qt介面。
wxPython
GUI編程框架,熟悉MFC的人會非常喜歡,簡直是同一架構(對於初學者或者對設計要求不高的用戶來說,使用Boa Constructor可以方便迅速的進行wxPython的開發)
PIL
python提供強大的圖形處理的能力,並提供廣泛的圖形文件格式支持,該庫能進行圖形格式的轉換、列印和顯示。還能進行一些圖形效果的處理,如圖形的放大、縮小和旋轉等。是Python用戶進行圖象處理的強有力工具。
Psyco
一個Python代碼加速度器,可使Python代碼的執行速度提高到與編譯語言一樣的水平。
xmpppy
Jabber伺服器採用開發的XMPP協議,Google Talk也是採用XMPP協議的IM系統。在Python中有一個xmpppy模塊支持該協議。也就是說,我們可以通過該模塊與Jabber伺服器通信,是不是很Cool。
PyMedia
用於多媒體操作的python模塊。它提供了豐富而簡單的介面用於多媒體處理(wav, mp3, ogg, avi, divx, dvd, cdda etc)。可在Windows和Linux平台下使用。
Pmw
Python megawidgets,Python超級GUI組件集,一個在python中利用Tkinter模塊構建的高級GUI組件,每個Pmw都合並了一個或多個Tkinter組件,以實現更有用和更復雜的功能。
PyXML
用Python解析和處理XML文檔的工具包,包中的4DOM是完全相容於W3C DOM規范的。它包含以下內容:
xmlproc: 一個符合規范的XML解析器。Expat: 一個快速的,非驗證的XML解析器。還有其他和他同級別的還有 PyHtml PySGML。
PyGame
用於多媒體開發和游戲軟體開發的模塊。
PyOpenGL
模塊封裝了「OpenGL應用程序編程介面」,通過該模塊python程序員可在程序中集成2D和3D的圖形。
NumPy、NumArray、SAGE
NumArray是Python的一個擴展庫,主要用於處理任意維數的固定類型數組,簡單說就是一個矩陣庫。它的底層代碼使用C來編寫,所以速度的優勢很明顯。SAGE是基於NumPy和其他幾個工具所整合成的數學軟體包,目標是取代Magma, Maple, Mathematica和Matlab 這類工具。
MySQLdb
用於連接MySQL資料庫。還有用於zope的ZMySQLDA模塊,通過它就可在zope中連接mysql資料庫。
Sqlite3
用於連接sqlite資料庫。

Python-ldap
提供一組面向對象的API,可方便地在python中訪問ldap目錄服務,它基於OpenLDAP2.x。
smtplib
發送電子郵件。
ftplib
定義了FTP類和一些方法,用以進行客戶端的ftp編程。如果想了解ftp協議的詳細內容,請參考RFC959。
PyOpenCL
OpenCL的Python介面,通過該模塊可以使用GPU實現並行計算。

『肆』 生信log11|生物信息學可視化工具介紹——Plotly Dash

對啊,簡單好用的不香嗎,為啥非得這個不可。目前這個模塊主要應用對象是生物與葯學研發這塊的,對微生物群組應用的可視化不太有幫助。但勝在有些圖能在線上傳格式文本就可以作圖了並且可以互動式操作,且免費免安裝,對小白實屬友好。

參考

https://dash.plotly.com/
官方參考示例

上述圖片均來自網路以及官網截圖

『伍』 學習生物信息學有哪些比較好的網站或論壇

生信菜鳥團上大學之後,我上網找資料時發現的第一個博客就是生信菜鳥團,裡麵包羅萬象,涵蓋很多方面(初次發現時,就感覺自己進入了新的天地)rabbit gao's blog 我超喜歡這個師兄的博客裡面的筆記,很直觀,尤其是python那部分。他是以代碼的形式展示內容。沈夢圓博客夢圓師姐,和我一樣喜歡用熊貓頭像,她的博客也是剛剛建立不長時間。師姐的文筆很贊,看裡面博文相信對你有幫助的。生信日誌|鳴一道鳴一道師兄的博客我比較喜歡的是R做圖那一塊plob這個我比較少看,不過內容也不錯,我後續再寫上這個博客的描述。陳連福博客聽說連福老師有開培訓班,實力自然也不差。糗世界←歡迎來到糗糗的世界糗世界主要包括:序列比對與NGS R/bioconctorcircos教程,其中糗世界關於R和bioconctor以及NGS的歸納總結特別詳盡生信客部落生信客部落是我自己的博客,剛建不久(2016.9.3建的),我目前在准備考研,打理的時間不多。但相信是一隻潛力股,有提升的空間。也歡迎博友們交換 "友情鏈接".hope博客 hope 他(她)有一篇關於生物信息學在線工具的總結,我特別喜歡科研動力「endnote使用寶典」,專注寫endnote相關的內容。(註:endnote 是文獻管理的軟體,插入引用文獻的神器)biochen生物伯臣生物里也蠻多歸納整理的Bob's Blog bob這位兄弟的博客我接觸不多,我後續補上描述.論壇(包括生信論壇和其他一些相關的網站):生信技能樹生信技能樹前面那個師兄有詳細描述過。我也親眼見證了它從無到有的過程,看著生信技能樹感覺特別親切,感覺就像自家的孩子一樣。我自己由於准備考研和書寫畢業論文的事情,在生信技能樹建設的參與度不高。總之,好喜歡......生物信息學天空內容超全的一個生信論壇丁香園(生信板塊)丁香園,就不解釋了,一個國內最成功的論壇之一。醫學生基本都知道的一個論壇。小木蟲小木蟲,裡面蠻多資源的,也是國內最成功的論壇之一生物統計家園描述待輸入...基因堂描述待輸入biostars這是一個生信問答網站生信刷題網站ROSALIND | About 這個是一個生物信息的刷題網站,超多實戰題(純英文,既提高英語水平,又訓練了自己的實戰能力,何樂而不為)。實戰走起......生物信息學在線工具網站生信客部落生物信息工具整合(包含在線工具與離線工具)–更新中這裡麵包含了一些生物信息學可視化工具,包含在線的工具和一些離線的可視化工具,由於目前個人水平有限,所以還有待繼續完善

『陸』 列舉常用的生物信息學資料庫及序列對比常用軟體及特點

一般來說所用的分析工具有在線跟下載的 下面簡要列舉一些常用在線軟體的使用 1、使用VecScreen工具,分析下列未知序列,輸出序列長度、載體序列的區域、可能使用的克隆載體都有哪些。一、步驟:
打開google 首頁,搜索VecScreen,進入VecScreen首頁,復制序列,運行,View report。
二、結果:
輸出序列長度918bp,
載體序列的區域456bp——854bp.
克隆載體:M13mp18 phage,pGEM-13Zf(+),pBR322,pRKW2。
2、使用相應工具,分析下列未知序列的重復序列情況,輸出重復序列的區域、包含的所有重復序列的類型、重復序列的總長度及Masked Sequence。
一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST。得出序列是human的。
進入google首頁,搜索RepeatMasker,進入RepeatMasker主頁,進入RepeatMasking,復制序列,DNA source選擇human,運行!點擊超鏈接,在結果中選擇
Annotation File :RM2sequpload_1287631711.out.html
3、使用CpGPlot/CpGReport/Isochore工具,分析下列未知序列,輸出CpG島的長度、區域、GC數量、所佔的百分比及Obs/Exp值。一、步驟:
進入google首頁,搜索CpGPlot,進入CpGPlot主頁,program中選擇cpgreport復制序列,運行!
二、結果:

CpG島的長度:385bp
區域:48——432;
GC數量:Sum C+G=297,百分數=77.14
Obs/Exp:1.01
4、預測下面序列的啟動子,輸出可能的啟動子序列及相應的位置。一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST。得出序列是human的
進入google首頁,搜索Neural Network Promoter Prediction,進入主頁,復制序列,選擇eukaryote,運行!
二、結果:

位置:711—761 ,1388—1438,1755—1805;
5、運用Splice Site Prediction工具分析下面序列,分別輸出內含子-外顯子剪接位點給體和受體的區域及剪接處位置的鹼基。一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST。得出序列是human的
進入google首頁,搜索Splice Site Prediction,進入主頁,復制序列。Organism選擇Human or other。其他默認,運行!
二、結果:
供體:

受體:
6、對下面序列進行六框翻譯,利用GENESCAN綜合分析(首先確定給定序列的物種來源)哪個ORF是正確的,輸出六框翻譯(抓圖)和GENESCAN結果(包括predicted genes/exons 和 predicted peptide sequence(s) 兩個部分)。一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST。得出序列是Zea的
進入google首頁;搜索NCBI,進入主頁,選擇all resources(A~Z),選擇O,選擇ORF finder。復制序列,默認,運行!
二、結果:ORF圖
三、步驟:進入google首頁,搜索GENESCAN,進入主頁,Organism:Maize, ,其他默認,運行!
四、結果:
G7、進入REBASE限制性內切酶資料庫,輸出AluI、MboI、EcoI三種內酶的Recognition Sequence和Type。
一、步驟:進入google首頁,google in English,搜索REBASE,進入主頁, 分別輸入AluI、MboI、EcoI,運行!
在MboI中選擇第一個,EcoI選擇第二個。
二、結果:
ENSCAN圖
8、使用引物設計工具,針對下列未知序列設計一對引物,要求引物長度為20-25bp,擴增產物長度300-500bp,退火溫度為50-60℃。請寫出選擇的一對引物(Forward Primer and Reverse Primer)、及相應的GC含量、引物的位點、Tm值和產物長度。一、步驟:進入google首頁,搜索genefisher,進入主頁,復制fasta格式,chechk input, sunmit, ; ;設置一下引物長度為20-25bp,擴增產物長度300-500bp,退火溫度為50-60℃; 。
二、結果:

GC含量:

引物的位點:

Tm值:

產物長度:。

9、將下面的序列用NEBcutter 2.0工具分析,用產生平末端及有四個酶切位點的酶進行酶切,並用抓圖提交膠圖(view gel),要求1.4% agarose和Marker為100bp DNA Ladder。
一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST,得知是linear。
進入google首頁,搜索NEBcutter 2.0,進入主頁,選擇linear,運行!選擇custom digest, ,把「1」改為「4」,選擇平末端,後digest。View gel。選擇1.4% agarose和Marker為100bp。
二、結果:

然後就是蛋白質的了一般都在expasy里swiss-prot 適用於檢索的 compute pi/mw 求理論分子量 分子量 protparam物理化學性質 protscale親水性疏水性 peptidemass分析蛋白酶和化學試劑處理後的內切產物
NCBI(www.ncbi.nlm.nih.gov)-GenBank資料庫

資料庫相似性搜索——核酸序列與核酸資料庫比較(BLASTN)
蛋白質序列與資料庫中蛋白質序列比較(BLASTP)
兩序列比對(Align two sequences)

DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)

分析實驗序列外顯子部分——GENSCAN(http://genes.mit.e/GENSCAN.html)
分析實驗序列的可能酶切位點——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
註: Custom digest -- view gel

限制性內切酶資料庫——REBASE(http://rebase.neb.com/rebase/rebase.html)

設計引物擴增實驗序列——Genefisher
Primer 3

蛋白質序列分析及結構預測:
1.預測蛋白質的分子量及等電點:ExPASy(Compute pI/Mw)
2.分析蛋白質的基本物理化學性質:ExPASy(ProtParam)
3.分析蛋白質的親水性和疏水性:ExPASy(ProtScale)
4.分析蛋白質在各種蛋白酶和各種化學試劑處理後的內切產物:ExPASy(PeptideMass) [* :kinase K]
5.分析蛋白質的信號肽:ExPASy(SignalP)
6.預測蛋白質的二級結構:ExPASy(Jpred 3)

多物種分子系統發育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W

人脂聯素蛋白質序列:NP_004788
人類胰島素生長因子IB前體:P05019

『柒』 生物信息學中分析lncRNA的工具有哪些

分析lncRNA的工具和方法
1、宏觀分析工具
長鏈非編碼RNA研究領域的進展離不開基因組測序和基因晶元技術的廣泛使用,如通過構建cDNA文庫和測序發現ncRNA;通過比較基因組生物信息分析發現ncRNA;利用tiling晶元、ncRNA晶元檢測ncRNA。通過轉錄組測序或tiling晶元檢測,可以在全基因組范圍內系統地研究可轉錄RNA區域,有助於大量發現非編碼RNA。基因晶元可以高密度檢測所有非編碼RNA,通過表達譜研究發現組織特異性、疾病相關性,就可以縮小研究范圍,找出值得深入研究的ncRNA目標,再結合傳統的基因敲除、RNAi等技術確定其功能和作用機制。
2、微觀分析工具
KD方法
A、RNAi方法
化學合成的siRNA
艾博思生物引進國際上比較公認成熟的方法設計5對siRNA oligos,針對客戶提供的非編碼長鏈RNA進行干擾
shRNA載體構建
艾博思生物引進國際上比較公認成熟的方法設計5對shRNA vector,針對客戶提供的非編碼長鏈RNA進行干擾
B、反義核酸或者核酶技術
利用經典的ASO和Riozyme的方法進行抑制lncRNA的作用,艾博思可以提供DNA或者RNA的合成服務
C、小分子抑制劑的虛擬篩選
艾博思生物信息學團隊,通過分子模擬ncRNA的結構,設計小分子抑制劑來干預ncRNA作用
OVER-Expression方法
艾博思生物可以給您全基因合成或者調取已經發現的所有的非編碼長鏈RNA
艾博思生物可以幫你構建表達載體供您使用
選用載體: pcDNA3.1 等等

『捌』 生物信息學常用的軟體有哪些

NCBI(www.ncbi.nlm.nih.gov)-GenBank資料庫

資料庫相似性搜索——核酸序列與核酸資料庫比較(BLASTN)
蛋白質序列與資料庫中蛋白質序列比較(BLASTP)
兩序列比對(Align two sequences)

DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)

分析實驗序列外顯子部分——GENSCAN(http://genes.mit.e/GENSCAN.html)
分析實驗序列的可能酶切位點——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
註: Custom digest -- view gel

限制性內切酶資料庫——REBASE(http://rebase.neb.com/rebase/rebase.html)

設計引物擴增實驗序列——Genefisher
Primer 3

蛋白質序列分析及結構預測:
1.預測蛋白質的分子量及等電點:ExPASy(Compute pI/Mw)
2.分析蛋白質的基本物理化學性質:ExPASy(ProtParam)
3.分析蛋白質的親水性和疏水性:ExPASy(ProtScale)
4.分析蛋白質在各種蛋白酶和各種化學試劑處理後的內切產物:ExPASy(PeptideMass) [* :kinase K]
5.分析蛋白質的信號肽:ExPASy(SignalP)
6.預測蛋白質的二級結構:ExPASy(Jpred 3)

多物種分子系統發育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W

人脂聯素蛋白質序列:NP_004788
人類胰島素生長因子IB前體:P05019

『玖』 生物信息學工具

實驗二工具:
1 相似性比對用blast 注意限定條件,注意:blast時必須是fasta格式
2 對給出的氨基酸序列進行相似性比較,確定其編碼的蛋白質 blast限定(swiss prot)
3 搜索不同物種的同源基因 用blast注意advanced加限制條件(organism; gene name) 利用blastn進行相似性同源基因搜索(others)
實驗三工具:
1 分析下列未知序列,輸出序列長度、載體序列的區域、可能使用的克隆載體都有哪些用VecScreen
2 分析下列未知序列的重復序列情況,輸出重復序列的區域、包含的所有重復序列的類型、重復序列的總長度及Masked Sequence用
RepeatMasker
CENSOR
3 使用CpGPlot/CpGReport/Isochore工具,分析下列未知序列,輸出CpG島的長度、區域、GC數量、所佔的百分比及Obs/Exp值用
EMBL→tools→sequence Analysis→在program上選擇cpgreport
4 預測下面序列的啟動子,輸出可能的啟動子序列及相應的位置用
fruitfly→Analysis Tools→Promoter Prediction-M.G. Reese
5 六框翻譯用Genscan ORF(在ncbi里找)
6 限制性內切酶資料庫用REBASE
7 引物設計工具用 primer3
8 酶切位點用 NEBcutter
實驗四工具
1 Expasy中查找前體用swiss-port
2 分子量和等電點 用Expasy中的Compute pI/MW
3 前提的物理化學性質用Expasy中的Protparmam 包括蛋白質的相對分子質量,理 論pI值,氨基酸組成,原子組成,消光系數,半衰期,不穩定系數,總平均親水性
4 前提的親水性和疏水性用Expasy中的ProtScale
5 前提在各種蛋白酶和試劑處理後的內切產物用Expasy中的PeptideMass
6 查看信號肽直接Google→Signa1P
7 二級結構 直接Google→SOPMA
實驗五工具
1 系統發育地位檢索 用網路→tree of life

『拾』 生物信息學一些基本的常用軟體有哪些

必學:1、計算機基礎(linux+perl+R 或者 python+matlab)
2、生信基礎知識(測序+資料庫+數據格式)
3、生信研究領域(全基因組,全轉錄組,全外顯子組,捕獲目標區域測序)
4、生信應用領域(腫瘤篩查,產前診斷,流行病學,個性化醫療)
分而治之:
一、計算機基礎,需要看三本書,一步步的學會學通,不需要刻意去找哪個書,一般linux是鳥哥私房菜,perl是小駱駝咯,R是R in action,但是看一本書只能入門,真正想成為菜鳥,必須每個要看五本書以上!我雲盤裡面有這基本上的高清列印版,大家可以去淘寶列印一下才幾十塊錢還包郵,對書比較講究的也可以買正版,也不過是一百多塊錢而已!
二、生信基礎知識,測序方面,在網路文庫找十幾篇一代二代三代測序儀資料仔細研讀,然後去優酷下載各大主流測序儀的動畫講解,再看看陳巍學基因的講解;資料庫先看看三大主流資料庫——NCBI,ENSEMBL,UCSC,還有一些也可以了解一些(uniprot,IMGT,KEGG,OMIN,TIGR,GO)同樣也是網路文庫自己搜索資料,但是這次需要自己去官網一個個頁面點擊看,一個個翻譯成中文理解吃透;數據格式講起了就多了,這個主要是在項目流程中慢慢學,或者你有機會去上課,不然你看來也是立馬忘記的,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等等
三、生信研究領域,各個領域主要是軟體繁多,合起來常用的估計有上百個軟體了,一般只有從業五六年以上的人才有可能把它們全部用過一遍,而且這也完全需要項目來訓練,而不能僅僅是看看軟體手冊,但是研究領域最重要的是背後的原理,需要看各大牛的綜述。
a) 生信基礎軟體(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)
b) snp-calling相關軟體(bwa,bowtie,samtools,GATK,VarScan.jar,annovar)
c) 基因組相關軟體(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)
d) 轉錄組相關軟體(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)

閱讀全文

與生物信息學離線工具有哪些相關的資料

熱點內容
如何解除移動數據限流的方法 瀏覽:174
郴州市活禽交易市場什麼時候休市 瀏覽:456
四川空間信息產業發展怎麼樣 瀏覽:284
宏基筆記本怎麼樣關閉程序 瀏覽:522
邯鄲有哪些鐵板市場 瀏覽:850
問道如何查詢賬號信息 瀏覽:323
工商銀行交易4204是什麼意思 瀏覽:454
食品產品標准號怎麼解讀 瀏覽:536
我愛我家鏈家為什麼退出北京市場 瀏覽:648
男生如何縮小臉部毛孔產品 瀏覽:199
數據線方頭卡扣怎麼卸 瀏覽:668
宮頸代理怎麼做 瀏覽:815
想做食品代理商怎麼樣 瀏覽:366
農資加盟店需多少錢代理商 瀏覽:492
信息驗證碼如何設置 瀏覽:296
設計時必要准備的數據有哪些 瀏覽:886
採取的程序是有什麼優勢 瀏覽:115
偽中幣交易網站有哪些 瀏覽:870
代理記賬專家多少錢 瀏覽:529
怎麼在淘寶上產品鏈接 瀏覽:967