導航:首頁 > 數據處理 > 蛋白質資料庫有哪些

蛋白質資料庫有哪些

發布時間:2022-05-11 04:52:05

Ⅰ 總結蛋白質序列資料庫演變的過程

蛋白質序列資料庫指應用計算機功能分析生物學信息的資料庫。應用計算機的運演算法則,比較DNA和蛋白質序列而檢測結構、功能和序列之間的進化關系。

各種基因組的序列產生大量的DNA序列數據和生物信息,已經被應用於研究基因的功能,預測以前未知的基因功能。現在人們的注意力主要集中在從僅有的氨基酸序列預測蛋白質結構和功能。

歷史追溯:

由於蛋白質序列測定技術先於DNA序列測定技術問世,蛋白質序列的搜集也早於DNA序列。蛋白質序列資料庫的雛形可以追溯到60年代。60年代中期到80年代初,美國國家生物醫學研究基金會(National Biomedical Research Foundation,簡稱NBRF)。

Dayhoff領導的研究組將搜集到的蛋白質序列和結構信息以「蛋白質序列和結構地圖集」(Atlas of Protein Sequence and Structure)的形式發表,主要用來研究蛋白質的進化關系。1984年,「蛋白質信息資源」(Protein Information Resource,簡稱PIR)計劃正式啟動。

蛋白質序列資料庫PIR也因此而誕生。與核酸序列資料庫的國際合作相呼應,1988年,美國的NBRF、日本的國際蛋白質信息資料庫(Japanese International Protein Information Database,簡稱JIPID)。

德國的慕尼黑蛋白質序列信息中心(Munich Information Center for Protein Sequences,簡稱MIPS)合作成立了國際蛋白質信息中心(PIR-International),共同收集和維護蛋白質序列資料庫PIR,[Barker等, 2000]。

Ⅱ 蛋白質序列資料庫的資料庫分類

PIR資料庫按照數據的性質和注釋層次分四個不同部分,分別為PIR1、PIR2、PIR3和PIR4。PIR1中的序列已經驗證,注釋最為詳盡;PIR2中包含尚未確定的冗餘序列;PIR3中的序列尚未加以檢驗,也未加註釋; 而PIR4中則包括了其它各種渠道獲得的序列,既未驗證,也無注釋。除了PIR外,另一個重要的蛋白質序列資料庫則是SwissProt。該資料庫由瑞士日內瓦大學於1986年創建,目前由瑞士生物信息學研究所(Swiss Institute of Bioinformatics,簡稱SIB)和歐洲生物信息學研究所 EBI共同維護和管理。瑞士生物信息研究所下屬的蛋白質分析專家系統(Expert Protein Analysis System,,簡稱ExPASy)的Web伺服器除了開發和維護SwissProt資料庫外,也是國際上蛋白質組和蛋白質分子模型研究的中心,為用戶提供大量蛋白質信息資源。北京大學生物信息中心設有ExPASy的鏡象。PIR和SwissProt是創建最早、使用最為廣泛的兩個蛋白質資料庫。隨著各種模式生物基因組計劃的進展,DNA序列特別是EST序列大量進入核酸序列資料庫。蛋白質序列資料庫TrEMBL是從EMBL中的cDNA序列翻譯得到的。TrEMBL資料庫創建是於1996年[Bairoch, 2000],意為「Translation of EMBL」。該資料庫採用SwissProt資料庫格式,包含EMBL資料庫中所有編碼序列的翻譯。TrEMBL資料庫分兩部分,SP-TrEMBL和 REM-TrEMBL。SP-TrEMBL中的條目最終將歸並到SwissProt資料庫中。而Rem-TrEMBL則包括其它剩餘序列,包括免疫球蛋白、T細胞受體、少於8個氨基酸殘基的小肽、合成序列、專利序列等。與TrEMBL類似,GenPept是由GenBank翻譯得到的蛋白質序列。由於TrEMBL和GenPept均是由核酸序列通過計算機程序翻譯生成,這兩個資料庫中的序列錯誤率較大,均有較大的冗餘度。另一個常用的蛋白質序列資料庫是已知三維結構蛋白質的一級結構序列資料庫NRL-3D[Namboodiri, 1990]。該資料庫的序列是從三維結構資料庫PDB中提取出來。

Ⅲ 蛋白質資料庫包括哪四種

PIR:蛋白質信息資源
SWISS-PROT:蛋白質序列和註解
PDB:國家實驗室蛋白質資料庫
MMDB:蛋白質分子模型資料庫

Ⅳ 蛋白質組學目前有哪些資料庫

NCBI資料庫,包括
蛋白質序列資料庫
是從NCBI多個不同資源中編譯整理的。
蛋白質結構資料庫
包含來自X線晶體學和三維結構的實驗數據。其數據從PDB(Protein Data Bank)獲得。

Ⅳ 蛋白質三維結構資料庫的介紹

蛋白質結構資料庫(Protein Data Bank,簡稱PDB)是美國紐約Brookhaven國家實驗室於1971年創建的。為適應結構基因組和生物信息學研究的需要,1998年10月由美國國家科學基金委員會、能源部和衛生研究院資助,成立了結構生物學合作研究協會(Research Collaboratory for Structural Bioinformat-ics,簡稱RCSB)。PDB資料庫改由RCSB管理,目前主要成員為拉特格斯大學(Rutgers University)、聖地亞哥超級計算中心(San Diego Supercomputer Cen-ter,簡稱SDSC)和國家標准化研究所(National Insti-tutes of Standards andTechnology,簡稱NIST)。和核酸序列資料庫一樣,可以通過網路直接向PDB資料庫提交數據。

Ⅵ 為什麼說swiss-prot是重要的蛋白質序列資料庫

SWISS-PROT是含有詳細注釋內容的蛋白質序列資料庫,由歐洲生物信息學中心(EBI)維護,目前已合並入 UniProt資料庫,旨在幫助基因組和蛋白質組以及相關的分子生物學研究人員提供有關蛋白質氨基酸序列的最新信息。
SWISS-PROT中盡可能減少了冗餘序列,並與其它30多個數據建立
了交叉引用,其中包括核酸序列庫、蛋白質序列庫和蛋白質結構庫等。SWISS-PROT資料庫包含了EMBL核酸序列資料庫中被經過仔細檢查和准確注釋了
的蛋白質序列,一般地,任何蛋白質序列數據的搜尋和比較都應從SWISS-PROT開始。

SWISS-PROT蛋白質序列數據由大量序列條目組成,每一個序列條目
有其自己的格式。為了標准化的目的,SWISS-PROT的格式與EMBL核酸序列資料庫的格式盡可能類似。SWISS-PROT涉及已知蛋白質的序列、
引用文獻信息、分類學信息、注釋等,注釋中包括蛋白質的功能、轉錄後修飾、特殊位點和區域、二級結構、四級結構、與其它序列的相似性、序列殘缺與疾病的關
系、序列變異體和沖突等信息。利用序列提取系統(SRS)可以方便地檢索SWISS-PROT和其它EBI的資料庫。SWISS-PROT只接受直接測序
獲得的蛋白質序列,序列提交可以在其Web頁面上完成。

Ⅶ 列舉兩個蛋白質次級資料庫

oracle資料庫
mysql資料庫
access資料庫
DB2
在大學的計算機教科書中,資料庫是被這樣解釋的:資料庫是
計算機應用系統
中的一種專門管理數據資源的系統。數據有多種形式,如文字、數碼、符號、圖形、圖像以及聲音等。數據是所有
計算機系統
所要處理的對象。人們所熟知的一種處理辦法是製作文件,即將處理過程編成程序文件,將所涉及的數據按程序要求組織成
數據文件
,用程序文件來調用。數據文件與程序文件保持著一定的對應關系。在計算機應用迅速發展的情況下,這種文件式方法便顯出不足。比如,它使得數據通用性差,不便於移植,在不同文件中存儲大量重復信息、浪費存儲空間、更新不便等。
資料庫系統
便能解決上述問題。資料庫系統不從具體的應用程序出發,而是立足於數據本身的管理,它將所有數據保存在資料庫中,進行科學的組織,並藉助於
資料庫管理系統
,以它為中介,與各種應用程序或應用系統介面,使之能方便地使用資料庫中的數據。
這段說明介紹的確非常詳細,不過你可能看得頭暈眼花了,其實簡單地說資料庫就是一組經過計算機整理後的數據,存儲在一個或多個文件中,而管理這個資料庫的軟體就稱之為資料庫管理系統。一般一個資料庫系統(Database
System)可分為資料庫(Database)與數據管理系統(Database
Management
System,DBMS)兩個部分。

Ⅷ 常用的查詢蛋白質結構以及序列的資料庫主要有哪些

1. PIR和PSD
PIR國際蛋白質序列資料庫(PSD)是由蛋白質信息資源(PIR)、慕尼黑蛋白質序列信息中心(MIPS)和日本國際蛋白質序列資料庫(JIPID)共同維護的國際上最大的公共蛋白質序列資料庫,可在這里下載。這是一個全面的、經過注釋的、非冗餘的蛋白質序列資料庫,其中包括來自幾十個完整基因組的蛋白質序列。所有序列數據都經過整理,超過99%的序列已按蛋白質家族分類,一半以上還按蛋白質超家族進行了分類。PSD的注釋中還包括對許多序列、結構、基因組和文獻資料庫的交叉索引,以及資料庫內部條目之間的索引,這些內部索引幫助用戶在包括復合物、酶-底物相互作用、活化和調控級聯和具有共同特徵的條目之間方便的檢索。每季度都發行一次完整的資料庫,每周可以得到更新部分。
PSD資料庫有幾個輔助資料庫,如基於超家族的非冗餘庫等。PIR提供三類序列搜索服務:基於文本的互動式檢索;標準的序列相似性搜索,包括BLAST、FASTA等;結合序列相似性、注釋信息和蛋白質家族信息的高級搜索,包括按注釋分類的相似性搜索、結構域搜索GeneFIND等。
2. SWISS-PROT
SWISS-PROT是經過注釋的蛋白質序列資料庫,由歐洲生物信息學研究所(EBI)維護。資料庫由蛋白質序列條目構成,每個條目包含蛋白質序列、引用文獻信息、分類學信息、注釋等,注釋中包括蛋白質的功能、轉錄後修飾、特殊位點和區域、二級結構、四級結構、與其它序列的相似性、序列殘缺與疾病的關系、序列變異體和沖突等信息。SWISS-PROT中盡可能減少了冗餘序列,並與其它30多個數據建立了交叉引用,其中包括核酸序列庫、蛋白質序列庫和蛋白質結構庫等。
利用序列提取系統(SRS)可以方便地檢索SWISS-PROT和其它EBI的資料庫。SWISS-PROT只接受直接測序獲得的蛋白質序列,序列提交可以在其Web頁面上完成。
3. PROSITE
PROSITE資料庫收集了生物學有顯著意義的蛋白質位點和序列模式,並能根據這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質序列應該屬於哪一個蛋白質家族。有的情況下,某個蛋白質與已知功能蛋白質的整體序列相似性很低,但由於功能的需要保留了與功能密切相關的序列模式,這樣就可能通過PROSITE的搜索找到隱含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位點、配體結合位點、與金屬離子結合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質結合的區域等;除了序列模式之外,PROSITE還包括由多序列比對構建的profile,能更敏感地發現序列與profile的相似性。PROSITE的主頁上提供各種相關檢索服務。
4. PDB
蛋白質數據倉庫(PDB)是國際上唯一的生物大分子結構數據檔案庫,由美國Brookhaven國家實驗室建立。PDB收集的數據來源於X光晶體衍射和核磁共振(NMR)的數據,經過整理和確認後存檔而成。目前PDB資料庫的維護由結構生物信息學研究合作組織(RCSB)負責。RCSB的主伺服器和世界各地的鏡像伺服器提供資料庫的檢索和下載服務,以及關於PDB數據文件格式和其它文檔的說明,PDB數據還可以從發行的光碟獲得。使用Rasmol等軟體可以在計算機上按PDB文件顯示生物大分子的三維結構。
5. SCOP
蛋白質結構分類(SCOP)資料庫詳細描述了已知的蛋白質結構之間的關系。分類基於若干層次:家族,描述相近的進化關系;超家族,描述遠源的進化關系;折疊子(fold),描述空間幾何結構的關系;折疊類,所有折疊子被歸於全α、全β、α/β、α+β和多結構域等幾個大類。SCOP還提供一個非冗餘的ASTRAIL序列庫,這個庫通常被用來評估各種序列比對演算法。此外,SCOP還提供一個PDB-ISL中介序列庫,通過與這個庫中序列的兩兩比對,可以找到與未知結構序列遠緣的已知結構序列。
6. COG
蛋白質直系同源簇(COGs)資料庫是對細菌、藻類和真核生物的21個完整基因組的編碼蛋白,根據系統進化關系分類構建而成。COG庫對於預測單個蛋白質的功能和整個新基因組中蛋白質的功能都很有用。利用COGNITOR程序,可以把某個蛋白質與所有COGs中的蛋白質進行比對,並把它歸入適當的COG簇。COG庫提供了對COG分類數據的檢索和查詢,基於Web的COGNITOR服務,系統進化模式的查詢服務等。

Ⅸ uniprot蛋白質序列資料庫由哪幾部分組成各有什麼特點

將PIR、SWISS-PROT和TrEMBL3個蛋白質資料庫統一-起來組建而成,包含3個部分:
(1)
UniProt
Knowledgebase
(UniProtKB)
,這是蛋白質序列、功能、分類、交叉引用等蛋白質知識庫,記錄經過人工篩選和注釋;

(2)
UniRef
(
UniProt
Non-rendant
Reference
)
資料庫,將密切相關的蛋白質序列組合到一條記錄中,以便提高搜索速度;目前,根據序列相似程度形成3個子庫,即UniRef100、UniRef90和UniRef50;

(3)
UniParc
(UniProt
Archive),是UniProt存檔庫
,
收錄所有蛋白質序列。用戶可以通過文本查詢資料庫,可以利用BLAST程序搜索資料庫,也可以直接通過FTP下載數據。

閱讀全文

與蛋白質資料庫有哪些相關的資料

熱點內容
匹配出來數據重復了怎麼回事 瀏覽:666
沒有專利代理資格證如何處罰 瀏覽:126
代理證去哪裡辦理流程 瀏覽:196
手機怎麼用數據線連接在電腦 瀏覽:240
汽車的設計哪個體現了信息交互 瀏覽:22
抖音如何開通ac交易 瀏覽:866
程序員如何跟領導談薪酬 瀏覽:279
七路公交車什麼時候到朝陽市場 瀏覽:229
技術咨詢費包含哪些內容 瀏覽:771
進口產品哪些 瀏覽:925
卡盟代理是什麼意思啊 瀏覽:305
教學產品怎麼得到學校校長認可 瀏覽:382
市場細分的方法有哪些請簡要說明 瀏覽:893
微信提貨小程序多少錢 瀏覽:792
生產設備技術檔案有哪些內容 瀏覽:278
網易buff交易多久收到錢 瀏覽:997
查戶口信息到哪個部門 瀏覽:641
期貨中什麼叫市場預期 瀏覽:795
微信小程序平台前端如何裝修 瀏覽:592
怎麼修改電腦配置信息 瀏覽:291