❶ Google 和百度主要用什么数据库
Google,网络等具有自己的搜索引擎内核,也具有相应的大数据信息数据库,是属于数据领域的顶级公司和顶级设备为其服务,所以即使是几百万条的数据,也是很快速的给你提供相应的搜索结果。
❷ 数据库有哪些
目前比较常见的数据库:
SQL是用于访问和处理数据库的标准的计算机语言。
MySQL是小型的开源的关系型数据库管理系统。
SQL Server 是 Microsoft 开发的关系数据库管理系统。
Oracle数据库系统是目前世界上流行的关系数据库管理系统。
DB2是关系型数据库平台,其采用多进程多线索的结构,支持多用户或应用程序在同一条SQL 语句中查询不同数据库和数据。
PostgreSQL 是一个对象-关系数据库服务器,号称 "世界上最先进的开源关系型数据库"。
Hadoop是个很流行的分布式计算解决方案,Hive是基于hadoop的数据仓库工具,hive 构建在基于静态批处理的Hadoop 之上。
GreenPlum采用了MPP(大规模并行处理),是一个由多个独立的数据库服务组合成关系型数据库集群。
ECharts 是一个使用 JavaScript 实现的开源可视化库,涵盖各行业图表。
R是一种集统计分析与图形显示为一体的统计分析软件,具有很强的互动性。
python是一种跨平台的计算机程序设计语言,被广泛用于系统管理任务的处理和Web编程。
目前,这些数据库都在树懒学堂有相关教程,可以跟着一步一步学习
❸ 常用的数据库有哪些
虽然是cop的,但是是专业的。
1. IBM 的DB2
作为关系数据库领域的开拓者和领航人,IBM在1997年完成了System R系统的原型,1980年开始提供集成的数据库服务器—— System/38,随后是SQL/DSforVSE和VM,其初始版本与SystemR研究原型密切相关。DB2 forMVSV1 在1983年推出。该版本的目标是提供这一新方案所承诺的简单性,数据不相关性和用户生产率。1988年DB2 for MVS 提供了强大的在线事务处理(OLTP)支持,1989 年和1993 年分别以远程工作单元和分布式工作单元实现了分布式数据库支持。最近推出的DB2 Universal Database 6.1则是通用数据库的典范,是第一个具备网上功能的多媒体关系数据库管理系统,支持包括Linux在内的一系列平台。
2. Oracle
Oracle 前身叫SDL,由Larry Ellison 和另两个编程人员在1977创办,他们开发了自己的拳头产品,在市场上大量销售,1979 年,Oracle公司引入了第一个商用SQL 关系数据库管理系统。Oracle公司是最早开发关系数据库的厂商之一,其产品支持最广泛的操作系统平台。目前Oracle关系数据库产品的市场占有率名列前茅。
3. Informix
Informix在1980年成立,目的是为Unix等开放操作系统提供专业的关系型数据库产品。公司的名称Informix便是取自Information 和Unix的结合。Informix第一个真正支持SQL语言的关系数据库产品是Informix SE(StandardEngine)。InformixSE是在当时的微机Unix环境下主要的数据库产品。它也是第一个被移植到Linux上的商业数据库产品。
4. Sybase
Sybase公司成立于1984年,公司名称“Sybase”取自“system”和 “database” 相结合的含义。Sybase公司的创始人之一Bob Epstein 是Ingres 大学版(与System/R同时期的关系数据库模型产品)的主要设计人员。公司的第一个关系数据库产品是1987年5月推出的Sybase SQLServer1.0。Sybase首先提出Client/Server 数据库体系结构的思想,并率先在Sybase SQLServer 中实现。
5. SQL Server
1987 年,微软和 IBM合作开发完成OS/2,IBM 在其销售的OS/2 ExtendedEdition 系统中绑定了OS/2Database Manager,而微软产品线中尚缺少数据库产品。为此,微软将目光投向Sybase,同Sybase 签订了合作协议,使用Sybase的技术开发基于OS/2平台的关系型数据库。1989年,微软发布了SQL Server 1.0 版。
6. PostgreSQL
PostgreSQL 是一种特性非常齐全的自由软件的对象——关系性数据库管理系统(ORDBMS),它的很多特性是当今许多商业数据库的前身。PostgreSQL最早开始于BSD的Ingres项目。PostgreSQL 的特性覆盖了SQL-2/SQL-92和SQL-3。首先,它包括了可以说是目前世界上最丰富的数据类型的支持;其次,目前PostgreSQL 是唯一支持事务、子查询、多版本并行控制系统、数据完整性检查等特性的唯一的一种自由软件的数据库管理系统.
7.mySQL
mySQL是一个小型关系型数据库管理系统,开发者为瑞典MySQL AB公司。在2008年1月16号被Sun公司收购。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。MySQL的官方网站的网址是: www.mysql.com
❹ 一般常用的数据库有哪些
常见的关系型数据库有mysql 、SQL Server、Oracle、Sybase、DB2等。关系型数据库是目前最受欢迎的数据库管理系统,技术比较成熟。
❺ 国外主要期刊数据库有哪些
有科学引文索引、社会科学引文索引、科技会议录索引、Engineering Village、EBSCO等。
1、科学引文索引
美国《科学引文索引》(Science Citation Index, 简称 SCI )于1957 年由美国科学信息研究所(Institute for Scientific Information, 简称 ISI)在美国费城创办,是由美国科学信息研究所(ISI)1961 年创办出版的引文数据库。
SCI从来源期刊数量划分为SCI和SCI-E。SCI指来源刊为3500多种的SCI印刷版和SCI光盘版(SCI Compact Disc Edition, 简称SCI CDE),SCI-E(SCI Expanded)是SCI的扩展库,收录了5600多种来源期刊,可通过国际联机或因特网进行检索。
SCI涵盖学科超过100个,主要涉及农业、生物及环境科学;工程技术及应用科学;医学与生命科学;物理及化学;行为科学。
2、社会科学引文索引
社会科学引文索引为SCI的姊妹篇,亦由美国科学信息研究所创建,是可以用来对不同国家和地区的社会科学论文的数量进行统计分析的大型检索工具。
1999年SSCI全文收录1809种世界最重要的社会科学期刊,内容覆盖包括人类学、法律、经济、历史、地理、心理学等55个领域。
收录文献类型包括:研究论文,书评,专题讨论,社论,人物自传,书信等。选择收录 (Selectively Covered)期刊为1300多种。
社会科学引文索引(Social Sciences Citation Index,简称SSCI)收录报道并标引了2684种(截止到2009年6月9日)社会科学期刊,同时也收录SCIE所收录的期刊当中涉及社会科学研究的论文。
3、科技会议录索引
《科技会议录索引》(Index to Scientific & Technical Proceedings,简称ISTP)创刊于1978年,由美国科学情报研究所编辑出版。
该索引收录生命科学、物理与化学科学、农业、生物和环境科学、工程技术和应用科学等学科的会议文献,包括一般性会议、座谈会、研究会、讨论会、发表会等。其中工程技术与应用科学类文献约占35%,其他涉及学科基本与SCI相同。
4、Engineering Village
Engineering Village是最权威的工程、应用科学领域文献检索平台。Engineering Village平台上的10多个数据库涵盖了工程、应用科学相关的最为广泛的领域,内容来源包括学术文献、商业出版物、发明专利、会议论文和技术报告等等;
其中的Compendex 就是美国工程索引Engineering Index数据库,是全世界最早的工程文摘来源。 现如今,Compendex 是科学和技术工程研究方面最为全面的文摘数据库,涉足190个工程学科,囊括了从1969年至今的1130多万份文摘记录。
5、EBSCO
EBSCO Publishing (缩写EP)是EBSCO Instries,Inc.的一个业务部,全面负责文献信息相关产品和服务。最早的业务是期刊代订服务。
正是凭借为美国军方机构提供期刊代订服务,Stephens夫妇创立的这家公司得以发展壮大。公司在图情业界俗称EBSCO,也是基于此。
在23个国家设有办公室,服务于全球200个国家和地区的客户。主要服务对象是研究型大学、科学院所、政府部门、大型医疗机构以及公司等。
参考资料来源:网络——科学引文索引
参考资料来源:网络——社会科学引文索引
参考资料来源:网络——ISTP
参考资料来源:网络——Engineering Village
参考资料来源:网络——EBSCO
❻ 大数据常用哪些数据库
通常数据库分为关系型数据库和非关系型数据库,关系型数据库的优势到现在也是无可替代的,比如MySQL、SQL Server、Oracle、DB2、SyBase、Informix、PostgreSQL以及比较小型的Access等等数据库,这些数据库支持复杂的SQL操作和事务机制,适合小量数据读写场景;但是到了大数据时代,人们更多的数据和物联网加入的数据已经超出了关系数据库的承载范围。
大数据时代初期,随着数据请求并发量大不断增大,一般都是采用的集群同步数据的方式处理,就是将数据库分成了很多的小库,每个数据库的数据内容是不变的,都是保存了源数据库的数据副本,通过同步或者异步方式保证数据的一致性,每个库设定特定的读写方式,比如主数据库负责写操作,从数据库是负责读操作,等等根据业务复杂程度以此类推,将业务在物理层面上进行了分离,但是这种方式依旧存在一定的负载压力的问题,企业数据在不断的扩增中,后面就采用分库分表的方式解决,对读写负载进行分离,但是这种实现依旧存在不足,且需要不断进行数据库服务器扩容。
NoSQL数据库大致分为5种类型
1、列族数据库:BigTable、HBase、Cassandra、Amazon SimpleDB、HadoopDB等,下面简单介绍几个
(1)Cassandra:Cassandra是一个列存储数据库,支持跨数据中心的数据复制。它的数据模型提供列索引,log-structured修改,支持反规范化,实体化视图和嵌入超高速缓存。
(2)HBase:Apache Hbase源于Google的Bigtable,是一个开源、分布式、面向列存储的模型。在Hadoop和HDFS之上提供了像Bigtable一样的功能。
(3)Amazon SimpleDB:Amazon SimpleDB是一个非关系型数据存储,它卸下数据库管理的工作。开发者使用Web服务请求存储和查询数据项
(4)Apache Accumulo:Apache Accumulo的有序的、分布式键值数据存储,基于Google的BigTable设计,建立在Apache Hadoop、Zookeeper和Thrift技术之上。
(5)Hypertable:Hypertable是一个开源、可扩展的数据库,模仿Bigtable,支持分片。
(6)Azure Tables:Windows Azure Table Storage Service为要求大量非结构化数据存储的应用提供NoSQL性能。表能够自动扩展到TB级别,能通过REST和Managed API访问。
2、键值数据库:Redis、SimpleDB、Scalaris、Memcached等,下面简单介绍几个
(1)Riak:Riak是一个开源,分布式键值数据库,支持数据复制和容错。(2)Redis:Redis是一个开源的键值存储。支持主从式复制、事务,Pub/Sub、Lua脚本,还支持给Key添加时限。
(3)Dynamo:Dynamo是一个键值分布式数据存储。它直接由亚马逊Dynamo数据库实现;在亚马逊S3产品中使用。
(4)Oracle NoSQL Database:来自Oracle的键值NoSQL数据库。它支持事务ACID(原子性、一致性、持久性和独立性)和JSON。
(5)Oracle NoSQL Database:具备数据备份和分布式键值存储系统。
(6)Voldemort:具备数据备份和分布式键值存储系统。
(7)Aerospike:Aerospike数据库是一个键值存储,支持混合内存架构,通过强一致性和可调一致性保证数据的完整性。
3、文档数据库:MongoDB、CouchDB、Perservere、Terrastore、RavenDB等,下面简单介绍几个
(1)MongoDB:开源、面向文档,也是当下最人气的NoSQL数据库。
(2)CounchDB:Apache CounchDB是一个使用JSON的文档数据库,使用Javascript做MapRece查询,以及一个使用HTTP的API。
(3)Couchbase:NoSQL文档数据库基于JSON模型。
(4)RavenDB:RavenDB是一个基于.NET语言的面向文档数据库。
(5)MarkLogic:MarkLogic NoSQL数据库用来存储基于XML和以文档为中心的信息,支持灵活的模式。
4、图数据库:Neo4J、InfoGrid、OrientDB、GraphDB,下面简单介绍几个
(1)Neo4j:Neo4j是一个图数据库;支持ACID事务(原子性、独立性、持久性和一致性)。
(2)InfiniteGraph:一个图数据库用来维持和遍历对象间的关系,支持分布式数据存储。
(3)AllegroGraph:AllegroGraph是结合使用了内存和磁盘,提供了高可扩展性,支持SPARQ、RDFS++和Prolog推理。
5、内存数据网格:Hazelcast、Oracle Coherence、Terracotta BigMemorry、GemFire、Infinispan、GridGain、GigaSpaces,下面简单介绍几个
(1)Hazelcast:Hazelcast CE是一个开源数据分布平台,它允许开发者在数据库集群之上共享和分割数据。
(2)Oracle Coherence:Oracle的内存数据网格解决方案提供了常用数据的快速访问能力,一致性支持事务处理能力和数据的动态划分。
(3)Terracotta BigMemory:来自Terracotta的分布式内存管理解决方案。这项产品包括一个Ehcache界面、Terracotta管理控制台和BigMemory-Hadoop连接器。
(4)GemFire:Vmware vFabric GemFire是一个分布式数据管理平台,也是一个分布式的数据网格平台,支持内存数据管理、复制、划分、数据识别路由和连续查询。
(5)Infinispan:Infinispan是一个基于Java的开源键值NoSQL数据存储,和分布式数据节点平台,支持事务,peer-to-peer 及client/server 架构。
(6)GridGain:分布式、面向对象、基于内存、SQL+NoSQL键值数据库。支持ACID事务。
(7)GigaSpaces:GigaSpaces内存数据网格能够充当应用的记录系统,并支持各种各样的高速缓存场景。
❼ Eur.J 是欧洲化学,但是是哪个数据库的
Chemistry - A European Journal.它是Wiley旗下的一个期刊,口头上都说欧洲化学。
希望回答能给你带来帮助,如果满意请采纳,不满意的话请继续追问。
❽ 世界上三大文献检索数据库是哪几个
SCI--Science Citation Index《科学引文索引》 - EI—Engineering Index《工程索引》 - ISTP—Index to Scientific & Technical Proceedings 《科技会议录索引》 - SCI SCI(《科学引文索引》,英文全称为Science Citation Index)是美国科学情报研究所(In stitute for Scientific Information,简称ISI)出版的一部世界着名的期刊文献检索工具,其出版形式包括印刷版期刊和光盘版及联机数据库,现在还发行了互联网上Web版数据库。 SCI收录全世界出版的数、理、化、农、林、医、生命科学、天文、地理、环境、材料、工程技术等自然科学各学科的核心期刊约3500种。ISI通过它严格的选刊标准和评估程序挑选刊源,而且每年略有增减,从而做到SCI收录的文献能全面覆盖全世界最重要和最有影响力的研究成果。ScI所谓最有影响力的研究成果,指的是报道这些成果的文献大量地被其它文献引用。为此,作为一部检索工具,SCI一反其它检索工具通过主题或分类途径检索文献的常规做法,而设置了独特的“引文索引”(Citation Index)。即通过先期的文献被当前文献的引用,来说明文献之间的相关性及先前文献对当前文献的影响力。 SCI以上做法上的特点,使得SCI不仅作为一部文献检索工具使用,而且成为科研评价和的一种依据。科研机构被SCI收录的论文总量,反映整个机构的科研、尤其是基础研究的水平;个人的论文被SCI收录的数量及被引用次数,反映他的研究能力与学术水平。 此外,ISI每年还出版JCR(《期刊引用报告》,全称Journal Citation Reports)。JCR对包括SCI收录的3500种期刊在内的4700种期刊之间的引用和被引用数据进行统计、运算,并针对每种期刊定义了影响因子(Impact Factor)等指数加以报道。一种期刊的影响因子,指的是该刊前二年发表的文献在当前年的平均被引用次数。一种刊物的影响因子越高,也即其刊载的文献被引用率越高,一方面说明这些文献报道的研究成果影响力大,另一方面也反映该刊物的学术水平高。因此,JCR以其大量的期刊统计数据及计算的影响因子等指数,而成为一种期刊评价工具。图书馆可根据JCR提供的数据制定期刊引进政策;论文作者可根据期刊的影响因子排名决定投稿方向。 EI Ei Compendex是全世界最早的工程文摘来源。Ei Compendex数据库每年新增的50万条文摘索引信息分别来自5100种工程期刊、会议文集和技术报告。Ei Compendex收录的文献涵盖了所有的工程领域,其中大约22%为会议文献,90%的文献语种是英文。Ei公司在1992年开始收录中国期刊。1998年Ei在清华大学图书馆建立了Ei中国镜像站。 SCI、SSCI 简介 目前,在国际科学界,如何正确评价基础科学研究成果已引起越来越广泛的关注。而被SCI、SSCI收录的科技论文的多寡则被看作衡量一个国家的基础科学研究水平、科技实力和科技论文水平高低的重要评价指标。那么,究竟什么是SCI和SSCI呢?我们根据所掌握的资料,简介如下: 一、SCI简介-- SCI即《科学引文索引》(Science Citation Index),是由美国科学信息研究所(Institute for Scientific Information 简称ISI)创建的,收录文献的作者、题目、源期刊、摘要、关键词,不仅可以从文献引证的角度评估文章的学术价值,还可以迅速方便地组建研究课题的参考文献网络。SCI创刊于1961年。经过40年的发展完善,已从开始时单一的印刷型发展成为功能强大的电子化、集成化、网络化的大型多学科、综合性检索系统。-- SCI从来源期刊数量划分为SCI和SCI-E。SCI指来源刊为3500多种的SCI印刷版和SCI光盘版(SCI Compact Disc Edition, 简称SCI CDE),SCI-E(SCI Expanded)是SCI的扩展库,收录了5600多种来源期刊,可通过国际联机或因特网进行检索。SCI涵盖学科超过100个,主要涉及农业、生物及环境科学;工程技术及应用科学;医学与生命科学;物理及化学;行为科学。-- 二、SSCI简介-- SSCI即社会科学引文索引(Social Sciences Citation Index),为SCI的姊妹篇,亦由美国科学信息研究所创建,是目前世界上可以用来对不同国家和地区的社会科学论文的数量进行统计分析的大型检索工具。1999年SSCI全文收录1809种世界最重要的社会科学期刊,内容覆盖包括人类学、法律、经济、历史、地理、心理学等55个领域。收录文献类型包括:研究论文,书评,专题讨论,社论,人物自传,书信等。选择收录(Selectively Covered)期刊为1300多种。 三、SCI、SSCI交叉关系-- SSCI对其收录期刊范围的说明中明确告知该数据库中有一部分内容与SCI重复,这是因为学科之间本身有交叉,是社会科学与自然科学相结合的跨学科的研究在文献中的自然反映。 另外,SSCI从3400余种自然科学期刊中,通过计算机检索文章主题和引文后,生成一个与社会科学有关的文献目录,此目录再经ISI编委会审核,选择与社会科学密切相关的文献加入SSCI。因此SSCI也收录了相当数量的自然科学文献,二者的交叉关系更为密切。 EI简介 EI是美国《工程索引》(The Engineering Index)的简称。EI创刊于1884年,由美国工程情报公司(Engineering Information Co.)出版发行。EI是工程技术领域内的一部综合性检索工具,报道内容包括:电类、自动控制类、动力、机械、仪表、材料科学、农业、生物工程、数理、医学、化工、食品、计算机、能源、地质、环境等学科。- ISTP简介 ISTP是Index to Scientific & Technical Proceedings的缩写,是美国科学情报研究所的网络数据库Web of Science Proceedings中两个数据库(ISTP和ISSHP)之一。专门收录世界各种重要的自然科学及技术方面的会议,包括一般性会议、座谈会、研究会、讨论会、发表会等的会议文献,涉及学科基本与SCI相同。 ISTP收录论文的多少与科技人员参加的重要国际学术会议多少或提交、发表论文的多少有关。我国科技人员在国外举办的国际会议上发表的论文占被收录论文总数的64.44%。 在ISTP、 EI、 SCI这三大检索系统中,SCI最能反映基础学科研究水平和论文质量,该检索系统收录的科技期刊比较全面,可以说它是集中各个学科高质优秀论文的精萃,该检索系统历来成为世界科技界密切注视的中心和焦点。
❾ 常用的查询蛋白质结构以及序列的数据库主要有哪些
1. PIR和PSD
PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库,可在这里下载。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
3. PROSITE
PROSITE数据库收集了生物学有显着意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
❿ Google 和百度主要用什么数据库
由于基于关键词的数据特性和数据量巨大这些原因 关系型数据库是不适用的
搜索引擎公司都使用自己的数据存储形式和检索形式, 用于适应搜索引擎涉及到的数据特性, 而不是通用的关系型数据库解决方案, 可以简单认为是设计了一个独立的数据库系统, 其实就是通常说的搜索引擎索引系统. google 98论文里面有简单的介绍其索引的形式, 可参考译文里的"4.2 主要的数据结构"http://article.yeeyan.org/view/yangxiao/1347
在这层数据存储形式之下, 还进一步延伸出分布式的存储系统(当然非分布式的也可以用)