导航:首页 > 信息技术 > 计算机检索技术有哪些

计算机检索技术有哪些

发布时间:2022-02-09 10:05:09

❶ 简述计算机检索基本技术的种类

计算机检索基本技术的种类有:布尔逻辑检索、截词检索、限制符检索、位置运算符检索。
1、布尔逻辑检索也称作布尔逻辑搜索,严格意义上的布尔检索法是指利用布尔逻辑运算符连接各个检索词,然后由计算机进行相应逻辑运算,以找出所需信息的方法.它使用面最广、使用频率最高.布尔逻辑运算符的作用是把检索词连接起来,构成一个逻辑检索式.
2、截词检索是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能.截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率.
3、限制符检索(Range)是通过限制检索范围,达到优化检索结果的方法.限制检索的方式有多种,例如进行字段检索、使用限制符、采用限制检索命令等.
4、位置运算符检索也叫临近检索.文献记录中词语的相对次序或位置不同,所表达的意思可能不同,而同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样.位置算符检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的临近关系,并且可以不依赖主题词表而直接使用自由词进行检索的技术方法.

❷ 计算机检索的基本步骤有哪些

1、明确检索目标,分析课题
2、选择检索工具
3、确定检索路径和检索策略
4、实施检索
5、获取原始文献信息
6、分析得出结果

❸ 计算机检索技术有哪些

计算机信息检索可以概括为两个部分:信息存储和信息检索。

计算机信息检索与信息的构造、分析、组织、存储和传播有关。计算机信息检索系统是信息检索所用的硬件资源、系统软件和检索软件的总合。它能存储大量的信息,并对信息条目(有特定逻辑含义的基本信息单位)进行分类、编目或编制索引。它可以根据用户要求从已存储的信息集合中抽取出特定的信息,并提供插入、修改和删除某些信息的能力。

(3)计算机检索技术有哪些扩展阅读:

计算机信息检索系统的可靠性与计算机系统的可靠性密切相关。它依赖于计算机系统硬件的可靠性、操作系统的故障恢复机构、数据库管理系统的恢复机构和应用软件采取的故障处理措施。任何计算机信息检索系统都不能保证信息不受到破坏,但是它必须具有从破坏中得以恢复的能力。

计算机信息检索系统的效能通常根据漏检索、误检率、检全率、检准率和响应时间(对联机检索)等来衡量。关键词本身错误或使用的查找算法不对会引起漏检。

❹ 计算机检索的常用方法有哪些

明确检索要求和检索目标
计算机检索的第一步准备工作是明确检索要求和检索目标。
明确检索要求就是要搞清楚本课题属于什么学科,所需文献的类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索费用。这些要求对选择数据库、构造检索策略都是十分重要的。
确定检索目标也是进行计算机信息检索前应搞清楚的准备工作。例如:如果属于开题调研,则应尽可能地检索出与之相关的全部文献,即要求较高的查全率;以便充分地做好开题的准备工作;如果属于探索性、开创性的课题,则只需要查出一些启发性的文献,对查准率和查全率要求都不一定有很高的要求。
4.3.2 课题分析
1. 课题概念的分析方法 分析课题就是分析出课题所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而分析概念之间的上、下、左、右关系。对于新学科、交叉学科和边缘学科的课题,则要搞清楚这些概念之间的关系。概念分析的结果应以概念组为单元的词或词组的形式列出,以便下一步制订检索策略时使用。
2. 隐含概念的分析方法 有些课题的实质性内容往往很难从课题的名称上反映出来,课题所隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能提炼出能够确切反映课题内容的检索概念。例如:"社会保障"包含"养老保险"、"失业保险"、"医疗保险"和"社会救济"等概念,如果要检索社会保障方面的文献,应该析出上述概念,才能保证文献的查全率。
3. 核心概念的选取 有些检索词中已经含有的某些概念,在概念分析中应予以排除。例如:课题"公司劳动奖励、职工培训和养老保险制度管理的理论和实践",如果把"劳动奖励","职工培训","养老保险","公司","制度","管理"六个概念全部组配起来,则会造成大量文献漏检。实际上,劳动力资源管理已经包含了劳动奖励、职工培训和养老保险三个方面,而且,劳动力管理必然是针对该三个方面而言的。因此,本课题只须采用"劳动力资源"和"管理"这两个本质概念即可。
为了提高文献的检准率,应该从相应的规范词表中选择所需的检索词。并且在确定检索词时,除了要考虑反映主题概念的同义词、近义词等相关的检索词外,还要注意选择被选用检索词的缩写词和不同拼法的词,以避免漏检有关的文献。
4.3.3 检索词的扩展、选择和处理
目前的计算机信息检索系统,还不具备智能思考的能力,还不会对所输入的检索词以及涉及的所有词进行自动、全面的检索,因此,必须在概念分析的基础上列出与概念有关的词,从中做出选择,并利用截词等方法对检索词予以归并。
1.相同概念的检索词的扩展 扩展相同概念的检索词的方法一般有同义词方法、主题词表方法和截词方法
(1) 同义词方法。在同一概念的范畴内,从语言角度,选择不同的名称、不同的拼写方法和单复数形式。不同的名称包括学名和俗名、简称和全称,商品名和物质或产品名,事物的代码和事物的学名。不同的拼写方法,以英语为例,包括英式英语和美式英语的区别。
(2)截词方法。当某些检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词的单复数变化和英美不同拼写形式),可以采用截词方法扩展检索词。这种方法要求在词干后使用截词符。截词符一般包括"?"和"*"两种。具体采用什么形式,各个系统都有明确的规定。例如:在DIALOG系统中,截词符号有无限截词算符
("?") 和有限截词 ("??"和"?? ?")等多种,"?"有时还用做字符屏蔽符。
(3)主题词表方法 许多数据库都编有自己的主题词表。在数据库编有主题词表的情况下,应该尽量从词表中选择检索词。使用主题词表,不仅可以使检索词更加规范,提高检索结果的准确性,而且可以从同族词中选取更多的上位词、下位词、相关词,使获得的检索结果更为理想。
2.检索词的选择和处理 运用上述方法得到的词,首先应加以选择,即注意选用本专业通用的术语(应避免使用冷僻词和根据中文术语自译生造的词),然后以概念为单位,构成组面(facets)。例如:课题"东西方社会保障制度比较研究"的概念组面和检索词为:

概念组面1:"社会保障" social security 概念组面2:"制度研究"system? Research
4.3.4 数据库的选择
不同数据库的学科范围不同,检索指令不同,收费的标准也不同。所以,在检索之前应该阅读有关数据库的使用介绍,以便选择数据库时做到心中有数。
选择数据库,我们一般应该遵循以下几条原则
1.按照课题的检索要求和目的,选择收录文献种类多、专业覆盖面宽、年代跨度对口的数据库;
2.当需要查找最新文献信息时,选择数据更新周期短的数据库;
3.当还需要获取原文时,选取原文获取较容易的数据库;
4.在同时有多个数据库可供选择的情况下,应首先选择比较熟悉的数据库。
5.当几个数据库的内容交叉重复率比较高时,应选择检索费用比较低的数据库。
4.3.5 检索策略构成和调整方法
在实际检索过程中,仅需一个检索词就能满足检索要求的情况并不很多。通常我们需要使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂课题的要求。
检索策略,又称提问逻辑,就是对多个检索词之间的相互关系和检索顺序作出的某种安排。构成检索策略就是运用计算机情报检索系统可以接受的方法,包括布尔逻辑算符、位置逻辑算符等方法,表达课题检索要求的过程。

1.布尔逻辑算符 规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑"或(OR)"、"与(AND)"和"非(NOT)"。
(1) 或(OR)运算符。也可用"+"代替,是用来组配具有同义或同族概念的词,如同义词、相关词等。其含义是,检出的记录中,至少含有两个检索词中的一个。OR算符的基本作用是扩大检索范围,增加命中文献量,提高检索结果的查全率,OR运算符还有一个去重的功能。在实际检索中,同一组面中含义相同的词,相互之间都使用OR运算符。另外,在使用截词方法检索具有相同词干的检索词时,这些词之间也自动地隐含了逻辑"或"的关系。
(2) 与(AND)运算符。也可用"*"代替,用来组配不同检索概念。其含义是检出的记录必须同时含有所有的检索词。AND算符的基本作用是缩小检索范围,减少命中文献量,提高检索结果的查准率。在实际检索中,不同概念组面之间以及同一组面内的不同含义的词之间通常使用AND算符。
(3) 非(NOT)运算符。也可用"-"代替,但在检索时建议使用NOT,以避免与词间的分隔符"-"混淆,NOT算符是排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。NOT算符的基本作用是缩小检索范围,提高检索结果的查准率.
2. 位置算符 位置算符又称邻接算符(adjacent operators),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合,比如,以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词等。位置算符是调整检索策略的一种重要手段。按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一种位置算符,检索系统不同,规定的位置算符也不同。例如,Compendex光盘数据库使用的位置算符"(N)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序可以颠倒)、"(F)"(表示其两侧的检索词必须在同一字段(例如同在题目字段或文摘字段)中出现,两词的词序可以颠倒)、"(S)"(表示其两侧的检索词必须在同一句子中出现,两词的词序可以颠倒)和"(W)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序不可以颠倒)四种。
3.字段限制 字段限制也是调整检索策略的一种重要的手段。它是限定检索词必须在数据库记录中规定的字段范围内出现的文献,方为命中文献的一种检索方法。如果想指定在题名等字段中查找所希望的检索词,就需要使用字段限制。字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索结果的查准率的场合。由于字段限制采用前缀和后缀的形式,因此又称为前缀限制和后缀限制。例如Compendex光盘数据库基本字段限制的用法是在需要指定字段的检索词后加上后缀运算符"/"和段码。这个数据库辅助字段限制的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符"="。

4. 检索策略的调整 检索策略输入检索系统后,系统响应的检索结果有时不一定能满足课题检索的要求,例如:或者检出的篇数过多,而且不相关文献所占比例很大,或者检出的文献数量太少,有时甚至为零,这时就需要调整检索策略。
调整检索策略之前,首先要分析造成检索结果不理想的原因。对于输出篇数过多的情况,应分析是否是由下述原因造成的:①选用了多义性的检索词;②截词截得过短;③输入的检索词太少;④应该使用"与(AND)"的使用了"或(OR)";⑤优先运算符"()"使用错误。对于输出篇数过少的情况,应分析是否是由下述原因造成的:①检索词拼写错误;②遗漏重要的同义词或隐含概念;③检索词过于冷僻具体;④没有使用截词算符;⑤位置算符和字段算符使用的过多;⑥使用过多的"与(AND)"算符。
针对上述原因,如果是属于需要扩大检索范围,提高文献查全率,调整检索策略的方法有:①减少"与(AND)"算符,增加同义词或同族相关词使用逻辑或(OR)将它们连接起来;②在词干相同的单词后使用截词符(?);③去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。
如果是属于缩小检索范围,提高文献查准率的,调整检索策略的方法有:①减少同义词或同族相关词;②增加限制概念,用逻辑与(AND)将它们连接起来;③使用字段限制,或者限定检索词在指定的基本字段,或者指定的辅助字段出现,限制检索结果的文献类型、语种、出版国家;④使用适当的位置算符;⑤使用"非(NOT)"算符,排除无关概念。
4.3.6 输出格式和方式的选择
所谓输出格式的选择是对记录字段的选择。所谓输出方式的选择是指对屏幕显示、打印和存盘的选择。 一般情况下,如果输出的是中间结果,属于基本字段的题目(TI)、文摘(AB)、叙词(DE)和识别词(ID)字段是必须的,这些字段有利于观察结果,对检索策略做进一步调整。如果是最终结果,可以根据时间、经费条件选择其中适用的格式。
输出方式的选择,要注意的问题是,数据库是否只允许打印、存盘选中的记录;在选定打印、存盘后,是否还须进一步选择"当前记录""全部记录""选中记录";另外如果是存盘,是否还有文件扩展名的限制。

另外给你推荐本书:参考下http://wenku..com/view/646426c58bd63186bcebbca4.html

❺ 计算机检索步骤主要有哪些

计算机检索步骤主要有:

一、明确检索要求和检索目标

计算机检索的第一步准备工作是明确检索要求和检索目标。

明确检索要求就是要搞清楚本课题属于什么学科,所需文献的类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索费用。这些要求对选择数据库、构造检索策略都是十分重要的。

二、课题分析

1. 课题概念的分析方法

分析课题就是分析出课题所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而分析概念之间的上、下、左、右关系。

2. 隐含概念的分析方法

有些课题的实质性内容往往很难从课题的名称上反映出来,课题所隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能提炼出能够确切反映课题内容的检索概念。

3. 核心概念的选取

有些检索词中已经含有的某些概念,在概念分析中应予以排除。

三、检索词的扩展、选择和处理

目前的计算机信息检索系统,还不具备智能思考的能力,还不会对所输入的检索词以及涉及的所有词进行自动、全面的检索,因此,必须在概念分析的基础上列出与概念有关的词,从中做出选择,并利用截词等方法对检索词予以归并。

四、数据库的选择

不同数据库的学科范围不同,检索指令不同,收费的标准也不同。所以,在检索之前应该阅读有关数据库的使用介绍,以便选择数据库时做到心中有数。

五、检索策略构成和调整方法

在实际检索过程中,仅需一个检索词就能满足检索要求的情况并不很多。通常我们需要使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂课题的要求。

(5)计算机检索技术有哪些扩展阅读:

计算机检索的原理:

计算机文献检索的机制与手工检索类似。计算机文献检索就是利用电子计算机查找文献。文献着录以一定的格式输入计算机,成为文献记录。经过计算机处理,将大量的文献记录以一定的结构存贮在磁带或磁盘上,生成文献数据库或文档。用户按一定的要求将检索词输入计算机内,由计算机对其进行处理,并与数据库或文档中的文献记录进行匹配运算。最后将检索结果按要求的格式输出。计算机检索包括存贮和检索两个方面。

计算机检索的特点:

(1)检索方便快捷;(2)检索功能强大;(3)获得信息类型多;(4)检索范围广泛。

❻ 计算机信息检索技术主要有哪几种

计算机信息检索利用计算机系统有效存储和快速查找的能力发展起来的一种计算机应用技术。它与信息的构造、分析、组织、存储和传播有关。
信息分析
目的是确定输入系统的信息条目的格式和内容,并为建立索引作准备。一次信息检索系统用于确定逻辑记录的格式和记录关键字,或记录之间的关系;二次信息检索系统用于浓缩原始信息,又称作标引。这相当于编制题录或文摘。
信息存储
目的是建立信息库,以备检索。为了便于查找,需要合理组织信息条目,可以按文件形式组织,也可以按数据库形式组织。信息检索系统常用的文件组织形式有:顺序文件、索引顺序文件、倒排文件和聚类文件,其中用得较多的是倒排文件和聚类文件。信息检索有脱机处理和联机检索两种检索方式。
系统维护
系统提供一组实用程序来进行装入信息的格式转换、信息文件的初始化和故障后系统的重新运行等一般性服务。二次信息检索系统还提供检索词典维护程序,以便能增加、删除、修改和打印出检索词。

❼ 计算机信息检索技术包括哪些

计算机信息检索可以概括为两个部分:信息存储和信息检索。

1、信息存储目的是建立信息库,以备检索。为了便于查找,需要合理组织信息条目,可以按文件形式组织,也可以按数据库形式组织。信息检索系统常用的文件组织形式有:顺序文件、索引顺序文件、倒排文件和聚类文件,其中用得较多的是倒排文件和聚类文件。

2、信息检索是有脱机处理和联机检索两种检索方式。对于前者,用户提交书面检索要求,操作员按期打印出结果交付用户。对于后者,用户通过联机终端打入检索命令,系统当时给出回答。通过计算机网络,用户还可以进行远程脱机处理或远程联机检索。


(7)计算机检索技术有哪些扩展阅读

计算机信息检索系统的保密性是通过对信息条目的存取控制机构来实现的。对于以文件系统为基础的信息检索系统,存取控制一般只能在文件一级,即通过在打开文件时核对口令来控制非授权的用户检索信息。

对于以数据库技术为基础的检索系统,存取控制可以在文件、记录,甚至在信息条目中某信息项一级,既可以通过核对口令方式,也可以采取调用用户编写的编码、译码子程序的方式阻止非授权的用户调用保密的信息。

❽ 计算机检索有几种基本途径

计算机检索系统的构成

计算机检索系统由计算机硬件、软件、数据库和通讯网络构成。

一、计算机硬件
计算机硬件是系统采用的各种硬设备的总称,主要包括具有一定性能的主计算机、外围设备以及与数据处理或数据传送有关的其他设备。

二、软件
软件由系统维护软件与检索软件构成。系统维护软件,如数据库管理程序、词表管理程序等,其作用是保障检索系统的高效运转。检索软件是用户与系统的界面,用户通过检索软件进行检索,检索软件功能的强弱直接影响着检索效果。检索软件可以分为指令式、菜单式和智能接口等。

三、数据库
根据ISO/DIS 5127标准,数据定义为:“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。”通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。

按国际上通用的分类方法,数据库可以划分为以下类型:

1. 参考数据库
参考数据库(Reference databases)是指引用户到另一信息源以获得原文或其他细节的一类数据库。它包括书目数据库(Bibliographic databases)和指南数据库(Referral database或Directory database)两种。
书目数据库是指存储某个领域的二次文献(如文摘、题录、目录等书目数据)的一类数据库,有时又称为二次文献数据库,或简称为文献数据库。如中国机械工程文摘数据库,属于此类型数据库。
指南数据库也称指示性数据库,是指存储关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关信息源获取更详细的信息的一类数据库。如产品目录、机构名录、研发项目、基金项目等数据库均属于此类型。

2. 源数据库
源数据库(Source databases)是指能直接提供原始资料或具体数据的数据库,用户不必再查阅其他信息源。它可以分为:

(1)数值数据库这是一种专门提供以数值方式表示的数据的源数据库,如统计数据库、财务数据库等。
(2)文本-数值数据库这是一种能同时提供文本信息和数值数据的源数据库,如企业信息数据库、产品数据库等。
(3)全文数据库这是一种存储文献全文或其中主要部分的源数据库,如法律法规全文库、期刊全文库等。
(4)术语数据库这是一种专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果的源数据库,如名词术语信息库、各种电子化辞书等。
(5)图像数据库这是一种用来存储各种图像或图形信息及有关文字说明资料的源数据库,主要应用于建筑、设计、广告、产品、图片或照片等资料类型的计算机存储与检索。
除上述几种类型的数据库外,还有能同时存储多种不同类型数据的数据库,即混合型数据库。另外,按其载体不同又可分成磁媒体数据库、光盘数据库和多媒体数据库等。

四、通讯网络
由于现代通信技术的发展,公共数据传输技术为信息的传递提供了保障,信息检索逐渐发展成为网络检索,通过数据传输网将各个计算机连接起来。每个计算机成为网络中的一个节点,每个节点可含一个或多个数据库,网络上的每个节点和其终端只要有授权均可对网络中的数据库进行访问,实现资源共享。随着空间技术的发展,信息检索已进入了信息传递-卫星通讯-计算机技术三位一体的新阶段。

❾ 列举你所知道的计算机检索类型,2类4个

布尔逻辑检索、截词检索、限制符检索、位置运算符检索。

布尔逻辑检索也称作布尔逻辑搜索,严格意义上的布尔检索法是指利用布尔逻辑运算符连接各个检索词,然后由计算机进行相应逻辑运算,以找出所需信息的方法。它使用面最广、使用频率最高。布尔逻辑运算符的作用是把检索词连接起来,构成一个逻辑检索式。

截词检索是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。

限制符检索(Range)是通过限制检索范围,达到优化检索结果的方法。限制检索的方式有多种,例如进行字段检索、使用限制符、采用限制检索命令等。

位置运算符检索也叫临近检索。文献记录中词语的相对次序或位置不同,所表达的意思可能不同,而同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样。位置算符检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的临近关系,并且可以不依赖主题词表而直接使用自由词进行检索的技术方法。

❿ 什么是信息检索技术它主要包括哪几种各有何检索特点

信息检索技术信息检索是指从以任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法与过程。它主要包括: 布尔检索,词位检索,截词检索,限制检索。 布尔检索的特点
(1)与人们的思维习惯一致
(2)表达直观清晰、结构化强
(3)方便扩检和缩检
(4)易于计算机实现

阅读全文

与计算机检索技术有哪些相关的资料

热点内容
ug程序怎么传到机床上 浏览:868
泡沫产品怎么做出来的 浏览:567
如何使用高新技术 浏览:553
rs422以什么方式传送数据 浏览:190
高新技术大学都有哪些 浏览:44
如何高效发信息约女生 浏览:422
无醛环保产品有哪些 浏览:749
企业客户信息如何做到保密 浏览:941
哪些国宝不能交易 浏览:734
县级教体局招聘的人事代理是什么 浏览:158
代理为什么找下家 浏览:272
唐代大商人一般用什么货币交易 浏览:950
兰州职业技术学院怎么报考 浏览:607
为什么信息都不见了 浏览:405
做品牌代理需要哪些资料 浏览:808
什么是整理库存数据 浏览:508
心动省级代理怎么弄 浏览:104
已读信息怎么标记 浏览:363
测试你适合什么颜色的口红小程序 浏览:463
安卓如何设置程序使用屏幕的比例 浏览:960