① 数据加工处理的方法有哪些
数据处理,是对数据的采集、存储、检索、加工、变换和传输。根据处理设备的结构方式、工作方式,以及数据的时间空间分布方式的不同,数据处理有不同的方式。不同的处理方式要求不同的硬件和软件支持。每种处理方式都有自己的特点,应当根据应用问题的实际环境选择合适的处理方式。根据处理设备的结构方式、工作方式,以及数据的时间空间分布方式的不同,数据处理有不同的方式。不同的处理方式要求不同的硬件和软件支持。每种处理方式都有自己的特点,应当根据应用问题的实际环境选择合适的处理方式。数据处理主要有四种分类方式①根据处理设备的结构方式区分,有联机处理方式和脱机处理方式。②根据数据处理时间的分配方式区分,有批处理方式、分时处理方式和实时处理方式。③根据数据处理空间的分布方式区分,有集中式处理方式和分布处理方式。④根据计算机中央处理器的工作方式区分,有单道作业处理方式、多道作业处理方式和交互式处理方式。
数据处理对数据(包括数值的和非数值的)进行分析和加工的技术过程。包括对各种原始数据的分析、整理、计算、编辑等的加工和处理。比数据分析含义广。随着计算机的日益普及,在计算机应用领域中,数值计算所占比重很小,通过计算机数据处理进行信息管理已成为主要的应用。如侧绘制图管理、仓库管理、财会管理、交通运输管理,技术情报管理、办公室自动化等。在地理数据方面既有大量自然环境数据(土地、水、气候、生物等各类资源数据),也有大量社会经济数据(人口、交通、工农业等),常要求进行综合性数据处理。故需建立地理数据库,系统地整理和存储地理数据减少冗余,发展数据处理软件,充分利用数据库技术进行数据管理和处理。
② 信息加工
3.4.1信息加工的含义
所谓信息加工是指把搜集来的大量的原始信息,按照不同的目的和要求进行筛选和判断、分类和排序、着录和标引、编目和组织、存储和分析,而使之成为具有一定使用价值的信息的过程。
一般而言,搜集来的原始信息是一种初始的、零乱的、孤立的信息。只有把这种零次信息进行分类、排序,使之成为规则的、有序的、系统的高次信息,才能使用;只有通过着录和标引,使零次信息变成二次信息,才能便于信息的存储、检索和传递。因此,信息加工的过程就是在原始信息的基础上,生产出价值含量高、方便用户利用的新信息,使信息增值的过程。
按不同的标准,信息加工可分成不同的方式。
按加工处理响应时间的不同,可把加工分为实时处理加工和批处理加工。实时处理加工是指将送过来的数据立即进行处理,即时做出响应,一般适合常规的作业业务;批处理是指把送过来的数据存起来,达到一定的数量或时间后,再集中处理,一般适合统计分析业务。
按处理功能的深浅可把加工分为预处理加工、业务处理加工和决策处理加工。预处理加工是对信息简单整理;业务处理加工是对信息进行分析,综合出辅助决策的信息;决策处理加工是对信息进行统计推断,产生的是决策信息。
按加工的工具不同,可分为手工加工和计算机加工。手工加工是利用手工设备对信息进行处理,主要存在于信息加工的初期阶段。计算机加工是利用计算机进行数据处理,对原始数据进行加工处理,产生表格、图形等结果。
3.4.2信息筛选
信息筛选是信息加工的第一个环节,其目的是去伪存真、去粗取精,保证信息的准确性和有效性。
3.4.2.1信息筛选的程序
信息筛选的基本程序主要包括以下几个方面:
(1)信息整理。信息整理是信息筛选判别的前提,其目的是使零散的、杂乱无章的信息标准化、条理化,便于下一步的处理和分析。
(2)浏览审阅。浏览审阅是信息筛选判别的中心环节。其目的是清除那些明显错误或无用的信息,保留那些明显真实或有用的信息。对于一些一时无法确定去留的信息资料则放置一旁,留待进一步处理。
(3)再次审核。对于无法确定的信息,要采取会诊或其他科学的方法,对其再次进行分析研究,以便科学地确定其取舍,提高信息筛选和判别的准确性。
3.4.2.2信息筛选的重点对象
(1)虚构信息。这类信息完全是虚构的、杜撰的,没有一点事实根据,其主要源自信息搜集者的不良动机,对这类信息一定要清除。
(2)添加信息。这类信息虽有一定的根据,但其中某些情节和内容是信息搜集者、传递者通过主观想象而不是根据事实依据添加进去的,需要对其进行分析区别。
(3)夸张信息。这类信息往往把事实夸大或缩小,是对事实的一种扭曲,会严重影响信息的真实度和可信度。
(4)偏颇信息。这类信息是片面地强调某一起作用的原因或扼杀某一起作用的要素。这类信息如果不加以校验、纠偏,会影响到信息的使用价值,甚至会给信息使用者造成重大损失。
(5)残缺信息。由于时间久远、信息获取途径不正确,或者由于信息源本身无法接近,而仅仅通过个别现象或特征得到的信息就是残缺的信息。这类信息一般需要进一步补充收集。
(6)模糊信息。这类信息是由信息搜集者道听途说、捕风捉影而来,往往带有“据说”、“听说”、“大概”、“也许”、“有迹象表明”等字样。这类信息可信度差,必须重新搜集验证。
(7)拼凑信息。这类信息往往把不同地点、不同时间、不同条件、不同性质的信息在搜集、加工、传递的过程中,人为地组合成同一地点、同一时间、同一条件、同一性质的同一信息,这种东拼西凑、张冠李戴的信息,从整体上看仍然是没有事实依据的。
3.4.2.3信息筛选的方法
(1)感官判断法。感官判断法是指信息加工人员在浏览审阅原始信息过程中依靠自己的学识、技能和经验,凭直觉判断信息的真伪以及可信度大小的方法。
(2)对比分析法。对比分析法是指信息加工人员在筛选和判别信息过程中,通过对前后信息、左右信息、不同渠道搜集的同一信息进行对比分析,以确定信息的真伪和可信度的方法。
(3)专家判断法。专家判断法是指对一些一时无法取舍的信息交由专家裁决,确定其价值的方法。
(4)集体讨论法。集体讨论法是指通过集体的智慧对一些个人无法下结论的信息采用集体会诊的方法以确定其取舍。
(5)现场核实法。现场核实法是指对有疑虑的信息,责成信息搜集人员或信息加工人员深入现场核实真伪的方法。
(6)数学核算法。数学核算法是指当对原始信息有疑虑时,由信息加工人员重新予以核算的加工方法。这种方法可以及时纠正那些因信息搜集计算错误、笔误或传递过程中失误造成的信息失真现象。
3.4.3信息分类
信息筛选是对信息的粗加工,信息分类就是对信息的细加工。只有对信息进行分类和排序,才能更好地对信息进行存储、检索、传递和使用。
3.4.3.1信息分类的基本程序
(1)确定分类方法。目前信息分类的方法很多,有地区分类法、内容分类法、主题分类法、时间分类法及综合分类法等。到底采用哪一种分类法,直接决定着信息资料的分拣。因此,确定分类法是信息分拣的基础和前提。
(2)实施信息分拣。这是信息分类的第二个环节,即把信息资料分门别类地放置,以便后一环节工作的开展。
(3)进行信息排序。信息分类以后,同一类目的的信息资料的放置也有前后顺序的安排问题。通过信息的排序就能使信息成为井然有序的信息体系。
3.4.3.2信息分类的具体方法
(1)地区分类法。地区分类法是指根据地区的不同而进行的信息划分方法。
(2)时间分类法。时间分类法是指依据时间顺序划分信息的方法。时间分类法也可以按年、月、日分层次进行划分。
(3)内容分类法。内容分类法是指依据信息所包含的内容不同进行分类的方法。例如,根据行业,信息可细分为农业信息、工业信息、商业信息、服务业信息、旅游信息、企业信息、基本建设信息、财政信息、金融信息等。
(4)综合分类法。综合分类法是以时间、地区、内容为依据综合划分信息的方法。按不同的组合,综合分类法又可分为时间地区分类法、地区时间分类法、内容地区分类法、内容时间地区分类法、地区时间内容分类法、地区内容时间分类法、时间地区内容分类法和时间内容地区分类法等。
3.4.4信息着录
信息着录,亦称信息描述,是指根据一定的管理规则和技术标准,对信息的外在特征和部分内容特征进行分析、选择和记录的过程。通过信息着录,形成一条条反映原信息内容特征和外在特征的记录,这种记录就是条目或款目。将一批款目按照一定的次序编排而成的一种文献报道和检索工具就是目录。款目是一种文献的缩影,目录是一批文献的缩影。
3.4.4.1信息着录的标准化
文献着录标准化是指在国家或国际范围内,对文献着录的原则、内容、格式等做出具有一定约束力的规范。为开发和利用文献资源,需要取得共同一致的书目情报语言来统一描述文献特征和报道、检索文献的方法。20世纪60年代,许多国家相继在本国范围内,实现了文献着录标准化。在此基础上,国际图书馆协会联合会(简称国际图联)专门工作小组,于1971年开始进行国际文献着录标准的制订工作,并于1974年正式出版了《国际标准书目着录》(ISBD),得到世界各国的普遍接受。《国际标准书目着录》成功地解决了下列问题:
(1)使各国的文献着录项目及其排列顺序具有互换性,即实现文献着录的国际统一。
(2)克服了语言障碍,使各国文献着录具有易识别性,即使不认识某种文字的读者,也能通过标识符号系统,识别着录项目。
(3)有助于将一般书目转换为机读目录形式。
为了建立和健全我国统一的文献报道体系,开展国际书目信息交流,更好地开发和利用文献信息资源,我国在全国文献工作标准化技术委员会第6分委员会(目录着录分委员会)和中国图书馆学会的共同努力下,1983年7月正式发表了全国文献着录标准系列中的《文献着录总则》(GB3792.1—83)。其后又出版了各个分则,包括《普通图书着录规则》、《连续出版物着录规则》、《地图资料着录规则》、《档案着录规则》、《古籍着录规则》、《检索期刊条目着录规则》、《文后参考文献着录规则》等。
3.4.4.2MARC格式
MARC(Machine Readable Catalogue)是机器可读目录英文缩写,简称机读目录,就是以代码形式和特定结构记录在计算机存储介质上的、用计算机识别和阅读的目录。
1965年,美国国会图书馆开始研制机读目录。1966年生产了MARCⅠ磁带。1969年正式出版了MARCⅡ磁带,其后陆续出版了专着、连续出版物、档案与手稿资料、视觉资料、乐谱和地图等资料类型的MARC数据文件。由于MARCⅡ格式是美国国会图书馆开发的,故称为USMARC(又称为LCMARC)。1977年,国际图联首次出版了《UNIMARC通用机读目录格式》,以后又不断进行了修改。
CNMARC是我国国家书目机构依据 UNIMARC制订的《中国机读目录格式》(China MARC Format),作为中华人民共和国文化行业标准 WH/T0503—96推出,它与ISO2709的规定相一致,以 UNIMARC为依据,凡UNIMARC中定义的字段适合于我国出版物的有关规定都予以保留,并补充了我国出版物特有而 UNIMARC中所没有的字段定义。例如,它增加了如下字段和子字段:091统一书刊号;092订购号;093专利号;094标准号;690中国图书馆分类法;692中国科学院图书分类法;905馆藏信息等。
3.4.4.3DubinCore标准
Dubin Core标准简称 DC。DC元数据格式是在 1995年3月由 OCLC(Online Computer Library Center,Inc.)和NCSA(National Center for Supercomputing Application)联合召开的第一次专题研讨会(即DCLC/NCSA Metadata Workshop)上产生的,目的是寻求一套简洁有弹性,且非专业图书馆人员也可轻易掌握和使用的信息资源着录格式,以提高网络信息资源的开发利用率。操作对象局限于网络上的电子文本资源。会议结果产生了13个元数据项,并以开会的地点都柏林(Dubin)命名。在1996年9月第三次研讨会上,DC元数据将处理对象进一步扩充到图像资源。为了能对图像资源进行充分的着录,新增了两个着录项——描述项(Description)和权限管理项(Rights Management),同时修改了部分着录项名称,共产生了15个着录项。1997年10月,在芬兰赫尔辛基举行的第五次系列研讨会上,进一步明确了DC元数据格式的主要功能侧重于信息资源的着录或描述,而不是信息资源的评价,所以又将15个元数据项分为如下三类:
(1)资源内容描述类元数据项。该类中有下列元数据项:
题名项(Title):由资源创建者或出版者给定的资源名称。
创建者项(Creator):资源的创建者。
主题词项(Subject):能够揭示资源对象主题内容或学科内容的关键词。
描述项(Description):资源内容的文本描述,包括文献类对象的文摘或视觉作品的内容描述等。
语言项(Language):资源对象所用的语言类型。
来源项(Source):二次资源的出处信息。一般的元素只包含当前资源的信息,如果对于揭示当前资源是必要的话,该项可包含二次资源的日期、创建者、形式、标识或其他元数据。
关联项(Relation):二次资源及其与当前资源关系的标识。该元素允许在相关资源和资源描述间建立关联。例如,编目自(Is version of)、翻译自(Is based on)、节选自(Is part of)、格式转换自(Is format of)等。
覆盖范围项(Coverage):资源知识内容的时空特征。空间范围是指物理区域,如经纬度、规范的地名等;时间范围是指资源内容(时间段)而非资源产生的时间(时间点);时间描述采用与日期项(Date)相同的格式。
(2)知识产权描述类元数据项。该类中有下列元数据项:
着者项(Creator):对创造资源知识内容承担主要责任的个人或机构。
出版者项(Publisher):负责使资源成为当前形态的责任者,例如出版社、大学的学院或者公司实体等。
合作者项(Contributor):是指没有在 Creator元素中列出的对资源的知识内容具有重要贡献的个人或组织,其贡献次于创建者(如编辑、誊写员、插图作者等)。
权限项(Rights):一个权限管理的陈述,或者是指向一个权限管理陈述的标识,或者是指向提供资源权限管理信息内容的服务的标识。
(3)外部属性描述类元数据项。该类中有下列元数据项:
日期项(Date):是指与创建或使资源成为可利用状态相关的日期。
类型项(Type):资源的类别,例如小说、诗歌、报告、论文、词典等。
识别符(Identifier):唯一标识资源的字符串或数字。例如,网络资源标识中的URL和URN,其他通用唯一性标识,如国际标准书号(ISBN)或其他规范名称皆可作为标识符。
格式项(Format):资源的数据格式,用于注明需要什么软件或硬件来显示和执行这一资源,如文本、JPG图像、应用程序等。
3.4.5信息标引
信息标引也称为信息揭示,是对信息的主要内容和其他形式特征进行选择、概括和提炼的过程。包括对信息形式特征进行选择,对信息的内容特征进行分析,并转换成反映信息内容主题的标识等具体内容。
3.4.5.1信息标引的程序
信息标引的程序一般包括三个环节。
(1)主题分析。即对信息所包含的主题进行分析,主要包括主题数量分析,即该信息包含多少个主题;主题结构分析,即每个主题有多少个主题概念因素;主题内容分析,即具体说明该信息包含了什么主题、各个主题有哪些概念因素。
(2)主题标引。将主题分析结果转换为主题标识。根据对信息主题的揭示程度,主题标引方式可以有四种策略:①整体标引:即对某一信息实体的整体主题用一个标识来进行概括性标引。②全面标引:即对某一信息实体的所有局部主题或不同主题及其主题概念因素分别进行详细标引。③补充标引:即除对某一信息实体的整体主题作概括性标引外,还对部分局部主题及其主题概念因素单独进行标引。④重点标引:即对某一信息实体中与信息系统的性质、任务、目的有关的主题部分进行标引。
(3)检验审核,即对上述主题分析和主题标引的过程和结果进行检验和审核,最后正式形成信息揭示的结果。
3.4.5.2 信息标引的方法
根据标引过程中所给出的标识形态和性质的不同,信息标引通常可分为分类标引和主题标引两大类。
(1)分类标引。分类标引是给信息的内容或形式特征给予分类标识的方法。通过分类标引,可以将具有共同学科属性的信息类聚在一起,并依据各类信息之间的学科关系把所有信息组织成一个有层次、有条理的整体。从近现代分类法的编制方式来看,分类的方法主要有等级体系分类法、分面组配分类法和混合式分类法:
1)等级体系分类法。这类分类法是以文献内容的学科性质为对象,按照知识门类的逻辑次序从一般到具体、从简单到复杂,层层划分,所形成的一种等级体系,其主要特点是:按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类检索文献信息的途径。
2)分面组配分类法。这是一种依据分析兼综合的原则编制的分类法类型,其基本思想是:任何复合主题,不管多么复杂,都可以分解为相应的基本概念;同时它们也可以通过相应基本概念的组合加以表达,因此,分类法不必详尽列举所有主题,而只要在类表中按照范畴列出各种基本概念,并分别配以相应号码。
3)混合式分类法。这类分类法是整合上述两种分类法的优点,在详尽列举类表的基础上,广泛采用各种组配方式的方法。如《国际十进分类法》。
上述的等级体系分类法从古代起就广泛应用于图书馆中对文献资料的分类和检索,现在仍然在图书信息界广为使用。其优点是:强调知识的系统化组织,符合人们认识事物的习惯,便于用户按学科系统检索有关文献信息;类目的树形结构适用于文献的排架管理和检索工具的编排组织:通常采用的阿拉伯数字和拉丁字母标识,通用性强,使国际统一分类达到资源共享成为可能。当然,等级体系分类法也有局限性,如受其体系结构的限制,直接的专指性差;不适合多角度标引和检索;类目体系固定,事先列举,不能及时反映新学科、新事物,修订、增补很困难。
(2)主题标引。主题标引是一种以规范化或未经规范的自然语言作为信息主题标识的方法。按照选词原则、组配方式、规范措施和编制方法。主题法可分为标题词法、元词法、关键词法和叙词法。
1)标题词法。标题词法是以标题词(规范的事物名称、名词术语)作为信息主题内容的标识和检索标识的方法。标题词的来源主要是标引对象的名称或标题中通用的定型名词。标题词的汇编称为标题表,标题词法的主要特征是事先编表。标题词以固定的组合方式组织在词表中,检索按既定组配执行。标题词表的功能是对优选出来的标题词从词义、词形、词间关系和用法等方面进行管理和控制。保证一种事物只用一个标题词表达,一个标题词只表达一种事物或含义,避免使用过程中的混乱。标题词法有较好的直接性和专指性,通用性强,比较适用于特性检索,但灵活性较差。
2)元词法。元词法主张用最基本的、不能再分的词汇——单元词作主题词,单元词从信息内容中抽出,再经规范,能表达一个独立的概念。比如,“计算机软件”不是单元词,而“计算机”和“软件”是单元词,在英语中单元词经常是一个单词。元词法的突出特征是:强调词汇的单元化;强调后期组配。元词法虽然提高了主题法的灵活性,但由于它过分强调词汇单元化,词汇处理方法又不甚合理,易发生错误组配,误检率较高,故实用性不是很好。
3)关键词法。关键词法是直接从信息资料的标题、文摘或正文中抽取出能表达主题概念的具有实质意义的信息单元(关键词)作为主题词,然后按字顺序轮排以供信息检索的方法,关键词排序可组成供主题检索的索引系统,比如,《科学引文索引》中的“轮排主题索引”,其关键词就是从文献标题中抽取出来的。关键词法不受词表控制,快捷简便,适于用计算机组织和检索信息。但缺点是由于关键词法的词语不规范,影响了信息的查全率和查准率。
4)叙词法。叙词法是从叙词表中选取叙词,通过概念组配来描述信息资料的主题,使标引和检索达到更高专指度的方法。叙词法的显着特点是:检索时可由多个叙词形成任意合乎逻辑的组配,构成多种检索提问式。叙词法吸收了前述几种类型主题法的长处,具有直观、专指、灵活以及标引准确、查找方便等优点,在文献检索中得到了广泛的应用。目前,国内外大多数检索工具和数据库都采用叙词法,常用的叙词表有《INSPEC叙词表》、《原子能科学技术汉语主题表》、《国防科学技术主题词典》、《地质学汉语主题表》及《汉语主题词表》等。
3.4.6信息存储
信息具有抽象性,它必须寄附在某种载体上才能表现出来。信息寄附在载体上的过程就是信息的存储过程。
3.4.6.1信息存储的意义和作用
信息存储是指将经过加工处理后的信息按照一定的规定记录在相应的信息载体上,并将这些载体按照一定特征和内容性质组织成系统化的检索体系的过程。信息存储的意义和作用有以下几点。
(1)有利于共享。信息存储以后,用户就可以共享信息库,还可以反复使用,这样提高了信息的利用率。
(2)方便检索。将加工处理后的信息存储起来,形成信息库,就为用户检索到所需的信息提供了极大的方便。
(3)有利于集中管理信息,增大信息资源的拥有量和开发高层次的信息资源。
总之,在存储信息时,必须充分考虑到检索的方便性和高效性,做到存放条理化、分类合理化,检索清楚、取用方便。
3.4.6.2信息存储的主要技术
传统的信息存储技术是指纸张印刷存储技术,现代信息存储技术主要包括缩微存储技术、声像存储技术、计算机存储技术以及光盘存储技术。它们具有存储容量大、密度高、成本低、存取方便等优点,所以得到了广泛的应用。
(1)纸张存储技术。纸张存储技术是最常用、使用时间最长的一种存储技术。但它有许多不足,表现为存储信息密度低、体积大、占用空间多,而且纸张易燃烧、受潮霉烂、遭虫蛀、风化等,不易保存。
(2)缩微存储技术。缩微存储技术是指利用摄影机将印刷品上的内容缩微拍摄到胶片上,冲洗成缩微胶片后予以存储。缩微存储技术的主要优点是:①存储密度高,可以节省用纸张存储信息空间的90%。②存储力法简单、成本低、比较经济。③保存期长,通常环境中保存期长达50年,在标准条件下可保存几百年。④缩微品忠实于原件,不易出错,同其他存储方法相比,其误码率为0。⑤采用缩微技术能将非统一规格的原始文件规范化管理。缩微技术还可以与计算机技术、通信技术结合使用,实现自动化检索。其不足之处是:必须借助缩微阅读机或缩微阅读复印机才能阅读,并且不能对照阅读,保存条件非常严格。
(3)声像存储技术。声像存储技术是指将信息通过录音或者录像等方式记录存储的一种信息存储技术,包括录音存储技术、录影存储技术和电影存储技术。
(4)光盘存储技术。光盘存储技术是利用激光和计算机,将各类信息数据化,并将其转化为光信号,记录在光盘上存储信息的新型存储技术。光盘存储技术具有以下特点:①存储密度高,容量大;②价格低廉,便于复制;③坚固耐用,存储寿命较长。光盘密封较好,不宜受尘土、有害气体以及电磁场的影响,而且它利用激光进行非接触式存取,使用寿命达10年以上。其主要缺点是:误码率比较高。
(5)计算机存储技术。计算机存储技术是指利用计算机的内外存储器来存储信息的一种技术,按照在计算机中的作用,可以将计算机的存储器分为内存储器和外存储器。其中,内存储器直接与CPU打交道,其主要特点是速度快、容量小、价格高;外存储器主要是内存储器的后备和补充,被人们广泛使用,其特点是存储量大、成本低、可以永久脱机保存信息。
3.4.7信息分析
信息分析是信息组织过程中必不可少的重要一环,是通过已知信息提示客观事物的运动规律的过程。其主要任务就是信息研究人员借助于一定的方法和手段,使原有信息在更深入、更全面、更综合、更适用的层次上总结为全新的信息内涵,以满足用户解决特定课题的需要。
3.4.7.1信息分析的功能
信息分析对其所研究的对象来说,具有整理、评价、预测和反馈四项基本功能。
(1)整理功能:对信息进行搜集、组织,使之由无序变为有序。
(2)评价功能:对信息价值进行评价,以去粗取精、去伪存真。
(3)预测功能:通过对已知修订稿内容的分析获取未知或未来信息。
(4)反馈功能:根据用户的实际消费效果对预测结论进行审议、评价、修改和补充。
一般来说,这四项基本功能是密切相关的,信息整理和评价是信息分析的两项基本性功能,是为预测和反馈功能的实现做准备;预测和反馈是信息分析的两项特征性功能,是信息整理和评价功能的进一步拓展和延伸。
3.4.7.2信息分析的方法
信息分析方法是进行信息分析的工具,是实现信息分析工作的手段,虽然信息分析的内容千差万别,规模与范围大小各异,但它们的共同目标都是围绕特定的决策问题,通过对问题的发展历史与现状深入分析研究,来揭示其发展规律,预测其发展前途和趋势,这就决定了各种分析方法的共同特点和属性。信息分析方法主要有定性分析法和定量分析法。
(1)定性分析方法。定性分析方法即逻辑学方法,是建立在逻辑推理和辩证分析的技术之上,根据已知的信息,借助于比较、分析与综合、归纳与推理等一系列逻辑学手段来揭示事物的发展规律和因果关系的一种研究方法。定性分析法的优点是推论严密、直感性强。但不足之处主要是:其结论仅仅是一种定性的倾向而无定量的说明,不够具体和精细,不能完全适应技术经济或工程项目、市场预测等需要定量化研究的课题。
(2)定量分析方法。定量分析方法即数学方法,是利用基础数学、数理统计、应用数学及其他一切借助于数学处理和计算的研究方法的总称。这些方法的突出特点是:能对事物给出定量的描述,显示出事物发展的具体程度;运用数学方法研究事物关系时,研究者直接接触的是公式或模型等事物的同态系统,而不是事物本身。但定量分析法也有它的适用条件和局限性:数学计算时所采用的边界条件是人们依据客观事物抽象或假设出来的,这种抽象或假定是否合理,是否符合客观实际,在确定最终结论时要予以审核或验证;数学方法中所用的各种参量数据,有的是来自客观统计,有的则来自主观评估,因此数学方法研究的结果在信息分析研究的结论中只具有相对意义;客观事物往往是多参量的、动态的复杂系统,而客观事物的任何同态系统本质上都是近似的、静态的和简化的系统。
由此可见,逻辑学方法和数学方法各有所长。在信息分析研究中很难截然分开,一般来说,定性分析是定量分析的基础,定量分析旨在为定性分析的结论提供论据,印证定性分析的结果。在具体的信息分析活动中,往往趋向于把两种方法结合在一起使用。