1. 高校图书馆网络信息服务体系运行的技术保障
一、信息采集技术
信息采集技术包括对象数据采集和元数据采集。
1)对象数据采集主要包括文本信息采集和图像信息采集,文本信息采集工作主要指将原来纸介质文献进行数字化。这仅仅依靠人工录入、人工校对是远远不够的,要完成大量文本信息的数字化,需要可靠的扫描技术和OCR(Optical Character Recognition,光学字符识别)识别技术。图像信息的采集需要应用扫描技术,重要的现场图像可以应用数码摄像机、数码照相机等工具进行采集,而原来存储在录像带等介质上的图像资料可以通过相应的技术完成数字化。当前文档一般都提供数字化版本,只要按集成化的数字图书馆系统的要求进行加工存储组织即可。
2)元数据就是关于数据的数据。元数据最基本的用途就是管理数据,从而实现查询、阅读、交换和共享。元数据采集技术指从数据库系统、文件系统、HTML文件中采集元数据,从而形成本地元数据库仓储的技术。
二、信息加工技术
信息加工技术包括对象数据加工技术和元数据加工技术。
(1)对象数据加工技术是指采集的为对象数据,则按元数据标准和着录规范进行标引、分类工作。
(2)元数据加工技术采集的为元数据,则按元数据标准和着录规范,对采集数据进行转换和清洗工作,即对元数据进行规范化与标准化,去除不合要求的元数据。
(3)自动标引、人工标引技术主要涉及主题标引和分类标引,是信息资源加工的一个重要环节。自动标引技术以主题词表和分类表为基础,为标引人员自动生成主题词与分类。
三、信息存储技术
目前图书馆的书目信息主要存储在各种不同环境的数据库中,由于异构数据库间并不兼容,往往需要编制一些转换程序,使得信息共享的效率大大降低。同时,为了开发网上对图书馆信息的快速和准确查询服务,现有图书馆的书目信息库已不能满足这一要求,必须增加其他内容的数字化信息。由于目录信息是非结构的信息,也不适宜用现有的数据库来表示。因此,图书馆中部分数字化信息可以使用XML来表达和存储。用户的检索请求通过Web服务器调用程序传送给相应的系统内部服务器,在系统内部,所有的信息处理工作都是围绕着XML文件系统进行的,当然其前提是将数据库中的信息转化成XML文档,将书的目录信息通过相应工具生成XML文档,传送到用户的浏览器中进行显示,或传送到其他的Web服务器实现信息共享。
信息的存储、信息的检索、信息的分析都要利用数据库技术。传统数据库技术经历了网状数据库、层次数据库和关系数据库三个阶段。建立在信息集成基础上的数字图书馆提供的信息资源不仅有普通的可以结构化的电子文本,还有图像、音频、视频、软件等等各种类型的信息,由于这种多媒体信息的存在和网络的发展,推动了数据库技术的发展。面向对象数据库技术、非结构化数据库技术、多媒体数据库技术日臻成熟。这种数据库的记录长度是不定的,可以储存各种类型的信息,因而可以轻松地处理多媒体信息。使得建立在信息集成基础上的数字图书馆系统的功能不仅仅提供一次信息,还提供经过处理的二次信息,还可以对信息资源进行处理并进行信息分析提供决策服务。因此,支持管理决策过程的、面向主题的、集成的、稳定的、随时间而变的数据存储技术也是建设数字图书馆不可缺少的技术之一。
四、信息检索技术
信息检索技术发展非常迅速,尤其是Web化的搜索方式正在成为普遍的检索模式并构成当今信息检索的基本方法,它集超文本技术、网络技术和多媒体技术为一体。万维网的浏览器/服务器模式具有优化的结构和强大的功能,Web化的搜索方式具体表现为各种SearchEngine(搜索引擎)的应用。SearchEngine(搜索引擎)是互联网上具有查询功能的网页的统称,目前已多达数百种,包括WebSearChEngine(万维网搜索引擎)、FTPSearehEngine(文件搜索引擎)、Email/WhitePageSearehEngine(电子函件/白页搜索引擎)、YellwPageSearehEngine(黄页搜索引擎)、UsenetsearehEngine(新闻论坛搜索引擎)、Meta-SearehEngine(元搜索引擎)等类型。万维网是互联网上最先进的网络信息检索系统,也是最受检索者喜爱的信息检索系统之一。
将人工智能领域的Agent技术,运用于互联网网络化智能信息检索中,给出了一种新的互联网智能检索技术。智能软件Agents是能为用户执行特定的任务,具有一定程度的智能以允许自主执行部分任务,并以一种合适的方式与环境相互作用的软件程序。Agent技术具有主动性、智能性、协作性、移动性,通过内在联系,建立模糊关系,学习用户个性化的思维,进行模糊推理,这就能为用户提供高效而完整的信息服务,将Agent技术与模糊信息处理两者结合应用于检索服务中,得到了一个解决信息检索问题更有效的途径。
五、信息服务技术
1)索引技术:一般有内容索引、结构索引和链索引。这些索引在建立时涉及索引的结构、索引的可扩展性和分布特点、索引生成的并行化等技术问题。
2)开放式URL连接系统:因为一个连接系统需要与多个源点数据库互通,所以必需规划连接系统与源点数据库通信的方法,被提议的标准称为开放式的URL,用在URL里传送元数据。和开放式URL有兼容性的连接系统叫做开放式URL连接系统。开放式连接为连接程序提供了一个独立的系统。连接系统从某一个源点收到元数据后,再根据自己数据库里的数据,决定提供给用户的目标数据。
3)数据挖掘技术:网络信息挖掘技术,也可以称为数据库中的知识发现,是从大量数据中抽取出先前未知的、完整的、可信的、新颖的、有效的信息的高级处理过程,它是在已知数据样本的基础上,通过归纳学习、机器学习、统计分析等方法得到数据对象间的内在特性,据此采用信息过滤技术在网络中提取用户感兴趣的信息或者更高层次的知识和规律来做关键的决策。信息挖掘包括数据挖掘((DataMining)和文本挖掘(TextMining)两种,它采用先进的技术来分析信息资源。
4)信息推送技术:信息推送技术是指一种按照用户指定的时间间隔或根据发生的事件把用户选定的数据自动推送给用户的计算机数据发布技术。推送技术的发展方向将是多点播送和多址发送的内容传递。RSS技术是信息推送技术中的一种,RSS是一种 XML(Extensible Markup Language,扩展标记语言)格式,用于为内容整合客户端提供选择性的、汇总过的网页内容,更确切地说,是基于XML,RDF的描述资源集合(特别是网络资源等)的轻便、可扩展的元数据集。RSS作为描述和同步网站内容的格式,是目前使用最广泛的XML应用。
5)多语种技术:可以通过多语言浏览功能,通过机器翻译功能为用户提供多种服务。
6)音频、视频播放技术:利用互联网播放MPEG,MP3,WAVE等高质量的音频文件和AVI等视频文件。
2. 上海数字图书馆的应用技术
上海数字图书馆是采用现代高新技术所支持的系统工程,信息技术的集成在数字图书馆的建设中扮演了非常重要的角色。上海数字图书馆涉及数字化技术﹑超大规模数据库技术﹑网络技术﹑多媒体信息处理技术﹑数据库与分析处理技术﹑信息抽取技术﹑基于内容的检索技术﹑自然语言理解技术。
分布式的图书馆:上海数字图书馆通过宽带高速互连的计算机网络,把大量分布中国的各个数字图书馆信息资源组成联合体,标准加以有效存储、管理并通过易于使用的方式提供给读者,超越空间和时间的约束,使读者在任何时候、任何地方都可以在网上远程跨库获取任何所需的信息资源,达到高度的资源共享。
面向对象的数字化多媒体信息库:上海数字图书馆的存储介质具有文本、声、光、图像、影视等多种媒体,存储的载体也相应的有光盘、录音带以及各种类型的数字化、电子化装置,它通过多媒体、超文本、超媒体等技术,提供智能化的信息检索手段,向读者展示各种生动、具体、形象、逼真的信息。 数字化资源集合:实现异种数据库之间、服务之间、工作站之间的可互操作性;并采用一种联合式或协调性软件,从类型相似的数据对象和服务中,取得一致性和连贯性检索内容。读者只要提供某个检索点,计算机就会按统一的用户界面提供所需的全部资料。
3. 请问要搭建一个数字图书馆需要什么条件啊
建设数字图书馆最基本的条件是学校必须有电脑,或是有电子阅览室、或是学校有自己的网站,有自己的校园网络。如果是客户本地自建的模式,得要有一个性能相对较好的电脑(就是服务器)按安装数字图书馆软件。如果是要按安装升级开发版的话这个叫好的电脑(服务器)内存要至少4G。服务器的硬盘空间要大,因为我们提供的是移动硬盘一个存储载体,最终还得把所有的资源拷贝到服务器上。
4. 数字化图书馆是怎么回事
随着计算机技术、通信技术和网络技术的迅速发展,信息高速公路的建设与利用为大规模的信息系统、图书馆系统的发展提供了环境和条件。目前,网络信息管理技 术、数字化处理技 术和数字式信息资源建设已成为国际竞争的焦点,各国都为此投入了相当的实力进行研究和 开发。“数字图书馆”这一新概念、新模式应运而生,并被视为21世纪信息产业主要的发展方向之一。
“数字图书馆”一词由英文Digital Library翻译而来,是用数字技术处理和存储各种图文并茂文献的图书馆,实质上它是一种多媒体制作的分布式信息系统,把各种不同载体、不同地理位置的 信息资源用数字技术存贮,以跨越区域面向对象的网络查询和传播的一个大型信 息系统。
传统图书馆收集、存储并重新组织信息,使读者能方便地查到他所想要的信息,同时跟踪读者使用情况,以保护信息提供者的权益。从数字图书馆角度来看,就是收 集或创建数字化馆藏,这集成了各种数字化技术,如高分辨率数字扫描和色彩矫正、光学字符识别、信息压缩 、转化等,把各种文献替换成计算机能识别的二进制系列图像,在安全保护、访问许可和记帐服务等完善的权限管理之下,经授权的信息利用因特网的发布技术,实 现全球信息共享。 数字图书馆的结构模式是:在网络环境下,是一个面向对象的、分布式的网络结构模式,它可适应在多种不同的计算机系统运行。一个数字图书馆的构成,主要包含 用户接口、预处理系统,又称调度系统、查询系统和对象库等基本构件。
电子图书馆侧重对收藏特色的概括,收藏品基本为电子读物,阅读手段一般通过电脑等,不一定提供网上信息或上网服务。网上图书馆将一定量的信息在网上组织起 来,供“读者”查 阅和检索,不一定需要对应的图书馆社会实体,它也可以视为数字图书馆的初级形态。“虚 拟图书馆”是网上图书馆的别称,侧重其无实体的特征。
“数字图书馆”概念一经提出,就得到了世界广泛的关注,纷纷组织力量进行探讨、研究和 开发,进行各种模型的试验。随着数字地球概念、技术、应用领域的发展,数字图书馆已成 为数字地球家族的成员,为信息高速公路提供必需的信息资源,是知识经济社会中主要的信 息资源载体。美国国会图书馆是美国最早进行数字图书馆尝试的图书馆之一,其“美国的记 忆”(American Memory )影响深远。“美国的记忆”最早是一个于1990~1995年间实施的试 验性计划,该计划的目标是确定数字式馆藏的读者对象,建立数字图书馆的一整套技术过程 ,讨论有关知识资产的论题,进行分发演示,并最终确定国会图书馆数字化的方针与规范。 该计划的数字馆藏对象主要为美国的历史文献,包括历史照片、手稿、历史档案及其他文献 等。上海图书馆是国内建设数字化图书馆的先行者,目前已积累了相当数量的数字化资源, 古籍光盘已达64张,约4000MB影像数据,主页信息量也逾350MB,书目数据正加紧制作,全国 报刊索引也是全国独一无二的信息源。另外还订购了大量的文摘及全文光盘数据库,其中一些还是网络版。应该说在数字化资源的拥有方面,上海图书馆目前在全国 无出其右者。
5. 信息时代 如何建设数字图书馆
不过,各大中小学校虽然有了一定的硬件设施,但怎样才能有效地收集、管理和利用信息资源,则是教育行业一直面临的难题。图书馆馆藏的大量书籍,报纸,图片,数据等文件,如何快速转化为电子数据并安全地储藏?书籍借阅的有效管理,还有基于网络环境的电子存取如何实现?作为一个信息资源实体,在教育行业内部之间,如何产生最大的附加值?这些问题都会困扰着图书馆的数字化建设。 针对各类学校图书馆数字化建设中所遇到的难题,清华紫光为此提出了数字图书馆的应用解决方案。紫光的方案结合大中小学实际应用的图文管理和发布系统,能够为各大中小学提供完整的信息管理和发布功能。由于学校有相当丰富的教育资源,系统方案的提供很大程度上减轻了教师的体力和脑力上的工作,同时为学生提供自由发挥和自主探索式的学习方式,从而在数字化建设的角度极大的提高了教育效率和学习成果。从具体内容上可以看到,数字化图书馆建设方案不仅可以对电子图书进行管理,而且在对纸质图书管理及基于网络环境下的电子存取和交流进行管理,提高了图书馆的管理效率和服务质量,满足了学校对电子图书和纸质图书进行管理的多种需要。紫光数字图书馆拓扑图系统解决方案 系统结构:系统的硬件设备要求有较高的可用性,高性能数据处理能力和一定的扩展性。系统的组成:方案集成了三大系统功能模块——图文数字化处理模块,纸质图书管理模块和数字化媒介发布管理模块。图文数字化处理模块 图文数字化处理模块实现了图书快速电子化,并装订成极其利于阅读的PDF 格式文件。系统内涉及的关键技术有快速扫描技术、高效压缩技术和分布式协同处理技术等。图文数字化处理系统适用于图书馆、档案馆、金融机构以及其它各种企事业单位。自动实现纸张信息的原版数字化保存。它以高速扫描仪作为信息的入口,自动地将扫描图像进行格式变换、压缩、加密、文件合成、索引和优化,然后存放到指定位置。 通过若干台挂接高速扫描仪的PC机,对拆开的图书实行全天不间断的工业流程式扫描,保证了纸张信息高速数字化,同时,借助于文件自动上传代理程序,将这些由快速扫描仪得到的图像文件上传至文件服务器,进行集中存放和集中管理。