第一论文网免费提供高等教育学论文范文,高等教育学论文格式模板下载

论高校灰色文献资源的数字化建设

  • 投稿杜行
  • 更新时间2015-09-23
  • 阅读量953次
  • 评分4
  • 22
  • 0

阎志华

(郑州师范学院图书馆,河南 郑州 450000)

【摘要】作为灰色文献的生产者和需求者。高校产生的灰色文献对其教学、科研和管理等工作都有不可低估的情报意义和信息价值。对高校灰色文献进行数字化建设是必然的选择。本文对于高校灰色文献的数字化建设的基本框架、建设流程、技术支持、标准规范等问题进行了系统论述。

教育期刊网 http://www.jyqkw.com
关键词 高校灰色文献;数据库;数字化建设

作为知识和人才高度密集型单位,高校在完成其所担负的教学和科研两大任务过程中形成了大量的信息资源,如教学计划、教学研究报告、教案、教学课件、科研成果、内部刊物等,其中绝大部分是半公开、非常规的文献形式,这部分信息资料均属于灰色文献的范畴。而随着互联网时代的到来和信息资源数字化的发展,信息资源的共享在更大程度上得到了释放。高校灰色文献作为一种不可替代的信息资源,进行数字化建设是必然的选择。将高校灰色文献信息资源构建一个统一标准和规范的高校灰色文献资源数据库,可以在很大程度上解决目前高校灰色文献普遍存在的沉积和封闭的问题,改变高校灰色文献多、杂、散的现状,使之有序化、系统化、网络化,充分发挥其价值。如何对高校灰色文献资源进行数字化建设,笔者认为可以从以下几方面入手。

1 框架结构

框架结构是高校灰色文献的数字资源建设前期工作的一个很重要的部分,框架结构设计的好坏直接关系到数字资源建设工作是否能够顺利开展。根据高校灰色文献的特点和来源可以将其分为教学资源库、科研资源库和管理资源库等3个子库,然后再在子库的基础上延伸不同的版块(子子库),详细情况如图所示。

2 建设流程

高校灰色文献的数字化资源建设流程主要包括以下几个步骤。

2.1 信息采集

信息采集是指对要进行数字化的灰色资源对象进行评价、分析,并用一定的方式进行信息采集,这不仅包括文本信息采集和图像信息采集,还包括音频信息和视频信息的采集。

2.2 信息加工

信息加工是将采集的数字化资源通过智能软件或人工方式进行内容标引,包括分析内容、主题分类以及对内容全文进行相关记录与主题的动态关联。

2.3 信息资源存储

信息资源存储是根据灰色数字资源的服务范围及其元数据、对象数据的存储方式,实现校园网、局域网以及互联网上的数据共享。

2.4 信息资源发布与服务

信息资源发布是指通过预发布系统将制作完成的灰色数字资源的数据以页面形式发布出来,并进行质量控制,这包括保证数据的质量和完整性、发布模板的合理性,以及对错误数据的修改直至无误。同时还要设计信息发布内容的服务界面,提供相应的查询与使用工具。总之功能强大、简单快捷的检索系统和友好的用户界面,有助于高校灰色文献信息资源得到更好地开发与利用。

3 技术支持

高校灰色文献资源的数字化建设,无论从信息的采集、加工、存储、还是信息的检索与发布都需要一定的技术支持。主要包括以下几方面:

3.1 信息采集技术

高校灰色文献资源的数字化采集包括:文本信息的采集,图像信息的采集以及存储在光盘和录像带等介质上的图像资料的采集。其实现主要通过扫描、光学字符识别及视音频捕捉等技术。

3.2 信息加工技术

高校灰色文献资源的加工一般要用到自动标引技术、人工标引技术和元数据技术。

(1)自动标引和人工标引技术。这是高校灰色信息资源加工中的一个重要的环节,标引工作质量的好坏影响高校灰色信息资源的最终使用效果。人工标引是指直接由标引人员对信息记录进行分类标引或主题标引并赋予其特定检索标识的工作。自动标引技术是指以主题词表和分类表为基础,为标引人员自动生成主题标引和分类标引,还可以通过它对人工标引进行校对。

(2)元数据技术。在高校灰色文献资源数字化建设的信息加工过程中,也要用到元数据技术。元数据在数据库中的功能是通过描述和定位信息资源(包括文献全文数据、图像、音频和视频资源等),从而使分散的异构网用户分享和利用不同类型的高校灰色文献资源数据。

3.3 信息存储技术

数字化的高校灰色文献信息资源的存储技术主要有以下几种:

(1)直接连接存储(Direct Attached Storage,简称DAS)。这是目前在校园网或办公室环境中最常见的一种存储技术,是存储器通过一个通用的服务器连接在网络上,在存储器与服务器之间通过传统的I/O总线进行通信。

(2)网络连接存储(Network Attached Storage,简称NAS)。这是一种采用直接与网络相连的特殊设备来实现数据的存储。由于这些设备都分配有自己的 IP 地址,所以客户机可以通过充当数据网关的服务器对其进行存取访问,甚至于在某些情况下,不需要任何中间介质,客户机也可以直接访问这些设备

(3)存储区域网络(Storage Area Network,简称SAN)。是通过专用的高速网络将一个或多个存储设备和服务器连接起来的专用存储系统。它提供在这些设备之间从端到端的通信,并允许多台服务器独立地访问同一个存储设备。其存储资源的可扩展性和可靠性更高。

3.4 信息检索技术

信息检索是从按一定方式组织的信息存储中将满足用户需求的信息提取出来并提供给用户使用的过程。目前适用于高校灰色数字资源检索的主要有以下几种信息检索技术:

(1)全文检索技术,这是指以文本数据为主要处理对象来实现内容信息存储与检索的技术。它以完整原始文本信息作为检索的对象,利用计算机来抽取标识符号并建立索引,使用户使用自然语言通过布尔逻辑检索及详细的文内检索,从全文的任意字、词、句、节、章、篇进行检索,从而直接获取原文中的有关篇章。

(2)多媒体信息检索技术。多媒体信息检索技术是基于内容特征对媒体对象的内容语义、特征以及上下文环境所进行的检索。它可以根据用户的要求,对文本、声音、图形、图像、动画、视频等多媒体信息进行检索。

(3)智能检索技术。智能检索技术就是采用人工智能进行信息检索的技术。它可以模拟人脑的思维方式,通过分析用户的检索请求,自动形成检索的策略,并进行智能、快速和高效的信息检索。智能检索技术主要体现在语义理解、知识检索和知识管理等方面。它通过语义分析模块进行自动智能分词,把用户请求和知识库“数据”的语义进行匹配,最后把知识库中匹配的信息通过筛选和整序再提供给用户。

4 标准化和规范化

标准化和规范化是高校灰色文献资源数字化建设的生命,是实现高校灰色文献数字资源共享的前提,是高校灰色文献数字资源长期保存和使用的基本保证,在高校灰色文献数字资源建设中扮演着非常重要的作用。因此,高校灰色文献资源数字化建设必须尽可能采用国际、国内通用的数据著录标准、数据格式标准、数据标引标准、规范控制标准及协议进行系统化、逻辑化组织。

教育期刊网 http://www.jyqkw.com
参考文献

[1]廖爽.谈高校图书馆对灰色文献的开发和利用[J].中国西部科技,2006.

[2]周德明.网上著作权保护与数字图书馆建设[J].大学图书馆学报,2000.

[3]刘炜,等.数字图书馆引论[M].上海:上海科学技术文献出版社,2000.

[4]丘东江.国际图书馆协会联合会第届大会论文选译[M].北京:书目文献出版社,1992.

[责任编辑:杨玉洁]