【摘要】文章介绍了南京开放大学资源整合系统的设计目标、整合方案,通过采用基于元数据的方法,构建集成检索及后台资源管理系统以实现对校内、校外相关资源的有效整合。
【关键词】开放教育;网络教学资源整合设计
一、研究背景与设计目标
当前,南京开放大学现有的教学资源存在种类复杂、分布零散、系统平台异构、高质有效资源相对匮乏等问题,另外校内教育资源存放散乱(见图1资源情况统计表),系统之间缺乏关联,形成信息孤岛,导致重复建设,不便于检索使用与统一管理,严重影响资源建设的规划和推广应用见图1。因此应将孤立的、松散的系统(平台)和服务进行集成,以更加方便用户的使用,提高获取资源的效率,简单地说,就是针对多个数据库系统(平台)进行集成检索。本系统设计的目标就是要建立一个整合多平台教学资源的资源仓库,并在此之上开发具有“统一检索界面、能够实现多个异构数据源联合的、开放的、安全权限的、集成管理的”检索系统。要在不同平台上实现集成检索的一种方法是建立一个新的检索平台,把多个检索请求整合到这个统一检索平台内,该平台可将用户的检索请求分发到各个异构的数据库进行处理、合并检索,最终将检索结果反馈给用户。用户可以看到检索结果来源于不同平台,却不需知道不同平台各自所采用的检索方式。对于用户看到的只是一个统一的检索界面,如图2所示。
二、整合方案
资源整合的方案是遵循相关资源组织的规范,采用相应的信息集成技术对异构数据库资源及Web资源进行搜集、甄选、组织和整理,并提供目录浏览、资源检索等服务,以构建前台检索系统和后台资源管理系统。具体方案如下:1.理清整合资源范围。资源范围应是能提供我校开放教育、高职教育、社区教育、素质教育的重要资源,将校内资源(校内异构资源平台资源)和校外资源(Internet…上可获取的相关资源)这两部分相关资源信息进行抽取、转换、处理,并汇集到一个有机整体中。2.以元数据标准描述资源。采用都柏林核心元素集(Dublin…Core…Element…Set,以下简称DC)作为资源描述标准,揭示资源的外部特征、内容特征和关系特征,根据需要并在此基础上加以扩充。采用基于DC的资源描述框架(RDF…Resource…Description…Framework)可对结构化的元数据进行处理,使得异构平台资源数据的转换成为可能,使得不同平台或系统间的信息可以共享和交换,有效提高资源整合的效率。3.按学科分类、主题词表为资源标引。学科分类、主题词表都是从内容角度去标引资源的方法,对资源进行描述,为资源的浏览与检索提供依据。利用学科分类能揭示出资源所涉及的学科领域门类,利用主题词表以保证资源描述的准确性,显示出资源间的相互关系。4.构建资源管理标准及系统。为保证资源整合的有效性,对资源进行管理和控制,需要建立资源的选择与评价标准、资源的组织与描述标准。有了相应的资源管理标准,就要在此基础之上开发资源管理系统,以实现对整合资源的有效管理。5.提供检索功能。在整合后的资源仓库基础之上为不同类型的用户提供统一的查询界面以检索相关资源。
三、系统设计
资源整合构建采用基于联合数据库的方法,这种方法也可以称为基于“核心元数据”的方法。该方法将不同平台数据库内信息资源的元数据记录汇总为一个新的数据库,它是用户检索请求执行的前提,需要提供指向相关资源的访问地址。由于各平台元数据类型各异,构建的元数据库需具有一套统一的标准,作为整合异构平台元数据形式的依据。当不同的信息资源数据库中的信息资源发生改变时,元数据库中的元数据也要作相应的修改,以与保证其信息的同步性。根据各个资源平台资源更新的周期与频率,采用后台定期更新元数据库的模式,而不采用即时更新的模式。资源整合系统的逻辑设计主要由四个层面组成:信息源层、加工处理层、资源集成层和信息查询层,如图3所示。1.信息源层。信息源是整个资源整合系统的资源基础。主要来源于两块:一块来源于存储在本地服务器的自建资源、校内异构平台资源(如南京学习在线、万方视频、NERC南京分中心平台等);另一块来源于因特网公有资源,主要来源于国家开放大学网站、江苏开放大学…、深圳职业技术学院以及各开放大学共享的教学资源。2.加工处理层。加工处理层将不同来源的资源按照事先设计的元数据标准进行抽取、转换、处理,创建资源数据。对于校内资源采用不同的数据抽取技术和转换技术,并按相应元数据进行标准化处理后直接转入资源数据仓库;对于校外因特网资源,首先采用网络“爬虫技术”获取相应资源数据,然后根据相应的资源组织体系进行数据标引,以构建网络资源索引数据库;接着采用自动或人工的方式进行转换和处理,以形成标准的元数据;最后对资源进行相应的筛选、整理、导入资源数据仓库。3.资源集成层。资源集成层主要是将经过加工处理的校内资源和网络资源进行有效整合,汇总到一个统一的资源数据仓库中去,对于资源的增、减、检查以及对资源的统计等功能通过资源管理系统进行管理与控制实现。4.信息查询层。查询层主要作用是为用户提供统一查询检索的界面,是用户查询获取资源的桥梁,是实现资源整合的目标体现。对于资源整合系统的实体设计主要由两个系统和一个数据仓库构成。如下页图4所示。面向终端用户的检索系统是一个统一的资源检索平台,实现对于南京开放大学现有教学资源的一站式检索;面向管理者的资源管理系统实现对资源的导入、管理、转换、统计、分析等功能。数据仓库的相关数据设计是基于DC标准,并参考NERC分中心资源数据库设计。
四、核心元数据设计
核心元数据采用Dublin…Core标准,它是一个可遵循的通用标准,…是一个Web资源体系结构元数据解决方案。因为它的内容较少,使用简单,且具有广泛的支持基础,所以本系统的元数据标准采用基于DC的标准,并对它作了相应的修改和扩展,如表1所示。按元数据的标准,对于异构数据库,找出与元数据表中数据字段的对应关系,将不同平台的资源数据抽取到一个基于元数据标准的数据库中,然后通过对数据进行标准化处理;建立数据与资源的关联,并扩充导入到资源数据仓库中。对于网络资源,首先按资源的名称、资源的作者、资源的主题或内容、资源的URL等信息进行“爬取”,然后将其导入网络资源索引库,经过查重、筛选、加工、标引后导入到资源数据仓库中。
五、总结
本系统所设计所采用的资源整合方式对于南京开放大学目前来说是一个合适和有效的资源整合方式,一方面它对资源数据和信息链接进行了整合,另一方面在资源整合的范围上从学校内部延伸到外部,从本地异构信息源拓展到Web信息源。对异构数据库信息和Web信息的抽取、转换、标准化的处理,为构建更大范围的信息资源数据仓库提供了一个可操作的方案。资源整合系统的构建解决了学校资源建设的信息孤岛问题,使信息的整合从分散到集中,为用户提供了统一检索平台,实现资源一步到位的获取。
【参考文献】
[1]毕强.数字资源建设与管理[M].北京:科学出版社,2010.
[2]沈涌.数字信息资源整合策略与服务共享模式研究[C].吉林大学酒店管理论文,2009.
[3]马文峰,杜小勇,胡宁.基于信息的资源整合[J].情报资料工作,2007(01):46-50,70.
作者:胡荣星 单位:南京开放大学