摘 要:在分析分布式系统中异构数据特征和功能需求的基础上,总结并提出了一个基于WebService的分布式系统异构数据共享方法,并结合实际应用进行验证,取得了一定的效果。

关键字:异构数据 共享 WebService 录取系统

中图分类号:GTP391.77 文献标识码:A 文章编号:1008-8415[2006] -01-0036-03
一、问题的提出

随着Internet 的飞速发展、计算机应用技术的普及和深入,越来越多的企事业单位建立了基于internet 的应用系统,从而提高各个单位的业务运作效率、节约成本、规范管理,增强其竞争力。然而各个单位内的应用系统在发挥其各自的作用,各子系统的数据是动态的、异构的,多数情况下,这些系统已形成了一个个巨大的信息孤岛。有限的信息共享、缺少数据交换和信息不一致成为整个信息系统的严重缺陷,采用全盘推翻重新开发的方案显然不现实。因此,在不重新设计已有的数据库和应用系统的前提下,建立一个集成数据管理平台是解决信息孤岛最佳选择。集成数据管理平台设计的关键是异构系统与集成系统平台间的异构数据库系统集成。如何实现分布的、多个异构数据库间的共享与集成是数据库研究领域中的重要课题和研究方向之一[1][2]。

以全国统一考试录取为基础的高考制度是中国最重要的招生考试制度,肩负着为高等学校选拔人才的历史重任。一年一度的高校招生是教育界乃至全社会的一件大事。随着信息技术、网络技术的进步,特别是Internet应用的普及,高校招生远程网上录取全面实现,得到了高等学校和社会各界的肯定和认同。然而,我国的高校招生体制是以省级行政区域为单位,配备了适宜本地考生规模的网络及硬件平台,设计了满足地方政策需求的录取方案和软件系统。各省级招办为相对独立的自治系统,各自治系统在体系结构、硬件设备、操作系统、网络协议、数据模型上都不尽相同,体现了较大的地方特色,自治系统除为高校提供招生服务外,还要为社会提供诸如网上报名、本地招生信息查询等有关信息的服务。

近几年随着考生规模的不断增加,高校招生受到各级政府的密切关注和高度重视,要求加强对高考改革的研究,确保人民群众的利益。作为高考录取方式改革的新课题,高校招生综合管理与服务平台的建设被提出,并决定予以实施。通过高校招生综合管理与服务平台,对招生部门的考生信息采集、阅卷、招生计划管理、考生电子档案流转、招生政策等全程情况进行实时监督管理,加大招生过程信息的社会透明度,保证招生工作的公开、公平、公正。

正是在这样的背景下,异构系统集成是实际应用需求的推动,是信息系统综合集成的一个重要方面,它涉及到数据的集成、应用功能的集成、系统平台的集成等方面,其中数据集成共享是企业信息系统综合集成的核心。本文对基于WebService的异构数据共享问题进行了初步研究和实践。

二、相关技术研究

1、WebService

随着Internet的普及和Web Service[3][4]的广泛应用, B/S架构的模式逐渐体现出它的优势。 WebService技术标准中包括:SOAP(Simple Object Access Protocol),用于交换XML编码信息的协议;WSDL接口(WebService Description Language),用来描述网络服务或终端的一种XML语言;UDDI(Universal Description, Discovery Integration),提供了在Web上描述并发现服务的框架。UDDI通过服务注册,以及使用SOAP访问这些注册信息的约定来实现上述目标。

对WebService的认识可以从不同侧面、不同层次来分析。首先,WebService是一个应用程序。它通过Web向外界提供了如何调用自身功能或服务的说明。这可以让任何人从任何地方使用它所提供的这些服务,实现信息资源共享。其二,WebService是透过网络享用远程服务的一种概念。其三,WebService是建立可互操作的分布式应用程序的新平台。WebService的主要目标是实现跨平台的互操作。WebService平台是一套标准,它定义了应用程序如何在Web上实现互操作性。其四,WebService是指一套软件工具以及一种旨在使软件通过互联网发挥类似拼装玩具作用的整体处理方式。其五,WebService是一种旨在把全世界的Internet/Intranet变成一个虚拟计算环境的观念和技术。其六,WebService服务是一个被包装成单一实体,且被发布以供其他程序使用的功能集合,或者说WebService服务是Internet上一系列能够以编程的方式调用的、相关的应用程序功能。WebService的基本理念是:遵从相应的标准,让不同系统跨越平台,彼此兼容,进行无缝通信和数据共享,实现“软件就是服务”的目标。

2、XML

近几年来,XML技术兴起,它可以利用自定标准的数据格式达到跨平台的电子数据交换[5]。它提供了功能强大的新方法来集成各个单位内部或单位之间的新的或者旧的应用程序。有了XML以后,异构系统之间可以很方便的通过XML来当作信息交流的媒介。XML的格式简单移动,文字、数字、日期、图形、物件等都可以加以标注。

随着XML 及其相关技术和应用的发展,XML 不仅成为了应用间交换数据的一种标准,也是万维网重要的信息交换标准和表示的技术之一。事实上,现在业界已存在几个工业标准的草案[6]。XML 的产生给不同的信息格式的统一带来了深刻的影响。它第一次提供了一种信息交换模式,此格式是可编辑,易解析,并且可表示为任何类型的结构或半结构化信息[7] 。

目前,XML已有多方支持,并且XML 的强适应性,使其可以实现对资源的快速包装和集成发布,所以,基于XML 的数据库中间件系统能更好地适应于开放、发展环境(如企业的动态联盟环境) 中的数据集成, XML 是XML 异构集成中间件系统的全局模式,而全局模式是该中间件统一每个数据源数据模式的前提条件。

三、系统设计

1、设计原则

信息系统集成的目的是,将各个单位内各个自治和异构的信息子系统集成起来,实现全局信息资源共享[8]。因此在对那些仍然在稳定运行的应用子系统进行共享集成的过程中,必须遵循以下几个原则:

(1) 安全性和可靠性。在信息共享过程中应充分考虑原应用系统的安全性和可靠性,保证原系统不受任何影响,确保原应用系统的安全运行。

(2) 一致性和扩展性。在信息共享过程中应确保整个信息系统中数据的一致性和完整性。

(3) 实用性和先进性原则。设计的信息共享平台应具有较强的实用性,同时保证在一定时期内的先进性。

2、系统设计过程

(1)系统结构设计

(2)平台实现

要访问的数据库服务是异地的,在数据结构上是异构的,甚至因为某些原因导致数据在语义上也是异构的。数据库服务可能因为某些原因而关掉,并且不同地区之间数据库的互联也不是可信可靠的,所以这些数据并不是随时都没保证访问到的,具有一定的动态性。

平台实现中为了解决数据语义上的异构,设计了虚表,通过这个虚表,把不同数据代码转变成统一的标准代码,从而实现不同数据之间的统一访问。为解决数据出现的临时不能访问,利用系统缓存,存放用户经常性访问的数据内容,定义是重要数据,当提供这些重要数据的数据库服务断开时,系统可以采用这些数据为用户提供临时的查询结果。

系统中的查询引擎,负责为用户提供查询服务,联系各个数据库节点,分解查询任务和结果整合。系统中的数据库服务节点,它是数据库服务的底层封装,将数据转换成统一的格式。

系统的查询流程是:用户通过平台的访问入口进行查询,系统将参数发送到数据库引擎;数据库引擎将查询参数根据虚拟数据库的定义分解成对各个实际物理数据库的访问操作;数据库服务节点接收引擎的命令,访问数据资源,并通过虚表将数据变成标准数据,向引擎发送结果;数据库引擎将得到的结果,再次按照虚拟库的定义,将结果组合成虚拟库的样式,发送给用户。

各个异构数据库资源构成了系统数据层;中间件系统提供数据集成的业务服务,构成系统的业务逻辑层;应用程序则构成系统的表示层或事务应用层(对于四层系统模型来说) 。XML 异构集成中间件主要由包装器(Wrapper) 和仲裁机构(Mediator) 两部分组成,它们完成了本中间件系统的主要功能。包装器负责与异构数据库交互,包装异构数据源,实现操作的一致性、数据访问的透明性和位置透明性;仲裁机构由集成调度单元、服务层和查询处理器三部分组成。集成调度单元根据系统传递的不同消息调用服务层所提供的服务,生成对应的中间件全局数据模式和查询条件(两者是异步的) 。这样查询处理器就根据查询条件通过包装器提取异构数据源的数据,嵌入到相应的全局模式中,将数据结果返回给客户端。

XML 异构集成中间件的核心是数据转换和集成,为了更好地实现数据的集成,系统采用XML 模式作为中间件的全局模式,并分两步完成异构数据模式到全局模式的转换和集成。包装器负责异构数据源数据模式(关系模式) 到XML 模式的初步转换,仲裁机构负责对转换结果进行进一步的模式集成,最终实现到中间件全局模式映射。从客户/ 服务器角度来看,该中间件封装了系统的业务逻辑,构建在数据库服务系统与应用之间,构成客户服务器三层结构。

四、小结

本文积极运用计算机发展的前沿技术来解决国家高校招生录取工作中存在的问题。作者通过设计使用基于WebService的方法来实现异构资源库数据共享和互操作,已经取得了一定的成果,具有很好的社会效益和现实意义。下一步的主要工作是在数据共享的基础上进一步研究异构数据共享中存在的性能和安全问题。