引言
随着计算机技术,特别是Internet的不断发展,实现"信息孤岛"之间的集成与交互成为亟待解决的问题。
在诸多解决方案中,基于多代理(Multi-Agent)的信息集成就是其中的一种。该系统已被认为是建造大型复杂分布式信息处理系统的重要技术和框架。在基于多代理的方法中,资源集成的具体操作步骤是:用户把请求提交给搜索代理,由搜索代理对请求进行适当的转换,发送给代理路由器;代理路由器通过链接,将查询请求发送给数据库代理;数据库代理接受查询请求,并进行具体的数据库操作www.cechina.cn,然后把查询结果返回给请求者;搜索代理对返回的结果进行识别,若存在所需的资源,则激活本地数据库代理,对获得的信息进行记录,由专家系统对所搜集的信息进行进一步的处理。这种方法有一个明显的缺陷,即必须明确数据库的格式,代理才能正常工作。
而XML技术则可以很好的解决这个问题。用XML进行数据集成,只需对所有的异构数据源增加一个以XML为格式的封装体,即在不改变数据源的前提下,用
下面首先概要介绍XML的相关技术,进而给出网络环境下的、基于XML的信息集成方案:包括系统的总体框图、层次结构、工作过程及系统主要组成部分的具体设计。
XML技术 XML基础标准是为XML的进一步实用化制定的标准,它规定了采用XML制定标准时的一些公用特征、方法或规则。XML Schema描述了更加严格定义XML文档的方法,以便可以更自动地处理XML文档。XML Namespace用于保证XML DTD中名字的一致性,以便不同的DTD中的名字在需要时 可以合并到一个文档中。DOM定义了一组与平台和语言无关的接口控制工程网版权所有,以便程序和脚本能够动态访问和修改XML文档内容、结构及样式。 XQuery的目的是为从Web文档中提取数据,提供一种灵活的查询机制。XPath描述如何识别、选择、匹配XML文件中的各个构成元件,包括元素、属性、文字内容等。XPointer和XLink标准,规定了有关定位、链接方面的内容。CSS被用来作为XML文档显示的样式标准等等。 2、XML的主要技术特点 XML是一种元标记语言 XML的核心是数据 3、DTD(Document Type Define,文档类型定义)
1、XML相关标准
XML不仅仅是一种语言,广义的XML是一系列标准的集合。图1说明了XML及其相关标准,在图中,中间一层是XML基础标准,最下层是XML的应用标准。
图1 XML相关标准
XML是一种元标记语言,强调以数据为核心www.cechina.cn,这两大特点在XML的众多技术特点中最为突出,同时也奠定了XML在信息管理中的优势。
与HTML不同,XML不是一种具体的标记语言,它没有固定的标记符号www.cechina.cn,是一种元标记语言,是一种用来定义标记的标记语言,它允许用户自己定义一套适于应用的DTD。
在一个普通的文档里www.cechina.cn,往往混合有文档数据、文档结构、文档样式三个要素。而对于XML文档来说,数据是其核心。将样式与内容分离,是XML的巨大优点。一方面可以使应用程序轻松的从文档中寻找并提取有用的数据信息,而不会迷失在混乱的各类标签中;另一方面,由于内容与样式的独立,也可以为同一内容套用各种样式,使得显示方式更加丰富、快捷。
DTD的作用是定义允许或不允许什么在文档中出现。DTD的结构:一般由元素类型声明、属性表声明、实体声明、记号声明等构成。一个典型的文档类型定义文件会把未来所要创作的XML文档的元素结构、属性类型、实体引用等预先进行规定。用户既可以直接在XML文档中定义DTD,也可以通过URL引用外部的DTD。DTD位XML文档的编写者和处理者提供了共同遵循的原则,使得与文档相关的各种工作有了统一的标准