文档介绍:数据处理器和数据处理方法
专利名称::数据处理器和数据处理方法
技术领域:
:本发明涉及用于提取用结构描述语言编写的文档数据的数据处理设备和数据处理方法。
背景技术:
:近年来,随着因特网的广泛使用,使用万维网(WWW)用诸如超文5n,这些内容是结构描述数据,其中用结构描述语言写下预定元素和与该元素关联的文档数据;和内容提供设备102,其从数据库101提取对应于用户需求的内容105a至105n,并将这些内容提供给用户。此外,内容提供系统100在用户侧拥有内容处理设备103,其向内容提供商发送对内容105a至105n的请求,并提取和显示从内容提供商发送来的内容105a至105n中对应于预定元素的文档数据。此外,内容提供设备102和内容处理设备103经网络104连接,并经网络进行信息的发送/接收。此外,在实施例1中,使用位置信息作为要在内容105a至105n中描述的预定元素。接下来,将说明在数据库101中存储的内容。首先,使用图2更具体地说明对内容的定义和描述。,用可扩展标示语言(XML)的文件类型定义(DTD)编写内容描述定义200。如图中标号201所指示,内容描述定义200定义内容105包括元素locationml,并且在元素“locationml”中以任意顺序描述文本数据和0个或更多个作为子元素描述位置信息的元素“location(位置)”202。此外,如标号203所指示,在图中,在元素“location”202中还以任意顺序定义了描述文本数据和0个或多个元素“location”作为子元素。这样,元素“location”202具有以元素“location”204为子元素的结构,这使得能够由元素“location”202指定大范围内的位置信息,而由子元素“location”204指定小范围内的位置信息。此外,如图中标号205所指示,将元素“location”202和204定义为具有属性“type(类型)”206,其显示描述位置信息的方法;“content(内容)”207,其使用属性“type”206的描述方法来描述位置信息的实体;以及属性“range(范围)”208,其显示位置信息的范围。此外,属性“type”206和属性“content”207是必须描述的属性,而属性“range”208则是可忽略的元素。此外,对于属性“type”206,有可能使用point(点)209、polygon(多边形)210、zip(邮政编码)211以及address(地址)212中的任何一种方法来指定位置信息。point209是用以属性“content”207指定的点为中心的属性“range”208所指定的范围,即以属性“content”207指定的点为中心,具有属性“range”208的半径的圆,来描述位置信息的方法。当用point209指定位置信息时,在属性“content”207中描述中心点的纬度和经度,并在属性“range”208中以米为单位来描述半径。顺便说一下,可以通过除用经度和纬度及以米为单位指定的方法之外的任何方法来指定属性“content”207和属性“range”208中所编写的值,只要可以至少指定中心点和半径。此外,polygon210是用以属性“content”207中描述的位置为顶点的多边形来描述位置信息的方法。当用polygon210指定位置信息时,在属性“content”207中描述纬度和经度作为顶点。顺便说一下,可以通过除用经度和纬度来指定的方法之外的任何方法来指定属性“content”207中描述的值,只要其可以至少指定顶点。此外,zip211是在属性“content”207中描述邮政编码来作为位置信息的方法。此外,使用zip211指定位置信息的方法可以在属性“range”208中描述从邮政编码的起点开始直到那一位有效。顺便说一下,本实施例描述在属性“content”207中以连续7位数字作为邮政编码,但是也可能采用在第三和第四位之间插入“-”的模式。此外,address212是在属性“content”207中描述地址作为位置信息的方法。在属性“content”207中,有可能简单地描述一段诸如○○prefecture(辖区)、××city(市)的信息,或通过合并多段信息来描述详细地址,如No.□○△-chome××city○○prefecture,并在其间插入空格。此外,当在属性“content”207中描述了No.□○△-chome××city○○prefecture,并在其间插入空格时,有可能在属性“range”208中指定认为信息中直到哪一部分为有效。例如,如果在属性“content”207中描述了No.□○△-chome××city○○pref