文档介绍:地理信息系统的核动力——地址匹配
一、地址匹配技术
地理信息系统技术的应用已经从专业领域走到人们生产工作的的方方面面,从城市的规划管理,到投递员最经济的投递线路,凡是与地理位置相关的信息,都可以利用地理信息系统技术来管理。没有地图,就无从谈及地理信息系统。由此,引申了这样一个问题——这些地图从哪里来?
我们通常说的地图,是由国家专业的职能部门来完成各种比例尺地图的生产和制作,这些地图表现了基本的地理面貌——山川河流的分布,城市道路、街区分布等等。但是,仅仅是这样地图信息是远远不能适应我们的需求,很多人文、经济信息都与地理位置相关,而这些信息是无法在基础地图中得到的。这些信息的原始载体都是地址——学校、医院、各类工商企业、居住地址等等,这些地址信息都在相关的专业部门管理,但这些载有地理位置的地址仅仅是文字描述,并没有转化成地理空间位置,这些信息的空间地理位置图该怎样得到?
传统的方法,我们称之为“扫街”,就是通过人工的方法,到实地去采集地址的坐标(如利用手持GPS定位仪等等),然后再将这些采集的坐标点制作成图。扫街的方法有很多弊端,最明显的就是生产周期长,人力资源成本高。而且,对于每个单位来说,扫街采集地址位置还存在实施的难度,对于大数据量的点位分布图,几乎无法满足实际应用的需要
地址匹配技术就是用来解决这个问题的。地址匹配是将文字性的描述地址与其空间的地理位置坐标建立起对应关系的过程。地址匹配服务按照特定的步骤为地址查找匹配对象。首先要将地址标准化;然后服务器搜索地址匹配参考数据,查找潜在的位置;根据与地址的接近程度为每个候选位置指定分值,最后用分值最高的来匹配这个地址。
很显然,地址匹配最重要的是将地址标准化,建立地址编码数据库。
虽然国外有不少商业化的地址匹配引擎服务,但这些技术都是建立在国外地址模型基础上,完全不适合使用象形文字中国。因为地址匹配服务必须本地化,必须建立不同地区的地址编码数据库。
二、北京市地址编码数据库简介
作为古都,北京历史源远流长,文化遗产丰厚,地名地址信息丰富;而今,北京又以前所未有的速度向国际大都市迈进,旧城改造,新城扩建方兴未艾,城市格局日新月异。北京城市的地址名称也承载了历史沿革变迁,历史和现实原因造成了北京地名地址,体系异常复杂、混乱和缺乏统一标准的现状。
北京市信息资源管理中在北京市政府、市信息办等上级单位的协调下,建立地址数据采集体系。该体系的建立得到了市公安局、市民政局和市规划委、市邮政局等相关部门的协助及合作,并通过专业的监理单位,对数据采集流程进行监控,保证了地址数据的空间精度和地址名称的准确。与此同时在与各个业务部门合作的基础上建立数据更新体制,保障地址数据的维护更新。
1、地理编码能做什么
北京市地理编码数据库主要纪录了北京市各类地址的标准名称、空间坐标和唯一编码。地址的标准名称通常出现在工商、税务、信用、规划、建设等经济社会部门的资料和信息系统中,也是公众日常进行位置指定的表达手段。据统计,经济社会信息中的80%的资料都与空间地理信息有关,其主要联系方式就是通过地址名称等信息进行联系。
北京市信息资源管理中心建设的“北京市地理编码数据库”采集整理了北京市地址的标准名称,借助专业软件录入标准地址对应的空间坐标并对标准地址赋予唯一编码。通过标准地址和对应的空间坐标,将带