1 / 20
文档名称:

政府网站内容格式规范.doc

格式:doc   大小:49KB   页数:20页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

政府网站内容格式规范.doc

上传人:sanshenglu2 2020/7/2 文件大小:49 KB

下载得到文件列表

政府网站内容格式规范.doc

相关文档

文档介绍

文档介绍:GOV/ST2005-、部门两站。中央政府门户网站获取各级政府及部门网站内容的形式主要有网上抓取、信息报送、网站链接和栏目共建等方式。其中网上抓取是中央政府门户网站从各级政府及部门网站获取信息的主要方式之一。网上抓取所面临的问题是,各级政府及部门网站缺乏统一的内容格式规范,不利于采集工具自动抓取和分析信息,部分属性不易准确提取。为了更准确地采集和分析各级政府及部门网站信息,需要规范网站的页面内容格式。各级政府及部门网站按照统一要求经过规范化修改后,中央政府门户网站可以通过采集工具实现准确的网上信息自动抓取。同时,为了构建政府网站服务体系,实现政府网站群的联合检索功能,需要制定各级政府及部门网站检索系统的接口规范。:指各级政府及部门网站上提供的网上办事服务系统、网上申报服务系统、网上数据查询系统等网上应用服务系统。网上采集工具的目标不是把其中的数据内容进行采集,而是从网站群上自动发现这些服务系统,获取入口URL和相关描述信息,从而提供链接服务。联合检索:在中央政府门户网站提供的联合检索功能指,系统能够将检索请求分发给各级政府及部门网站的站内检索系统,并将各网站站内检索系统的结果统一合并处理后返回给查询用户。这样,用户得到的检索结果是各级政府及部门网站检索结果的合集。,制定政府网站的建设规范是关键环节。本规范围绕信息采集和网页分析功能,在保持现有网站建设模式、不增加信息通道的前提下,使符合规范的网站可被中央政府门户网站采集工具程序自动识别,实现网站和网页属性自动标引,最大限度减少人工介入。本规范配合中央政府门户网站采集工具的功能,实现以下目标:(1)收集并验证网站信息;(2)准确收集各级政府及部门网站的政务信息;(3)自动发现并登记网上服务系统;(4)实现政府网站群联合检索;(5)准确分析网页属性信息。为实现上述目标,本规范制定了五方面条款,具体含义和作用说明如下::用于标注网站和栏目的信息,比如名称、行业、地区、栏目名称、分类等。通过对网站信息的标注,不但可以使采集程序获得网站的基本信息,更重要的是,可以把这些信息作为政府网站的检验标志之一,实现政府网站验证校对。:指各级政府及部门网站发布的与政府业务相关的信息,包括但不限于机构信息、法律法规、规范性文件、办事指南等。政务信息是政府网站所发布的主要信息,在中央政府门户网站建设中,需要将各级政府及部门网站所发布的政务信息进行汇总、分类,提供导航、检索等服务。:在中央政府门户网站建设中,需要提供网上服务系统的准确定位地址信息,方便公众通过中央政府门户网站查询并快速到达该服务系统的入口网页。:许多政府网站提供站内内容检索服务。但是网站所采用的检索入口以及结果展示页面各不相同,需要统一检索系统接口,实现政府网站群的联合检索功能。:网页中包含标题、正文、作者、发表日期、正文、来源等信息,但是如果没有格式规范,网页分析程序难以准确提取这些信息。通过制定统一的网页内容格式规范,可以实现网页内容的准确分析和提取。实现规范的基本方法是,在网页HTML中,嵌入特定意义的标识信息,用于标注各项有意义的内容,这些嵌入的标识信息采用HTML的meta置标,在实现属性标注功能的同时,不影响网页的显示效果。,包括国务院各部门网站,副省级以上地方政府网站。中央政府门户网站采集工具将全面支持本规范,实现对符合规范的政府网站的准确数据采集。(Content)和页面展示(Style)两部分,内容部分包括网页的标题、日期、正文、作者等数据元素,它决定了网页所包含的信息;页面展示部分包括每个元素的位置、字体、大小、颜色等,它决定了网页在浏览器中的显示效果。HTML文件能够将内容和页面展示有机地结合为一体。本规范的制定主要从网页内容标注入手,从内容层面对网页进行标注,而忽略页面展示层面。具体方法是,利用HTML文件的特性,在不影响网页展示效果的前提下,加入各类属性置标,规定网站发布内容必须包含的信息。例如,在网页中标注网站信息、栏目信息、标题、日期、作者、来源、服务系统等元数据内容,从根本上保证其它应用对该网页属性的准确识别和提取。,花费了设计和管理维护人员的大量心血。为了尽量减少网站的改动,规范制定过程中充分考虑了各级政府及部门网站的实际特点和改造难度,提供可行的操作规范。