1 / 2
文档名称:

一种网页标记语言格式转换方法及系统的制作方法.docx

格式:docx   大小:17KB   页数:2页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

一种网页标记语言格式转换方法及系统的制作方法.docx

上传人:开心果 2022/6/28 文件大小:17 KB

下载得到文件列表

一种网页标记语言格式转换方法及系统的制作方法.docx

相关文档

文档介绍

文档介绍:一种网页标记语言格式转换方法及系统的制作方法
专利名称:一种网页标记语言格式转换方法及系统的制作方法
技术领域:
本发明涉及文本转换的方法及系统,尤其是一种网页标记语言格式转换的方法及系统。
背景技术:
随着移动互联网的发展,企事M树结构,最后再将该 DOM树重新解析拼装成页面。经转换处理后数据格式为手机自带WAP浏览器或第三方XML 解析器可以解析的标记语言。图1为本发明一种网页标记语言格式转换系统的示意图,如图所示,包括手持终端、应用服务器以及分别连接所述手持终端和所述应用服务器的中间件;所述中间件存储有原页面格式标记语言标签和属性到需要转换成的目标页面格式标记语言标签和属性之间的映射规则模板文档,所述中间件根据手持终端提交的请求提取应用服务器的原页面并根据规则模板转换成手持终端可识别的目标页面格式后将目标页面返回所述手持终端。其中,中间件包括请求处理器,内容获取器和响应处理器三个部分。请求处理器主要进行传输协议的解析,对请求报文头,请求数据格式等的编辑处理以及对请求终端的型号、操作系统等参数的识别;内容获取器主要是作为代理将请求处理器处理后的请求发送给实际要访问的应用服务器,并拿到应用服务器给出的响应数据,此处要确保中间件能够访问到应用服务器中间件才能获取到响应数据,从而进行下面的格式转换等操作;响应处理器由模板过滤器,网页矫正器,文本转换器,图片转换器等不同功能的小插件组成,实现将内容获取器得到的HTML格式的页面进行数据过滤、页面排版,页面的自动纠正校错,文本网页及office文档到XHTML-MP、WML或自定义WML格式的转换,图片的缩放,常用格式间(jpg、 png、bmp、gif等)的相互转换等操作,最后响应处理器将转换处理后得到的新格式页面响应给终端浏览器进行显示。中间件先将获取的HTML格式网页经过自定义格式的模板文档,根据模板定义规则对页面中数据进行过滤和页面重排,然后自动进行页面校正,如标签未闭合的自动添加闭合标签,书写错误的标签进行校正或删除等,之后根据XHTML-MP标签规范,对页面进行标签解析,对不支持的标签进行过滤,对支持标签根据标签属性规则生成页面DOM树,最后根据中间件中定义好的映射规则,将原标签映射生成新格式的标签,如HTML中的a标签对应生成WML中的anchor标签,最后由终端WAP浏览器进行转换后页面解析展现。图2为a 标签的转换流程图;图3为对页面中R)rm标签的处理流程图;图4为对Image的处理流程。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
,包括步骤A 定义原页面格式标记语言标签和属性到需要转换成的目标页面格式标记语言标签和属性之间的映射规则;步骤B 根据原页面类型和目标页面类型提取对应规则模板直接对原页面标签和属性进行映射处理,生成需要转换的目标页面。
,其特征在于,所述原页面类型为HTML格式,目标页面类型为WML或XML格式。
,其特征在于,所述步骤A包括定义HTML页面格式标记语言标签和属性到WML或XML页面格式标记预言标签和属性的映射规则模板文档;所述步骤B包括将HT