文档介绍:RESEARCH ONWEB DATA EXTRACTION FOR WEB DATA INTEGRATIoN by Ding Yanhui Supervisor:Li Qingzhong Forthedegree of Doctor ofPhilosophy Shandong University,Jinan Shandong, April,2010 L——/ 原创性声明和关于论文使用授权的说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。论文作者签名:勺擞日期: ≥ 关于学位论文使用授权的声明本人完全了解山东大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存论文和汇编本学位论文。(保密论文在解密后应遵守此规定) 论文作者签名<啤导师签名: }、·11 山东大学博士学位论文目录摘要????????????????????????????I ABSTRACT??????????????????????????????????IV 第l章绪论?????????????????????????..1 ??....??????????????????l ?????????????????.2 ?????????????????????3 ??????????????????????3 ??????????????????????5 ??????????????????????6 ??????????????????????8 第2章W曲数据抽取相关研究?????????????????..10 ?????????????????????????..10 ??????????????????lO ????????????.1l ?????????????.12 ?????????????.15 ??????????????????..17 ??????????????????????。.20 ????????????????????????????21 第3章Web实体模式的动态构建方法??????????????..22 ??????????????????????????22 ???????????????????????..23 ???????????????????.24 ?????????????????.25 ??????????????????.25 ??????????????????.???26 ?????????????????????????..26 ???????????????????27 山东大学博士学位论文 ?????????????????????????????????..29 ??????????????????????.29 ?????????????????????.29 ??????????????????.30 ??????????????.30 ?????????????.3l ??????33 ???????????????????????..34 ?????????????????????????????????..35 第4章基于集成学习的Web数据抽取方法????????????..36 ?????????????????????????.36 ???????????????????????..37 ?????????????