1 / 9
文档名称:

基于层次树模型的Deep+Web数据提取方法.pdf

格式:pdf   页数:9
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于层次树模型的Deep+Web数据提取方法.pdf

上传人:zhuhl0912 2014/4/14 文件大小:0 KB

下载得到文件列表

基于层次树模型的Deep+Web数据提取方法.pdf

文档介绍

文档介绍:万方数据
基于层次树模型的萏崛》椒田建伟李石君网络在成为信息查询和发布平台的同时,<性谕ü丶纸涌诨取菘饽谌荩牵捎贒哂卸嗍粜院蛅—奶氐悖诠丶值姆椒ň哂泄逃械檠图焖鞔戳颂粽剑A私饩稣飧鑫侍猓岢隽艘恢只诓愦问鞯腄莼袢》,莼袢∥侍饩妥;J鞯谋槔侍猓浯危允髦械氖粜耘判颍缩小遍历空间;同时,,在本地模拟数据库和真实菘馍系拇罅渴笛橹っ鳎庵址椒ǹ梢源锏胶芎玫母哺嵌群徒细叩奶崛⌒剩甌缺点,这就为计算机研究与发展—/疶砑こ坦抑氐闶笛槭武汉大学武汉浜捍笱Ъ企牖г何浜甤琖,,琺瑆—甌瓾,—猘甌瑆,猺瓼,.琩.,甌,.,畐.;籱—;猭籱摘要。收稿日期:;修回日期:基金项目:瑚家自然科学基金项目通信作者:
万方数据
的訵数据库建模隐藏数据库;数据提取;多属性值接口;猭元组;互信息按照信息蕴藏的深度,治G惩是由超链接连接起来的静态网页,,并以结果页面的形式返回给访问者,,试吹墓婺J蔷蔡趁资源的蹲笥襕,、高效地利用细咧柿康暮A啃畔ⅲ⒉檠涌诘募伞А约安檠果的抽取疚墓刈⒌氖荄煊蜓究领域的新问题,即如何完全地、无重复地提取菘庵械慕峁故荩南譡岢隽嘶诓询选择的萏崛》椒ǎ梅椒ㄊ紫壤用属性值构造一个有向图,然后遍历该图,,,虽然也可以作为数据提取方法,但它的目标是为了找到更多的新记录,使得结果集中包含很多重复记录,同时不能较完全地覆盖菘猓南譡岢隽艘恢帜芄淮庸丶植询接口中自动爬取数据的莱妗2⑻⒛,最终得到可以高效提取莸哪0澹梅椒勘晔谴规模地表面化菘猓岩酝耆ǖ靥崛∧,本文提出了一种基于层次树的莼袢》椒ǎ梅椒ǹ梢晕拗馗和完整地提取菘庵械氖菁锹迹梅椒ǖ研究意义主要有如下两个方面:第一,衡量数据仓库好坏的一个重要指标就是其数据的覆盖度,为了提高数据仓库的覆盖度,就需要尽可能完全地提取源菘庵械氖荩裕耆ǖ氖萏崛》椒可以用来提高数据仓库的质量;第二,我们提出的方法可作为大规模荼砻婊椒ǖ牟充,,菘獯蠖际怯玫鼻傲餍械墓叵数据库实现的,比如,龋疚奶岬的菘庖仓傅氖枪叵敌蚖数据库,:第鼋锥问窍蚍衿鞣⒊霾檠为查询组织阶段,该阶段涉及到如何组织和选取有效的查询语句。通过查询把数据库中的数据以结果页面形式返回;。