文档介绍:学位论文作者签名:堑鱼鎏签字日期:捌淖石月/签字日期:少/矿学位论文版权使用授权书独创性声明本人声明所呈的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得安徽农业大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。本学位论文作者完全了解安徽农业大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和电子文件,允许论文被查阅和借阅。本人授权安徽农业大学可以将学位论文的全部或部分内容编入有关数据库进行检索,收录到《中国学位论文全文数据库》,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文,向社会公众提供信息服务。C艿难宦畚脑诮饷芎笫用本授权书学位论文作者毕业后去向:指导教师签名:.\’
■
:篺摘要我国是一个农业大始终落后于西方发达国家。在我国加入橹螅┮敌畔⒒ㄉ杞肓丝焖俜⒄菇锥危┮道嗤站如雨后春笋般涌现出来。涉农网站中存有大量的农业数据,并且数据每天仍在以指数级的速度增长。但是这些海量数据只是原始信息,包含大量模糊的,不完整的,带有噪声的信息,并不能作为知识被人们直接利用。农业方面的信息很多,有宏观信息、科技信息、市场信息和科学文化信息等。这些信息在农业领域发挥着重要作用。农业信息按照需求和特点,又可以分为季节性信息、地域性信息、综合性信息、时效性信息、多层次信息及创新性信息等。信息的传递依赖于信息载体,农业信息的载体很多。现阶段,我国的农业信息传播的主要载体,有电视、广播、报刊、图书和互联网等大众传媒。每一种载体都有自己的特点,不同的载体相互补充。与广播,电视,电话等传统的农业信息载体相比较,互联网是正在蓬勃发展的新的信息传播载体。目前,农业网站是农业信息的重要载体,通过农业网站传递着海量的农业信息数据,是其他农业信息载体所不能比的。同时,农业网站是开展农业电子商务的重要手段之一,也是农民及相关从业者交流和学台。在农业网站中存在大量的行情土情、作物信息、经验技术和政策法规等原始信息。通过应用数据挖掘技术来解决“信息爆炸,但知识贫乏’’的问题,提高农业信息的利用率。萃诰蚓褪鞘褂檬萃诰蚣际醵訵网页中的数据进行自动抽取、处理和知识发现的过程,根据挖掘对象的不同,萃诰蚩梢苑治猈内容挖掘、峁雇诰蚝蚖用户访问模式挖掘三类。相对于传统的数据库来说,系氖据不是完全结构化的数据,且不同镜愕男畔⒆橹鞑幌嗤R虼耍嫦騑的数据挖掘技术首先要解决异构数据源问题和半结构化的数据问题。本文把农业网站作为挖掘的数据源,为了更有效地管理和利用通过挖掘得到的农业数据,尝试构建了一种星型结构的农业数据仓库模型,并给出了农业网站数据挖掘的模型系统。农业网站的数据自动抽取技术也是本文研究的难点之一,本文通过分析农业网站趁娴慕峁固氐悖岷螲卣鹘樯芰耸莩槿〉脑恚捎肑下则表达式来设计抽取算法,并对合肥周谷堆批发市场蔬菜价格行情网页的数据进行了抽取实验,实现了对蔬菜价格数据的自动批量抽取,并对抽取到的数据结果,运用时间序列短期预测模型进行了预测分析。关键词:农业信息,数据仓库,数据挖掘,农产品市场行情,数据抽取
,诵..,,甒疭瑃、析...瓵甿畁産甦/瑃瑃,,
,.,琣,琲..:
●
目录选题的背景,研究目的及意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.√⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.谘芯肯肿础主要研究内容和方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..┮敌畔⒌闹饕T靥濉农业信息的概念特点以及功能⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...┮敌畔⒌母拍睢.┮敌畔⒌奶氐恪.┮敌畔⒌墓δ堋农业信息的载体⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.┮敌畔⒃靥宓睦嘈汀农业信息的重要载体一农业网站⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..萃诰虻睦砺邸数据挖掘的理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯....┮敌畔⒃.
┮低臼萃诰虻奈袷笛芯俊耘┎肥谐⌒畔⑽@┮低臼萃诰虻哪P蜕杓啤农业网站数据挖掘的作用⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.┮低臼萃诰虻牧鞒谭治觥.┮低緒页面的结构特征分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯┮凳莶挚獾睦砺勰P图疤逑到峁埂数据仓库的理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.赪的数据仓库系统的