文档介绍:基于Hadoop平台的Web日志业务分析张俊瑞代洋晋中学院信息技术与工程学院北京易汇众盟网络技术有限公司摘要:通过分析网站日志文件,可以清楚地知道一个网站每天的页而访问量、用户访问量、独立IP数、用户通过什么渠道和设备访问网站等,这样企业就可以通过对网站日志文件进行数据分析进而对网站进行多方面的优化建设。利用Hadoop平台存储并计算海量日志文件,利用Hive进行数据仓库建设和数据分析,使得数据更具有说服力,真正实现了让数据驱动业务,进而驱动公司发展。关键词:大数据平台;日志业务分析;数据仓库;作者简介:张俊瑞(1980-),女,山西襄汾人,讲师,硕士研究生,主要研究领域为数据挖掘、智能软件技术。收稿日期:2017-10-30AnalysisofWebLogServiceBasedonHadoopPlatformZhangJunruiDaiYangSchoolofInformationTechnologyandEngineering,JinzhongUniversity;workTechnologyCo.,Ltd.;Abstract:Byanalyzingtheweblogfile,somedataofawebsitedailycouldbeobtained,suchasamountofpagevisit,independentIPnumbers,numberofuservisiting,,,thedatawarehouseconstructionanddataanalysisarecarriedoutbyusingHive,-pany':bigdataplatfonn;logbusinessanalysis;visualizaticm;datawarehouse;Received:2017-10-,使网站日志数据的增长速度及交互功能都发生了很大的变化。利用传统的日志分析工具很难实现PB数量级的网站日志的处理,因此需要优秀、耐用且吋效性强的处理平台和分析工具來进行数据处理和分析,以便更好地完成网站的优化,提高网站访问量,创造更大的商业价值。从互联网发展趋势和行业内成功经验及案例来看,Hadoop+Hive己成为高效处理庞大数量级数据的平台和分析工具。本文通过Hadoop-t-Hive实现Web日志业务分析及其可视化。首先搭建大数据集群平台Hadoop,其次建设数据仓库Hiv巳对网络日志进行分析,最后将一些业务指标通过可视化技术直观展示出来。:处理器釆用Tntel(R)Core(TM)i7-,