文档介绍:淘宝网数据分析报告运营数据对比 :如放假、双11活动等 :同类产品上线或者活动 :如广告投放、活动举办 :店铺装修等 :用户注册数据、用户活跃数据、用户消费数据、用户收藏数据、广告监控数据、产品活动数据等 :竞争对手数据、用户群体分布/软宣传效果数据、市场活动效果数据等 ?后台功能开发需求和新增需求?外部咨询或者调查报告的采购?组织执行相关调查统计?提出相关资料或者信息收集的方案?信息分类和分析本科学生综合性实验报告项目组长学号成员专业班级实验项目名称指导教师及职称开课学期XX至XX学年下学期上课时间XX年6月16日 ,没有售货员提供现场咨询服务。但是,网上销售可以利用互联网的优势,为用户提供更优质的服务。由于服务器会记录用户在浏览电子商务网站时的所有行为,因此,企业很容易收集用户的浏览记录、交易信息及偏好数据。在个性化推荐技术的关联规则分析中,最典型的例子是购物篮分析,其目标是发现交易数据库中不同商品之间的联系强度,挖掘用户潜在购买模式,并将这些模式所对应的服务或产品展示给用户,为其提供参考,从而提高用户的满意度及购买率。 ,每条交易记录包括记录号和顾客购买的商品,表1给出了数据集中各属性名及意义,表2为部分交易实例数据示例。表1数据集属性信息表2部分数据实例 、空值和零值等,这种格式不能作为关联规则分析算法的输入,需要对数据进行预处理。本案例的预处理中包括过滤掉原始数据集中的商品数量和单价这两个属性。同时为了保护顾客的隐私,过滤了用户名属性,并且用交易号来唯一表示顾客的每一次交易。处理后的数据集如表3所示。表3部分预处理后的数据在Clementine软件进行关联规则挖掘时,必须把数据格式转换成Clementine软件能处理的格式。通常有两种格式:一种是布尔矩阵形式,即每行表示一条交易记录,列中的T/F值表示该商品是否有在相应的交易记录中出现,T表示有出现,F表示没有出现;一种是事务处理格式,即每行对应一个交易号和一个商品项。表4布尔矩阵格式数据集表5事务处理格式数据集 ,设定最小支持度1%,最小置信度50%,输入为布尔矩阵格式的交易数据,输出商品的关联规则及相应的支持度、置信度和提升度信息。表中显示“高跟鞋”和“洗发水”、“童装”和“玩具”、“文具”经常被一起购买。表6Apriori算法运行结果 。规则1:=>童装规则2:洗发水=>高跟鞋规则3:玩具=>童装规则4:地毯=>家具规则5:=>女装T恤规则6:=>玩具再结合规则和实际经验知识