文档介绍:四大经典大数据应用案例解析
是数据挖掘(Data Mining)?简而言之,就是有组织有目的地收集数据,通过分析数据使之成为信息,从而在大量数据中寻找潜在规律以形成规如此或知识的技术。在本文中,我们从数据挖掘的实例出发,并以数据挖掘中比拟经典的分类算法入手,给读者介绍我们怎样利用数据挖掘的技术解决现实中出现的问题。
数据挖掘是如何解决问题的?
本节通过几个数据挖掘实际案例来诠释如何通过数据挖掘解决商业中遇到的问题。下面关于“啤酒和尿不湿〞的故事是数据挖掘中最经典的案例。而Target
公司通过“怀孕指数〞来女顾客是否怀孕的案例也是近来为数据挖掘学者最津津乐道的一个话题。
一、尿不湿和啤酒
很多人会问,终究数据挖掘能够为企业做些?下面我们通过一个在数据挖掘中最经典的案例来解释这个问题——一个关于尿不湿与啤酒的故事。超级商业零售连锁巨无霸沃尔玛公司(Wal Mart)拥有世上最大的数据仓库系统之一。为了能够准确了解顾客在其门店的购置****惯,沃尔玛对其顾客的购物行为进展了购物篮关联规如此分析,从而知道顾客经常一起购置的商品有哪些。在沃尔玛庞大的数据仓库里集合了其所有门店的详细原始交易数据,在原始交易数据的根底上,沃尔玛利用数据挖掘工具对数据进展分析和挖掘。一个令人惊奇和意外的结果出现了:“跟尿不湿一起购置最多的商品竟是啤酒〞!这是数据挖掘技术对历史数据进展分析的结果,反映的是数据的内在规律。那么这个结果符合现实情况?是否是一个有用的知识?是否有利用价值?
为了验证这一结果,沃尔玛派出市场调查人员和分析师对这一结果进展调查分析。经过大量实际调查和分析,他们揭示了一个隐藏在“尿不湿与啤酒〞背后的美国消费者的一种行为模式:
在美国,到超市去买婴儿尿不湿是一些年轻的父亲下班后的日常工作,而他们中有30%~40%的人同时也会为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫不要忘了下班后为小孩买尿不湿,而丈夫们在买尿不湿后又随手带回了他们喜欢的啤酒。另一种情况是丈夫们在买啤酒时突然
记起他们的责任,又去买了尿不湿。既然尿不湿与啤酒一起被购置的机会很多,那么沃尔玛就在他们所有的门店里将尿不湿与啤酒并排摆放在一起,结果是得到了尿不湿与啤酒的销售量双双增长。按常规思维,尿不湿与啤酒风马牛不相与,假如不是借助数据挖掘技术对大量交易数据进展挖掘分析,沃尔玛是不可能发现数据内这一有价值的规律的。
二、Target和怀孕指数
关于数据挖掘的应用,最近还有这样一个案例在数据挖掘和营销挖掘领域广为流传。
美国一名男子闯入他家附近的一家美国零售连锁超市Target店铺(美国第三大零售商塔吉特)进展抗议:“你们竟然给我17岁的女儿发婴儿尿片和童车的优惠券。〞店铺经理立刻向来者承认错误,但是其实该经理并不知道这一行为是总公司运行数据挖掘的结果。如下列图。一个月后,这位父亲来,因为这时他才知道他的女儿确实怀孕了。Target比这位父亲知道他女儿怀孕的时间足足早了一个月。
Target怀孕指数
Target能够通过分析女性客户购置记录,“猜出〞哪些是孕妇。他们从Target的数据仓库中挖掘出25项与怀孕高度相关的商品,制作“怀孕〞指数。比如他们发现女性会在怀孕四个月左右,大量购置无香味乳液。以此为依据推算出预产期后,就抢先一步