1 / 6
文档名称:

亚马逊推荐算法.docx

格式:docx   大小:41KB   页数:6页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

亚马逊推荐算法.docx

上传人:daoqqzhuanyongyou2 2022/6/19 文件大小:41 KB

下载得到文件列表

亚马逊推荐算法.docx

相关文档

文档介绍

文档介绍::从商品到商品的协同过滤
推荐算法以其在电子商务网站的用途而著称,它们利用有关一个顾客的兴趣作为输入,来产生一个推荐商 品的列表。很多应用仅仅使用顾客购买并明确表示代表其兴趣的商品,但它们也可以利用其他属性,包括算法的 目标是,把该用户分配到含有最相似顾客的细分人群里,然后,算法再利用该细分顾客人群的购买和评级, 来生成推荐。典型地说,顾客细分的建立,会采用一种聚类或其他无人管理的学****算法,尽管某些应用也 用了手工决定的人群细分。利用一种相似性度量标准,聚类算法把最相似的顾客,分组聚合起来,形成聚 类或细分人群。由于对大型数据集进行最理想的聚类不切合实际,大多数应用都采用了各种形式的greedy 聚类生成。典型的情况是,这些算法始于各细分人群的一个初始集,每个初始集通常包含一个随机选定的 顾客,然后算法不断重复地把顾客与现有的细分人群进行匹配,一般也会某些规定,以创建新的细分人群 或是合并人群。对于非常大的数据集——尤其是维度很高一一抽样或维度降低也是必要的。
一旦算法生成了细分人群,就计算当前用户与概要描述每一细分人群的向量的相似性,然后选择相似性最 大的细分人群,并因此而对该用户进行分类。某些算法把用户分类进入多个细分人群,并对每组关系的强 度进行描述。较之协同过滤,聚类模型有更好的在线可扩展性和性能,因为它们把当前用户与可控数量的 细分人群进行对比,而不是整个顾客基数。复杂和昂贵的聚类计算会离线运行。然而,推荐品质却是低的。 聚类模型把无数的顾客分组进入细分人群,匹配一个用户与一个细分人群,然后,以相似顾客细分人群里 的所有顾客,来考虑产生推荐的目的。由于聚类模型发现的相似顾客并不是最相似的顾客,因而产生的推 荐较少相关。通过大量精细粒度的细分人群,也可能提高推荐的品质,但那样一来,在线的用户-细分人 群分类,就会变得与利用协同过滤来寻找相似顾客几乎一样昂贵。
基于搜索的方法
基于搜索或内容的方法,将推荐问题视为相关商品的搜索。给定该用户已买过和评级过的商品,算法构造 一个搜索查询,以寻找其他热卖的商品,通过同一作者、艺术家或导演,或利用相似的关键词或主题。例 如,如果一个顾客买了 Godfather (教父)的DVD系列,系统就会推荐其他的犯罪剧,Marlon Brando 出演的其他剧目,或由FrancisFord Coppola导演的其他电影。
如果该用户只有少数购买或评级,基于搜索的推荐算法在计算量和性能上都不错。然而,对于有数千次购 买的用户,要以针对所有商品的查询为基础也不太可行。算法必须使用一个数据的子集或概要,因此降低 了推荐的品质。在所有各种情况下,推荐品质相对较差。推荐通常就是要么太宽泛(比如最热卖的剧集 DVD),要么太狭窄(比如同一个作者的全部图书)。推荐应该要帮助顾客找到和发现新的、相关的、有 趣的商品。同一作者或同一主题领域的热卖商品,没有满足这一目标。
商品到商品的协同过滤
,以及在其大多数的网页上,包括流量极大的网站首页,都把推荐作为 一种定向营销工具。点击"你的推荐”链接,会把顾客引向一个区域,在那里,顾客可以通过产品线和主 题领域,进行推荐的筛选,为被推荐的商品进行评级,为以前的购买进行评级,并查看为什么这些商品被 推荐了(见图1)