1 / 7
文档名称:

今日头条核心技术揭秘.doc

格式:doc   大小:232KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

今日头条核心技术揭秘.doc

上传人:梅花书斋 2021/12/5 文件大小:232 KB

下载得到文件列表

今日头条核心技术揭秘.doc

文档介绍

文档介绍:今日头条核心技术“个性推荐算法”揭秘
互联网给顾客带来了大量信息,满足了顾客在信息时代对信息需求,也使得顾客在面对大量信息时无法从中获得对自己真正有用那某些信息,对信息使用效率反而减少了,而普通解决这个问题最常规办法是推荐系统,推荐系统能有效协助顾客迅速发现感兴趣和高质量信息,提高顾客体验,增长顾客使用产品时间,并有效减少顾客浏览到重复或者厌恶信息带来不利影响。普通推荐系统越精准,顾客体验就越好,顾客停留时间也会越长,也越容易留住顾客。
  1月20日,新生代移动互联网公司今日头条在北京国家会议中心举办了“算数·年度数据发布会”,数据发布会主题名为“算数”,事实上指是“算法”与“数据”。
  众所周知,今日头条是个个性化新闻推荐引擎。在今日头条CEO张一鸣看来,算法是《今日头条》这款兴趣推荐搜索引擎应用核心,这也是与老式媒体最本质区别。今日头条之因此可以非常懂顾客,精准推荐出顾客所喜好新闻,完全得益于算法。而正是精准推荐,,每天有超过万顾客在今日头条上阅读自己感兴趣文章。
  那么今日头条是怎么做到为每一种顾客按兴趣精准推荐新闻呢?在发布会上,今日头条技术副总裁杨震原给咱们揭秘了今日头条个性化推荐核心“算法”。
  今日头条个性化推荐算法原理
  如上图,有3篇文章,让3个顾客投票(注:这3个顾客是一类人,有相似属性(喜好和偏好)),那第4个顾客应当被系统推荐文章是那篇呢?第4个顾客与前3个顾客都是一类人,答案显而易见是第一篇文章。
  没错,今日头条个性化推荐算法原理就是基于投票办法,其核心理念就是投票,每个顾客一票,喜欢哪一篇文章就把票投给这篇文章,通过记录,最后得到成果很也许是在这个人群下最佳文章,并把这篇文章推荐给同人群顾客过程就是个性化推荐,事实上个性化推荐并不是机器给顾客推荐,而是顾客之间在互相推荐,看起来似乎很简朴,但事实上这需要基于海量顾客行为数据挖掘与分析。
  今日头条是如何来划分人群和文章
  搞技术朋友都懂得,内容推荐必要基于受众人群,只有在拟定受众人群之后才干拟定推荐内容,有放矢才叫精准推荐。
  上面那个例子只是很小人群,但是现实生活中不会有这样小人群,并且太小人群通过推荐投票方式也很难推荐出很精细内容,只能推荐出某些热门内容,那今日头条是如何来划分人群?
  咱们假定上图这个人群有8万人,只有两类:一类叫喜欢科技人群,一类喜欢娱乐人群,咱们先提成两类,每类有4万人,咱们又找到另一种维度地区:上海和北京,喜欢科技人有上海和北京,喜欢娱乐也有北京和上海,咱们把8万人群提成四组,每组两万,咱们再找年龄,30岁以上和如下,咱们提成8个人群,每个人群1万人,第1个是喜好科技,位置在北京,年龄30岁以上,这有1万人,咱们再如下面喜欢娱乐,地点上海,人群1万。
  依照人群不同维度,咱们可以细分到一种合理力度。特别需要注意是:在细分领域里面投票数既不要太多,但也不要太少,由于太多没有个性化,仅是一种大众关怀话题而已,而投票数太少又没有记录意义,支持度就低了。
  人群特性可以是阅读姓名,年龄,地区,职业等等。同理,文章也是类似,文章有提到哪些名人,文章发布时间,文章所属地区等等,也均有诸多特性,这些都是可以去组合起来。
  今日