1 / 8
文档名称:

基于微信公众号个性化新闻推送平台设计与实现.doc

格式:doc   大小:17KB   页数:8页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于微信公众号个性化新闻推送平台设计与实现.doc

上传人:好用的文档 2022/6/25 文件大小:17 KB

下载得到文件列表

基于微信公众号个性化新闻推送平台设计与实现.doc

相关文档

文档介绍

文档介绍:基于微信公众号个性化新闻推送平台设计与实现
摘要:本文设计并实现了一个个性化新闻信息浏览与推送功能,利用网络爬虫合法抓取其他网站提供的RSS内容,把聚合的内容重新整理成个性化信息利用微信公众号推送给不同的用户群体。在本文中,主行互动后的48小时内才能调用该接口,只需要用户每两天与公众号进行互动(公众号可发消息提示等诱发性互动)。服务开始执行的时候从文章库中取出当前时间大于或等于更新时间的所有记录,然后调用生成用户推荐文章的算法接口,将得到的文章使用微信客服接口推送给用户,不论成功与否都将推送结果写入日志,然后将表中对应记录的下次推送时间字段的内容修改为用户设置的所有推送时间中的下一次推送时间的时间戳,好方便服务在调用时做时间的判断。
个性化新闻推送中个性化技术研究比较活跃。基于协同过滤算法的文献[11]改进了文本相似性的判断,基于深度学****算法的文献[12]的研究了目前主流的个性化新闻推送,以及还有采用微博数据进行用户建模的能包含更多活跃和丰富的用户特征。本文的个性化特点主要体现在文章的标签和用户标签上。
标签类别由系统初始设定也可后期增加。通过对文本进行分析得到的文章的标签。用户标签表中的权重记录为用户i对该标签i的偏好,由用户对该标签的点击与时间的函数值在p篇文章上的累加和aij=∑aij。用户未阅读该文,则ai=0,否则取某个时间函数,离当前时间越近则该值越大,离现在越远该值越小,体现出用户兴趣随时间推移的关系。在用户关注了多个标签的情况下,该记录对用户的具体****惯有比较稳定的数据。首先计算同当前用户的兴趣权值差距,计算公式如下: d=∑(aij一aij)2((l)
其中i为用来比较的用户,i为标签,k为当前用户。取(1最小的M个邻居,然后在基于系统过滤算法在M个用户中利用皮尔逊相关系数计算用户相似性,求出TOP-N邻居,然后利用这N个邻居,作为参照用户,推荐参照用户阅读最多的文章。
文章表中有记录所有用户的点击数,点击数高的说明该新闻的关注度比较高,也比较容易得到文章对应的标签用户群的关注,其次,文章的时效性也会有很大的影响,新闻的时效性大约是一天内,其他类型的根据RSS源的更新频率,一般取到最近发布的50条记录的时间,这个时间段内取的文章的优先度很高,根据以上几个要点从候选列表中取若十条对应用户未访问文章加入文章表中,并返回这几条筛选排序后的结果,排序中对含图片的文章有更高的优先级,更符合移动端用户阅读****惯,整套算法大部分在SQL语句中完成,减少了程序与数据库的交互可以更大提高程序的运行效率,该接口完成后将在两个业务场景中被调用,其一是自动推送服务中,其二是用户在首页浏览文章时下拉触发刷新推荐文章。标签管理员可以手动在后台的RSS列表配置中进行修改。标签表的权重字段是rss表中对应标签的记录数。
4结论
本文设计并实现了一个基于微信公众号的个性化信息推送系统,利用爬虫爬取广泛的可用的RSS订阅来源,然后利用新闻标签和用户的爱好标签,以及新闻的时效性和热门性,进行个性化推荐。目前这方面的基于微信公众号的信息推送系统较少,本系统可以为许多渴望更多可靠信息来源,没时间进行信息筛选客户提供更高效更低成本的信息来源,并且在用户不需要的情况下不打扰客户,在客户需要时随时激活提供最新的服务