1 / 7
文档名称:

基于视频的智能推荐算法.doc

格式:doc   大小:27KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于视频的智能推荐算法.doc

上传人:ying_zhiguo01 2019/5/16 文件大小:27 KB

下载得到文件列表

基于视频的智能推荐算法.doc

文档介绍

文档介绍:基于视频的智能推荐算法摘要随着网络视频和数字电视的普及,人们可供选择的视频越来越多,当然如何选择节目也日渐成为人们的一个问题。在这样背景下,智能推荐算法也就应运而生。本文就此问题进行了研究,基于网络爬虫程序获得的网络上10大最主流视频网站的信息,以及网上的测评和用户自己的历史记录,利用了智能推荐算法对用户的喜好进行分析,结合最新的网络视频的综合评价,对所有视频给出最终评分,从而可以给用户推荐出最合适的节目。关键词Web挖掘;智能推荐算法;网络爬虫中图分类号TP393文献标识码A文章编号1674-6708(2011)55-0204-02 0引言互联网的普及带动了信息化数字化的全面发展,从日常生活到科研机构无不与网络息息相关,网络视频,电子商务,在线支付等行为已经渗入了我们的点滴生活之中,给人们生活带来的巨大的便利,但同时一些小烦恼也会随着而来。巨大的经济利益促进了电视广告的发展,但也因此给了网络视频,电视剧的充分的发展空间,可是网络视频没有电视的高清晰度,电视也没有网络视频的不间断和可操控性,从而催生了数字电视的迅速崛起。短短数年的发展,已经使得数字电视非常的普及,带给了人们全新的感受。如今人们头疼的不是某某电视剧怎么还不播放,而是,我今天该看什么呢。笔者也多次被这个问题深深地困扰过,因此针对网络视频播放,提出一套智能推荐算法,通过用户的浏览历史的数据,对用户的性格喜好进行分析,结合十大主流视频网站对如今所有视频电视的打分,对视频进行一个推荐运算,给用户推荐出最合适的视频电视。 1数据来源此次的程序是在将放在数字电视的机顶盒之内,通过获取用户的数据和网络上主流视频的网站的信息,利用智能推荐算法获得最适合用户的节目清单。首先,在每个用户使用这个机顶盒的之前,会有一个十分简单的用户调查,这个是为了初步获得用户的喜好信息。因为在用户在前100次看的电视节目有很大的随机性和偶然性,所以前100次的时候,推荐的电视节目主要是依靠主流视频的排行榜和点击量以及评分总和考量的。同样因为少量数据的不准备性,我们会删除掉一些点击率很低的视频进行排行。其次,当用户使用时间,次数达到一定的标准的时候(100次)以后,我们将在智能推荐的算法里加入用户自己的数据,而起所占的权重随着次数增多而越来越大,其中,我们考虑的参数包括标题,关键字,导演,主要演员,类型,标签以及获得的奖项等等,当然还会记录每个视频观看的时间和距离现在的时间。结合这些用户自己的信息,以及开始第一登录前用户登录的信息,可以分析出最准确的用户喜好类型。最后,还有一栏信息为最近观看,这个信息是和用户最息息相关的一项,它代表着用户最近一段时间的喜好和兴趣,优先考虑接着最近几次的视频继续看(即增大它们的权重值),同时每次播放时,会记录上次的结束点,支持断点续看。 2网络数据的获取随着网络的迅猛发展,数字信息急剧膨胀,网络数据的获取和过滤也自然成为人们日益关心的问题。在这次的课题研究中,我们利用的java提供的htmlparse进行网络信息的获取,同时通过自己对网页的分析,对很多不必要地信息进行过滤,最后将得到的我们需要的数据封装成一个个视频对象存入数据库中,同时也方便我们的读取等操作。在我们选取的主流网站中,网站的编写格式几乎都不相同,用我们的方法无法提供出一种通用的方法获取到所有网站的视频信息,所以我们只能对每个网站