1 / 29
文档名称:

新媒体舆情监控系统方案ppt课件.pptx

格式:pptx   大小:2,759KB   页数:29页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

新媒体舆情监控系统方案ppt课件.pptx

上传人:非学无以广才 2022/5/31 文件大小:2.69 MB

下载得到文件列表

新媒体舆情监控系统方案ppt课件.pptx

相关文档

文档介绍

文档介绍:新媒体舆情监控系统方案
新媒体舆情监控系统方案
第1页
1. 现实状况分析
3. 成功案例
2. 系统功效与架构
目标网站
协同化信息采集
信息采集网络
舆情监控系统
数据清洗整合
数据集运算
文本分类
全文搜索
访问控制
统计报表
舆情监测
应用逻辑
数据清洗整合转换
文本分类和搜索
信息管理和平台管理
层叠式
分类器集群
新媒体舆情监控系统方案
第8页
舆情监控系统特点
新媒体舆情监控系统方案
第9页
微博舆情监控特征
社会化媒体
新浪微博
腾讯微博
搜狐微博
人人网
其它社交网站
社会化媒体特征
快速传输
碎片化
海量数据
去中心化
… …
语义标注
信息采集
语义知识库
内置浏览器引擎以采集动态网页内容,填补普通网络爬虫不足
基于语义标注准确采集,将碎片化信息结构化转换,便于挖掘深层情报
基于云计算框架跨地域协同化网络爬虫,应对海量社会化媒体
新媒体舆情监控系统方案
第10页
技术实现
新媒体舆情监控系统方案
第11页
动态网页数据采集
人在浏览器上看到
网络爬虫看到
HTML不见了
大片JS代码
无法搜索
内嵌浏览器渲染
自动模拟用户点击
所见即所得采集方式
新媒体舆情监控系统方案
第12页
碎片化信息结构化转换
碎片化内容
转发传输关系
影响力
人口地理特征
性别,城市
社交媒体传输角色
新鲜度
实效影响
碎片化内容
丰富语义数据
结构化
数据挖掘
情报
商业竞争
社会舆情
品牌口碑
路径分析,社交图谱
新媒体舆情监控系统方案
第13页
语义标注和结构化转换
内容
内容作者
公布时间
转发数
评论数
原文公布时间
原文转发数
原文评论数
语义标注
FreeFormat
信息采集
语义知识库
第一步:语义标注
第二步:自动算出采集规则
第三步:采集规则公布给协同化爬虫
第四步:采集和结构化转换
后续:入库和文本挖掘
新媒体舆情监控系统方案
第14页
网络爬虫采集云
服务器数据中心
XML/HTTP
Web Service API
北京
上海
深圳
广州
网络爬虫
网络爬虫
网络爬虫
网络爬虫
新媒体舆情监控系统方案
第15页
五大功效特色
新媒体舆情监控系统方案
第16页
数据采集全
搜索引擎聚集了绝大个别网络舆论。借助搜索引擎,咱们实现了更全方面网络舆论监测。
覆盖主流搜索引擎
……
覆盖15万站点舆论起源
新闻
平面媒体
论坛/小区
博客/微博
系统爬虫
自主研发专为舆情系统设计智能网络爬虫系统,能够实现高质量抓取,还支持对新浪微博、腾讯微博、搜狐微博等主要微博平台信息实时抓取。
新媒体舆情监控系统方案
第17页
数据筛选准
新媒体舆情监控系统方案
第18页
数据分析强
舆论信息数量
博客/微博:浏览量、评论量
新闻/平面媒体:转发量
论坛/小区:浏览量、回复量
网络舆论声量分析
关注度:品牌提及信息占行业比率
影响力:提及媒体价值占行业整体价值百分比
美誉度(正负面):品牌正面或主动舆论占本身舆论总量比值
推荐率:媒体、网民在发表针对某品牌舆论时,明确对该品牌进行推荐舆论占本身舆论总量比值
网络舆论度量分析
网络舆论环境分析
载体分布量:新闻、论坛、平媒、博客、微博等载体分布
媒体排行:媒体、网民公布声量、转载等排行
新媒体舆情监控系统方案
第19页
监测纬度广
经过网络爬虫技术、站内搜索、搜索引擎多纬度数据采