大数据舆情解决方案

百度云大数据舆情解决方案为政府、广电媒体、輿情服务商、企业提供实时舆情数据订阅,智能语义分析,百度搜索指数及全网用户画像等功能,帮助客户实现个性化深度定制輿情系统,把握时事脉搏。

整体架构

应用场景

政府机关

智慧城市 应急管理
社会管理 信息惠民

大型企业

竞争分析 传播效果评估
口碑监测 危机公关

传媒机构

行业研究 客户洞察
市场研究 影响力分析
舆情相关服务

主要功能

情感分析 观点分析 事件脉络 趋势分析
相关性分析 地域识别 传播路径 舆情预警

独家增值服务

客群洞察 百度指数
搜索风云榜 众包人工标注
自然语言处理

词汇级应用

文本分词 专名识别
词性标注 中文词向量

短文本应用

中文DNN语言模型
文本相似度

篇章级应用

情感观点挖掘
情感倾向分析
数据订阅

新闻 微博 微信 百度贴吧 百度搜索 论坛 博客
覆盖全网超过8000万家网站,支持多种自定义数据源
云基础设施

云服务器BCC

关系型数据库RDS

弹性公网IP

百度Elasticsearch

简单邮件服务SES

简单消息服务SMS

服务功能

舆情数据订阅

全网舆情监控

数据覆盖百度搜索、百度贴吧、微博、微信、新闻、论坛、博客等全网数据,日采集数据达1亿条以上,通过关键词或关键词组进行舆情信息订阅和查询,准确快速。

特定网站监控

客户可按需添加自定义数据源,实现对特定站点的监控,添加后可通过实时舆情API查询相关舆情信息。

增值信息支持

实时舆情数据中包含舆情文本地域信息;支持查询舆情专题内微博传播路径。

舆情文本分析

文本摘要提取

输入需要获取摘要的文本信息,即可通过文本摘要提取API获取文本对应的摘要。支持通过标题及关键词限制摘要范围及内容,帮助客户提取最能代表文本的内容,提升阅读效率。

文本情感分析

可在实时舆情数据中同步查看舆情情感倾向判定结果,也可单独使用情感分析API对文本进行情感倾向判断。助力客户准确识别新闻、评论或其他文本的情感倾向,把握网络舆情、产品口碑的健康度。

文本相似性计算

通过相关分析API,客户可实现任意两个文本间文本相似度计算,并得出文本相关性评分。舆情服务商或企业开发者可利用此API实现舆情相关性排序等,从海量舆情中发现客户最关心的舆情内容,提升舆情管理的效率。

文本聚类分析

通过聚类分析API,实现对一批文本的聚类,供舆情服务商、企业开发者获取舆情类别并查看不同类别下的舆情文本。助力客户在浩瀚的信息洪流中识别舆情类别,提升阅读效率。

文本观点分析

通过观点分析API,对用户观点进行分类,掌握一批用户发言中用户持有的不同观点类别及各自占比,提升用户评论管理效率,更好地把握传播态势及用户声音。

事件脉络分析

事件脉络API帮助舆情服务商、企业开发者梳理舆情传播时间和传播节点,并按新闻发布时间进行排序。帮助客户快速了解事件发展脉络。

自然语言处理

提供多种词汇级、短文本、篇章级自然语言处理API,包含文本分词、专名识别、词性标注、中文Word Embedding、中文DNN语言模型、文本相似度、篇章主观句抽取、文本情感倾向分析等。模型经千亿级中文语料训练,已广泛用于百度新闻、手机百度、度秘等。助力客户减少算法打磨成本,快速实现舆情深度定制化系统。

百度独家服务

群体用户画像(客群洞察)

融合百度已有50多条产品线用户行为数据,基于Cookie、IMEI、IDFA、MAC、关键词、位置等多种用户标识,通过近3000个标签描述用户群体的人口属性、社会属性、兴趣爱好等,帮助企业识别舆情传播者的群体特征,以更有的放矢地进行产品推广、口碑及公关管理。

百度搜索指数

基于关键词搜索热度,深度挖掘舆情信息、市场需求、用户特征等多方面数据特征,整合用户PC和移动端搜索行为,帮助企业更有效地进行营销和舆情管理。

海量人力众包

通过百度众测,招募线上用户完成海量数据的分类及清洗,适用于文本标签标注、质量优劣评估、多媒体内容提取、模型训练人工标注等场景。减少客户对此类事项的成本和人力投入,使客户专注于自身核心业务。

案例优势及特色

独家数据支持

借助百度独有用户群体画像和百度搜索指数数据,进一步识别和分析舆情传播者的群体特征,了解搜索及传播热度,使企业更有的放矢地进行舆情处理。

数据分析准确

借助大数据舆情解决方案提供的多种舆情分析API、自然语言处理API,舆情服务商及企业开发者无需从0开始,可任意借助百度已有能力,专注于自身核心业务能力提升及舆情系统效果提升。

功能组合灵活

将舆情相关的功能和模块分别以API形式对外提供服务,供开发者灵活调用、组合。涵盖数据订阅、自然语言处理、舆情分析等三大模块。助力客户快速实现适应客户需求和应用场景的定制化舆情系统。

海量人力众包

通过百度众测,招募线上用户完成海量数据的分类及清洗,适用于文本标签标注、质量优劣评估、多媒体内容提取、模型训练人工标注等场景。减少客户对此类事项的成本和人力投入,使客户专注于自身核心业务。