产品简介
目录
产品简介
百度内容审核平台是一款针对多媒体内容进行智能审核的服务平台。支持对图像、文本、音频、视频、直播等内容进行安全审核,具有精准的审核模型、丰富的审核维度、灵活的规则配置等特点。通过可视化界面选择审核维度、个性化调整松紧度,实现自动检测涉黄、辱骂、违禁、广告等内容,降低业务违规风险
功能概述
1)图像审核:采用前沿的图像识别、图像检索等算法结合海量的违规图像数据进行训练建模,具备超过80个细分审核维度,全方位过滤敏感图像内容,包括违禁、色情、广告、旗帜标志识别等通用审核能力,以及百度独具特色的审核能力:恶心图识别,图像清晰度识别,图像美观度,公众人物,直播场景,头像审核等
2)文本审核:基于百度领先的NLP技术,结合海量的关键词库,准确识别各种敏感文本及其变体违规内容。提供严格/宽松场景选择:能够区分敏感内容正负向,涉黄及辱骂的轻重度,以精准适配不同业务场景
3)音频审核:语音、语义、声纹多重审核保障。领先的ASR(语音识别)引擎,将音频中的语音转写为文本,利用文本审核模型识别违规内容,并结合音频特征识别技术,准确识别低俗声音(呻吟、娇喘、ASMR)等违规内容。 支持短音频同步审核、音频文件异步审核、音频流审核等多种方案,高效协助企业审核语音聊天、电台,或录音、有声读物、直播等场景产生的音频数据
4)视频审核:基于图像、文本、音频等基础审核能力,结合海量的违规视频数据库, 从图像、OCR文本、音频等多种维度全方位过滤敏感视频内容。支持短视频同步审核、长视频异步审核、视频流审核等多种方案,高效协助企业审核短视频、长视频、直播等场景
5)直播审核:对实时直播流进行同步审核,自动解析直播流链接,对视频流进行抽帧审核,对音频流按照VAD方式进行语音识别及审核,可实时检测直播过程中违规内容
6)智能机审平台:可视化、灵活调配、实时监控。数据统计和分析板块化,展示业务风险趋势,支持多维度数据导出,便于业务分析;零代码、可视化界面操作,无需自建平台,快速接入使用,帮助企业减少开发维护成本;可根据业务场景,灵活选择审核维度、细分标签、以及对应的审核松紧度
7)人机审核平台:面向拥有人工审核团队的服务商或企业内部审核团队的审核员操作平台。审核员可在平台上高效地审核图像、文本、短视频、篇章等各类媒体内容,同时借助人机协同审核流程和易用的操作页面,进一步提升审核效率,降低企业运营成本
功能特性
内容审核API
机审能力 | 功能描述 |
---|---|
图像审核 | 百度违禁图库:基于百度海量历史数据挖掘,提供对封禁图片的识别能力 色情识别:检测图中是否包含各类色情违禁、儿童裸露、女性性感等内容 公众人物识别:检测图中是否包含明星、球星等公众人物的人脸 用户头像审核:对图片中人脸的角度、遮挡、占比、清晰度等进行审核,筛选合适作为头像的照片 图文审核:检测图片的文字是否包含色情、广告等违禁内容 广告检测:检测图片中是否包含水印、二维码、条形码 违禁识别:检测图中是否包含吸烟、饮酒、赌博、吸毒等违禁行为和纹身等违禁品 恶心图像识别:检测图片中是否包含病变组织、流血恐怖等恶心内容 图像质量检测:对图像的清晰度和美观度进行打分 自定义图像黑名单:对用户黑名单中的图片进行拦截 自定义图像白名单:对用户白名单中的图片直接放过 自定义图片审核-EasyDL:支持用户通过EasyDL自助定制图像分类、物体检测模型,满足个性化审核需求 |
文本审核 | 百度违禁词库:包含百度海量历史数据挖掘,提供对封禁词语的识别审核能力 文本色情:对文本中的色情行为描述、色情资源链接、低俗交友、污秽文爱等内容进行识别 恶意推广:对文本中带有售卖意向的软文广告,微信、QQ等个人联系方式等违规内容及变体进行识别 低俗辱骂:对文本中的侮辱谩骂、人身攻击、消极宣泄等内容进行识别 低质灌水:对网络社区常见的乱码、水帖、刷屏等无意义的灌水信息进行识别 隐私信息:对涉及个人身份的隐私信息进行识别,如身份证号、社保卡号、银行卡号等 广告法审核:对广告法中要求的不能出现的违规词进行检测 |
短音频同步审核 | 采用同步方案,接口返回速度快,适合对响应时延要求高的场景。音频审核能力包含娇喘声检测和语音内容审核,语音内容审核是先通过语音识别将语音转换为文字,再过文本审核,审核项目与文本审核一致 |
音频文件异步审核 | 采用异步方案,适合长音频文件批量审核的场景。音频审核能力包含娇喘声检测和语音内容审核,语音内容审核是先通过语音识别将语音转换为文字,再过文本审核,审核项目与文本审核一致 |
短视频审核 | 采用同步方案,接口返回速度快,适合对响应时延要求高的场景,审核项目与图片审核一致 |
长视频审核 | 采用异步方案,适合长视频文件批量审核场景,审核项目与图片审核一致 |
直播审核 | 分为视频流审核及音频流审核,支持直接提交直播流链接,即可完成自动解析,对视频流进行抽帧审核;对音频流按照VAD方式进行语音识别及审核。并支持通过轮询或回调的方式实时获取审核结果 |
智能机审平台
功能项 | 功能描述(查看视频教程) |
---|---|
数据统计 | 一页概览全貌,掌控业务风险趋势:可视化展示各审核接口的调用趋势,及违规内容的分布统计 |
数据查询 | 查看各审核接口调用的数据详情,包括对应的调用时间、审核结论、违规原因等信息。支持导出表格文件,便于业务分析 |
策略配置 | 可视化配置审核策略:灵活选审核维度、细分标签、以及对应的审核松紧度。支持配置多套策略,实时生效,快速应对不同时期、不同业务场景的审核要求 |
自定义数据集 | 支持人脸、图片、水印、文本等自定义数据集,方便管理 |
人机审核平台
功能项 | 功能描述(查看详情) |
---|---|
项目管理 | 快速掌握人工审核项目概况,多维度、可视化统计分析各项指标 |
角色管理 | 可为甲方提供管理员角色,方便快捷管理审核人员及审核流程 |
审核巡检 | 可参考信息区、前序审核结果展示区让审核参考信息一目了然。瀑布流式审核界面及快速预览区方便审核员快速提交 |
产品优势
1)专业可信任
- 基于百度搜索、百科等产品,20余年积累丰富的内容安全运营经验及千万级的违规样本数据,打造丰富全面的违规内容库及深度学习模型,全面覆盖各个行业场景
- 专业内容安全团队,深入解读法律法规,实时接收分析监管要求,敏感内容即入库、即生效
2)稳定可靠
- 服务可用性高达99.9%以上,专业团队7 × 24小时实时提供技术支持
- 多集群部署,支持每秒超万级并发,支持动态扩缩容,全力保障高并发承载
3)性价比高
4)接入灵活
5)可视化策略配置,灵活快速应对内容风险
- 可视化操作平台,业务人员可实时查看审核结果明细和违规原因分布,快速调整审核策略,实现内容风险即审、即见、即改
- 150+项细分审核模型标签并且持续更新,可视化调节各标签松紧度,高效适配多元化、细粒度业务场景的审核需求,让模型效果犹如“量身定制”
- 针对业务中小众细分场景的模型需求,若通用审核模型暂未覆盖,提供接入Easy-DL零门槛开发平台,仅需少量数据简单标注,最快15分钟即可训练对应模型
6)提供全链路人机协同审核方案
- 百度自建大型专业人审基地,审核员工数、专业度、产能均具备优势
- 提供人机协同审核管理平台,数据自动流转,解决机审结果与业务之间最后一公里问题
常用术语
术语 | 解释 | 相关文档 |
---|---|---|
审核策略 | 审核策略是包含了用户审核规则的一条配置集合,包括选择需要的审核维度以及对应的自定义松紧度。一个应用(AppID)下可以包含多条策略以供适配不同的业务场景。 | 以图像审核策略配置为例 |
审核维度 | 以图像审核为例,包含色情、违禁等一级审核维度,以及对应的性玩具、艺术品色情;赌博、吸烟等细分审核维度 | API参考-图像审核-返回说明 |
置信度 | 模型对对送审内容的违规风险打分结果,结果介于数字0-1之间,数值越大意味着风险可能性越高。 | |
自定义松紧度 | 可对各项审核维度的审核严格程度进行自定义调节。点击各审核维度的“”展开按钮,即可以看到调整审核松紧度的滑动条:每个审核标签都有一个滑动条和两个调整审核松紧度的滑块,两个滑块将整个区域分为白色合规区、橙色疑似区、红色违规区,红色区域越大越多的文本会落在这个区域,审核越严格,反之亦然。 | 以文本审核自定义松紧度配置为例 |