车辆检测 识别图像中所有车辆的类型和位置,并对小汽车、卡车、巴士、摩托车、三轮车5类车辆分别计数,同时可定位小汽车、卡车、巴士的车牌位置 车辆检测QPS叠加包火热开售 > 立即使用 技术文档 产品价格 私有化部署 软硬一体 功能演示 应用场景 产品价格 使用方式 相关推荐 功能演示 图片解析中… 检测 或 本地上传 此处仅供功能展示,图片类型支持PNG、JPG、JPEG、BMP,大小不超过2M
通用场景文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、印章、数字、二维码等;可用于纸质文档电子化、办公文档/报表识别、图像内容审核、快递面单识别等场景。
产品功能 对媒体文件的内容质量进行分析,识别画面、音频中的多种类型质量问题。 画面质量检测 画面质量检测 检测视频由于聚焦不当镜头损坏等因素引起的媒体文件画面质量问题,包括抖动、模糊、噪声、滚动条纹、花屏等。 音频质量检测 音频质量检测 检测音频由于录制设备或传输线路损坏等引起的音频质量问题,包括音量过高、音量过低、静音、声音间断等。
产品特性 区别传统内容审核,构建AIGC场景特色安全能力 注入攻击检测 有效识别提示目标劫持注入、提示泄露、越狱攻击等攻击方式。 多轮对话恶意指代检测 有效检测通过多轮对话、主语缺省等方式进行的恶意指代攻击。 常识类问题正确回复 针对社会主义核心价值观、常识类问题,保障生成内容的客观、准确、全面。
支持自定义黑白名单及策略配置,更贴合业务需求 文档内容安全 基于文档解析技术和图像、文本综合审核能力,准确过滤文档中的色情、广告、恶心、违禁、辱骂、灌水等违规内容,支持多种文档格式,支持轮询、推送两种获取结果模式 音频内容安全 语音识别结合文本分析,检测色情、违禁、辱骂、广告等违规内容,同时利用声纹检测进行娇喘声识别,高效过滤不良语音信息 视频内容安全 基于图像、文本、语音技术综合审核能力,准确过滤视频文件
内容压缩 对大多数静态文件进行压缩,有效减少传输内容大小,节省带宽开销。 相关产品 SSL证书服务 对象存储BOS 客户案例 玩家畅享稳定而极速的游戏体验 百度智能云CDN为乐元素定制了全球加速方案,将游戏内容分发到各个CDN节点上,当玩家访问游戏时智能调度用户请求,确保调度到最适合的服务节点。
人体检测与属性识别 检测图像中的所有人体,返回每个人体的位置坐标;识别人体的17类属性信息,包含性别年龄、服饰类别、服饰颜色、戴帽子(可区分安全帽/普通帽)、戴口罩、背包、抽烟、使用手机等 人体检测与属性识别模型升级,识别精度大幅提升,全面支持私有化部署 > 钜惠 完成企业认证,在线API可享最高5 QPS,50000次 免费测试 调用 立即使用 技术文档 产品价格 常见问题 私有化部署方案
白名单,贴合业务需求 应用场景 直播音频 点播音频 语音聊天 在线教育 直播音频 音视频直播场景,对主播讲话、唱歌等语音内容进行审核,精准检测涉黄、辱骂等违规内容,助力平台打造绿色直播环境 接入方式 短音频同步审核 极速检测60秒内的音频文件,实时同步返回审核结果,适用于时效性要求较高的场景 了解详情 音频文件异步审核 批量检测60分钟内的音频文件,异步返回审核结果,适用于大量任务批量检测场景 了解详情
图像主体检测 检测图片中的主体,支持单主体检测、多主体检测。可识别出图片中主体的位置和标签,方便裁剪出对应主体的区域,用于后续图像处理、海量图片分类打标等场景。
结合大语言模型,可应用于看图问答、视觉推理等场景 物体和场景全识别 识别动物、植物、商品、建筑、风景、动漫、食材、公众人物等10万个常见物体及场景,支持拼接返回大类及细分类名称 图片文字全识别 检测并识别图片内的全部文字信息,涵盖文档、证件等常见场景,支持输出文字内容及文字位置 应用场景 多模态组件提供 趣味看图对话 内容智能推荐 多模态组件提供 支持作为 AI 能力组件,结合大语言模型无缝理解图像信息