适用于只含有一种果蔬的图片,可自定义识别结果返回数量,适用于各类美食应用 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成 植物识别 可识别超过2万种常见植物和近8千种花卉,接口返回植物名称,并支持获取识别结果对应的百科词条信息 动物识别 识别近八千种动物,接口返回动物名称,并可获取识别结果对应的百科信息,适用于拍照识图、幼教科普等应用
车型识别 识别3000+款常见小汽车车型,输出车辆的品牌、型号、年份、颜色、百科词条信息 车辆属性识别 检测图像中的各类车辆,并针对小汽车识别11种属性,如是否有车顶架、副驾是否有人 车辆外观损伤识别 针对常见小汽车车型,识别外观受损部件及损伤类型,可识别数十种部件、五大类损伤 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成
将图像转换成卡通画或素描风格,可用于开展趣味活动或集成到美图应用 图像修复 支持去除图片中不需要的遮挡物,使用背景内容进行填充;修复图片缺损内容 图像清晰度增强 对压缩后的模糊图像实现智能快速去噪,优化图像纹理细节,使画面更加自然清晰
1个或多个物体的名称,并可获取识别结果对应的百科信息 图像增强与特效 基于领先的深度学习技术,对质量较低的图片进行去雾、对比度增强、无损放大、拉伸恢复等多种优化处理,重建高清图像 图像主体检测 检测出图片主体的坐标位置,可使用该接口裁剪出图像主体区域,配合图像识别接口提升识别精度
AI智能画质增强,优化画质饱和度、还原压缩视频导致的失真,对 ROI 区域进行区域增强和码率分配优化 低延迟 强大的低延迟通信网络,全球范围内提供高质量音视频传输,用户就近接入,端到端延迟低至300毫秒 弱网优化 自研抗弱网算法策略,实时精准估计网络状态、动态调整码率,音视频抗丢包达70%,抗网络抖动达1000ms 全平台互通 提供全平台覆盖的实时音视频SDK,跨平台实现音视频通话,可广泛覆盖移动端
基于百度跨模态大模型能力,仅提供少量的【图片样本】+【基础提示词】,便能有效覆盖通用审核模型难以识别的场景,增强个性化场景的审核能力 图像内容安全 准确识别图片中的色情、广告、恶心、违禁等不良内容,也能从美观和清晰等维度对图像进行筛选,支持自定义图像黑白名单库,全面过滤违规、低质图像 文本内容安全 精准高效识别色情、违禁、广告、辱骂、灌水等文本,具备对拼音、谐音、拆字等变体识别能力。
内生安全增强 支持通过“大模型安全评测+安全对齐+安全防护+安全知识增强”提供服务闭环,完成内生安全增强。 产品特性 区别传统内容审核,构建AIGC场景特色安全能力 注入攻击检测 有效识别提示目标劫持注入、提示泄露、越狱攻击等攻击方式。 多轮对话恶意指代检测 有效检测通过多轮对话、主语缺省等方式进行的恶意指代攻击。
驾驶行为分析 针对车载场景,识别驾驶员使用手机、抽烟、不系安全带、未佩戴口罩、闭眼、打哈欠、双手离开方向盘等动作姿态,分析预警危险驾驶行为,提升行车安全性 【案例】广骏旅汽——AI助力传统出租车行业降低监管工作难度 > 升级 驾驶行为分析新增戴口罩、闭眼、打哈欠、低头4个属性,为行车安全保驾护航 > 立即使用 技术文档 产品价格 常见问题 功能介绍 功能演示 应用场景 产品优势 产品定价
智能封面 通过对视频、图像等内容理解,从图像清晰度、构图美学和精彩程度等方面分析,生成视频的静态封面、动态封面、视频封面。 精彩视频分析 通过场景切分、音频特征分析等技术,提取影视综长视频中的高光时刻。 百度智能云 产品优势 行业首创 国内最早基于视频内容理解的分析技术,提供独有的场景化服务。 深度语义理解 基于影视、综艺、诗词等各垂类知识图谱,结合计算、推理技术对视频进行深度语义理解。
对文档图片进行方向矫正、效果增强、去摩尔纹、擦除手写文字等操作,还原清晰图像,提升图片采集及展示质量 通用场景文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、数字、二维码等 办公文档识别 可对办公类文档的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果,支持表格识别和印章识别 iOCR通用版 针对固定版式的卡证票据可自主创建识别模板和分类器