9千种菜品,支持自定义菜品图库,准确识别图片中的菜品名称、位置,并可获取识别结果对应的百科词条信息 果蔬识别 识别近千种水果和蔬菜,适用于只含有一种果蔬的图片,可自定义识别结果返回数量,适用于各类美食应用 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成 植物识别 可识别超过2万种常见植物和近8千种花卉,接口返回植物名称,并支持获取识别结果对应的百科词条信息
异步回调获取审核结果 技术文档 申请试用 视频流审核 自动解析视频流链接,对视频流进行抽帧识别,音频流按照VAD方式进行语音识别及分析,可实时检测直播过程中的色情低俗、违禁违规、血腥不适等不良内容 技术文档 申请试用 应用场景 视频直播 社交应用 社区论坛 视频直播 采用百度色情识别、图文审核等技术,对视频、直播的截帧图像进行实时自动审核,快速高效,过滤违规内容的同时保证良好的用户体验 合作案例
客户案例 人民日报 针对传统报业新媒体编辑业务落地效率低的痛点,我们为人民日报新媒体部门短视频生产业务提供从媒资上传、生产处理到发布的完整视频生产管理平台,为一线业务人员提供各类应用场景下的易用工具集、提供审核管理、通联协作等公共服务能力。 好看视频 好看视频是海量优质短视频聚合平台。
持续高效迭代 根据业务反馈,持续优化审核效果,快速处理最新的问题视频,使审核结果更加精准。 产品功能 对媒体文件的内容质量进行分析,识别画面、音频中的多种类型质量问题。 画面质量检测 画面质量检测 检测视频由于聚焦不当镜头损坏等因素引起的媒体文件画面质量问题,包括抖动、模糊、噪声、滚动条纹、花屏等。
包括视频创作、智能写作等多模态创作能力,能够极大地提高内容生产效率 PPT转视频 一键解析PPT素材,自动编排文字和图片信息,并加入配音及字幕,配以各类转场动画,形成生动有趣的图文解说视频 图文素材转视频 输入图文素材,一键自动生成视频,适用于企业宣传、营销推广、知识科普等场景,帮助创作者快速实现图文转视频
帮助您零门槛进行视频创作 个性化视频参数调整 支持调整视频配音音色、视频长度、视频尺寸、添加数字人等参数,满足用户个性化需求 应用场景 新闻宣传 企业宣传 营销推广 知识科普 金融产品介绍 新闻宣传 无需专业视频编辑,仅需上传图文稿件,即可快速生成新闻短视频,实现图文稿件和视频新闻的同步投放 合作案例 技术特色 技术领先 基于百度领先的语言理解、多模态创作技术,实现图文素材智能解析、重组和视频生成
园区管理等场景 方案介绍 申请免费试用 软硬一体方案 基于EdgeBoard硬件,内置人体属性识别、检测算法,可离线本地化部署,软硬一体效果佳 立即购买 使用文档 即刻免费体验人体检测与属性识别能力 公有云API最高可享5 QPS,50000次免费测试调用 立即使用 相关推荐 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成 人流量统计
公众人物识别 基于百度人脸识别技术和丰富全面的公众人物库,识别视频中出现的明星、名人,以及人物出现的时间位置和区域等信息。 Logo识别 识别视频节目中出现的logo,如车标、台标等标识,可用于影视剧、综艺等节目素材分析。 知识图谱 基于影视、综艺诗词等各垂类知识图谱,结合知识计算、推理技术,联想出与媒资高度相关的标签。
智能横转竖 通过目标检测算法识别出画面中的重要人物和精彩区域,动态调整窗口位置的方式将视频从横屏(16:9)转成竖屏(9:16)。 智能抽帧 亮度检测 检测视频超出人眼舒适范围的过亮、过暗的片段(包含全黑屏、白屏)。 噪声检测 检测视频图像中混有呈带状、波纹、网状等带有周期性的叠加噪声的片段。 块效应/场效应检测 检测视频随着码率的降低,在块的边界会出现不连续、形成重建图像的明显缺陷的片段。
产品功能 音视频通话 1对1或多人音视频通话,音频支持 48kHz 采样的高音质,AI 降噪算法能识别多种场景噪声,可在嘈杂的环境下有效消除噪声,视频支持H.264、H.265编码,最高可支持4K分辨率,实现沉浸式互动通话体验 云端录制 在音视频通话过程中可以进行云端录制,并将录制文件存储到云端,支持单流录制和混流录制,可以配置纯音频、纯视频和音视频录制,混流录制模式支持自定义布局,并可以实现全局水印和流级别水印