行驶证正副页在同一张图片上的混贴场景 VIN码识别 识别车辆挡风玻璃处的车架号码,可应用于4S店车辆出入库管理、车辆出租管理等场景,快速完成车辆信息统计及管理 机动车登记证书识别 结构化识别机动车登记证书的15个关键字段,同时可检测发证机关章 机动车销售发票识别 结构化识别机动车销售发票的号码、代码、日期、价税合计等26个关键字段 二手车销售发票识别 结构化识别二手车销售发票的25个关键字段,包括发票代码
适用于长句语音输入、音视频字幕、会议等场景 了解详情 音频文件转写 将批量上传的音频文件识别为文字,12小时内返回识别结果。
银行支票识别 支持对转账支票、现金支票、普通支票等多类银行支票的7个关键字段进行结构化识别,包括:银行名称、出票日期、出票人账号、收款人、 付款行名称、金额、用途 了解更多 技术文档 应用场景 特色优势 使用方式 支持交流 相关推荐 应用场景 交易凭证记录 使用银行支票识别技术,实现对银行支票金额、出票日期等信息的识别,可应用于报销记账场景,高效准确的识别服务可以满足用户快速录入账单信息的需求,有效降低用户输入成本
云数据库 GaiaDB-X 基于百度自研中间件的分布式多节点关系型数据库,兼容 MySQL 协议,具备无限扩容、运行稳定、高可靠高安全、使用灵活等特性 云数据库特惠专场,热销规格免费使用! VectorDB 全面开放,新老用户 0 门槛 免费创建 立即购买 价格详情 帮助文档 产品规格 产品功能 产品优势 使用场景 客户案例 文档与工具 相关产品 最新发布 功能发布 云数据库 GaiaDB-X
并整合多种预置能力,可快速实现对各类卡证、票据的自动分类及结构化识别 通用票据识别 对医疗票据、银行兑票、购物小票等各类票据的票面内容进行识别,并按行返回结果 增值税发票识别 结构化识别增值税普票、专票、电子发票、卷票的所有关键字段,其中四要素识别准确率超过99% 定额发票识别 对各类定额发票的发票代码、发票号码、金额等关键字段进行结构化识别 通用机打发票识别 结构化识别国家/地方税务局发行的横/
旁路直播 可以将RTC房间的音视频内容转推到CDN直播,通过混流服务将RTP协议转换为标准的直播RTMP协议,观众通过直播系统拉流观看,支持单路转推和混流转推模式,并提供混流转码能力 云播放器 支持向RTC房间输入在线媒体流,房间内其他用户可以观看该媒体流,输入源支持直播流和文件类型 内容审核 支持对音视频内容进行审核,有效识别音视频中的色情、涉政、暴恐、广告等多种违规内容,并将审核结果回调给业务方
智能横转竖 通过目标检测算法识别出画面中的重要人物和精彩区域,动态调整窗口位置的方式将视频从横屏(16:9)转成竖屏(9:16)。 智能抽帧 亮度检测 检测视频超出人眼舒适范围的过亮、过暗的片段(包含全黑屏、白屏)。 噪声检测 检测视频图像中混有呈带状、波纹、网状等带有周期性的叠加噪声的片段。 块效应/场效应检测 检测视频随着码率的降低,在块的边界会出现不连续、形成重建图像的明显缺陷的片段。
算法领先 识别系统风险+操作层面异常,业务安全双保险:通过生物探针及风险探测对人脸采集进行安全加固,有效防御底层ROM篡改、Hook、摄像头劫持、注入等风险;配合百度多年积累大数据输出风险画像,专治黑产一体机冒名注册及打卡。
将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景 音频文件转写 将批量上传的音频文件识别为文字,12小时内返回识别结果。
产品试用 标准版 帮助开发者提供快速实现媒体播放功能 性能强大 ,CPU/内存占用率低,视频加载速度快 低门槛接入,提供与系统播放器高度相似的调用接口,同时提供开发示例 播放稳定,稳定性和兼容性极强,解决了花屏、音画不同步和黑屏等问题 立即开通使用 高级版 提供增值服务,为用户带来更丰富的音视频体验 全景声(WANOS)音频格式解码与音效处理;VR全景视频播放 HDR多标准视频解码与渲染;DLNA投屏支持将手机端视频内容投送到大屏设备