公众人物识别 基于百度人脸识别技术和丰富全面的公众人物库,识别视频中出现的明星、名人,以及人物出现的时间位置和区域等信息。 Logo识别 识别视频节目中出现的logo,如车标、台标等标识,可用于影视剧、综艺等节目素材分析。 知识图谱 基于影视、综艺诗词等各垂类知识图谱,结合知识计算、推理技术,联想出与媒资高度相关的标签。
旁路直播 可以将RTC房间的音视频内容转推到CDN直播,通过混流服务将RTP协议转换为标准的直播RTMP协议,观众通过直播系统拉流观看,支持单路转推和混流转推模式,并提供混流转码能力 云播放器 支持向RTC房间输入在线媒体流,房间内其他用户可以观看该媒体流,输入源支持直播流和文件类型 内容审核 支持对音视频内容进行审核,有效识别音视频中的色情、涉政、暴恐、广告等多种违规内容,并将审核结果回调给业务方
结构化识别增值税普票、专票、电子发票、卷票的所有关键字段,其中四要素识别准确率超过99% 火车票识别 对红、蓝火车票的13个关键字段进行结构化识别,包括车票号码、始发站、目的站、车次、日期、票价、席别、姓名、座位号等 出租车票识别 可对全国各大城市出租车票的6个关键字段进行结构化识别,包括发票号码、代码、车号、日期、时间、金额
适用于长句语音输入、音视频字幕、会议等场景 了解详情 音频文件转写 将批量上传的音频文件识别为文字,12小时内返回识别结果。
车辆维修登记 车辆信息管理 自动识别录入各种车辆车架号码,可应用于4S店车辆出入库管理、车辆出租管理等场景,快速完成车辆信息统计及管理,有效降低人工录入成本,实现车辆管理的自动化 使用方式 公有云服务 提供各类文字识别能力的在线服务接口,可直接调用API或使用HTTP SDK进行识别应用,快速接入,稳定可靠 私有化部署 部署至本地服务器或专有云,在内网/局域网中实现文字识别功能,保障数据私密性,提供一体机和软件部署包两种私有化方案
银行支票识别 支持对转账支票、现金支票、普通支票等多类银行支票的7个关键字段进行结构化识别,包括:银行名称、出票日期、出票人账号、收款人、 付款行名称、金额、用途 了解更多 技术文档 应用场景 特色优势 使用方式 支持交流 相关推荐 应用场景 交易凭证记录 使用银行支票识别技术,实现对银行支票金额、出票日期等信息的识别,可应用于报销记账场景,高效准确的识别服务可以满足用户快速录入账单信息的需求,有效降低用户输入成本
9个字段进行结构化识别,包括证号、姓名、性别、国籍、住址等 车牌识别 对机动车蓝牌、绿牌、单/双行黄牌的车牌号码进行识别,并能同时识别图像中的多张车牌 VIN码识别 识别车辆车架、挡风玻璃上的VIN码,可用于4S店车辆出入库管理、车辆维修登记等场景 即刻免费体验行驶证识别能力 公有云API最高可享2000次/月免费测试资源 立即使用
智能横转竖 通过目标检测算法识别出画面中的重要人物和精彩区域,动态调整窗口位置的方式将视频从横屏(16:9)转成竖屏(9:16)。 智能抽帧 亮度检测 检测视频超出人眼舒适范围的过亮、过暗的片段(包含全黑屏、白屏)。 噪声检测 检测视频图像中混有呈带状、波纹、网状等带有周期性的叠加噪声的片段。 块效应/场效应检测 检测视频随着码率的降低,在块的边界会出现不连续、形成重建图像的明显缺陷的片段。
百度智能云视联网感知平台结合百度国产化AI芯片”昆仑“以及升哲科技物联网终端技术,围绕城市交通、水务建设、能源管理、环境监测、安全治理等领域打造出新型智慧城市的统一“数据底座”,实现物联感知和视觉感知的双重融合,实时对整个区域进行全息感知和数字化、可视化监测,通过感知、联网、智能反馈等实现整体的智能化转型升级,为整体区域治理与发展带来从无到有的识别能力、强大的分析能力和算法能力,助力点军城市数字经济发展
12月 ¥ 330 立即购买 产品优势 适用范围广 可识别全国各地横版及竖版的道路运输证,使用海量多场景业务数据训练调优,满足各类使用场景的信息提取需求 算法精度高 针对拍摄角度异位、背景及亮度干扰、内容错位等常见问题进行专项优化,识别准确率高 应用场景 道路运输市场监管 面向公路运输场景,快速采集营运车辆、从业人员身份数据,结合其他车辆证照识别技术,应用于车辆综合性能检测、车辆年审、客运及货运站点报班管理等场景