接口能力 接口名称 接口能力简要描述 语音识别 采用国际领先的流式端到端语音语言一体化建模算法,将语音快速准确识别为文字,支持手机应用语音交互、语音内容分析、机器人对话等多个场景。 短语音识别 将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。
通过引入人脸识别技术,改变传统的信息审核模式,提升人工智能时代驾校管理效率,也是驾培行业当下的重要诉求。 解决方案 明城驾校通过使用1580公司研发的驾考平台APP『呱呱学车』,并配套其智能车载终端服实现了驾校管理、辅助招生、预约学车、计时培训、教学车辆监管等功能。 1、用户注册 通过文字识别技术识别身份证,完成实名认证,有效缩短了注册流程,优化了用户体验 。
案例故事 核心诉求 聚邮惠的“E快寄”小程序在填写收寄信息时,会在以下三个场景出现错误低效的问题: 1、由于不同城市或地区会出现相同命名的情况,从而造成所填写的街道不能对应所在省市县,因此其识别错误率较高; 2、用户在填写收寄信息时经常不填写省市等信息,如果需要补充完整则需要额外填写输入,导致用户体验不佳、填写效率不高; 3、用户填写信息时,复制来的文字经常未按指定顺序或格式复制,因此寄件时需要调整顺序
解决方案 度小满支付通过结合自身技术+百度OCR文字识别-卡片证照识别(银行卡识别)能力,实现用户在注册绑卡环节,直接拍照扫描提取银行卡号,降低用户手动输入成本,提升操作便捷性,优化注册体验。 第一步:进入银行卡添加界面,选择要绑定的银行卡。——通过自身技术(预处理)+百度OCR文字识别-卡片证照识别(银行卡识别)接口能力,对需绑定的银行卡进行识别读取。
Logo识别 Logo 识别 Logo识别是SDK2.2新增能力,目前支持2万类商标logo的识别,可通过配置特定的logo,扫描识别后识别AR特效内容,仅 空间识别IMU场景 可用。
手势识别 手势识别 在DuMix AR中可通过扫描识别特定的手势识别AR特效内容,目前支持的可识别手势为单手手掌(五指伸展)、点赞(拇指向上)、OK(食指和拇指扣环)、比心(食指和拇指交叉)、单手比1(仅食指伸出)等五种手势,使用场景 限空间识别IMU场景 ,不能和slam场景以及2D跟踪场景结合使用。
使用产品 表格文字识别 通用文字识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 百度OCR助力供应商资质智能核实 价值成果 谦润和通过接入百度OCR能力,优化供应商资质审核流程,实现资质信息的自动比对。通过通用文字识别和表格文字识别两项能力,实现供应商合同、试验报告信息的快速提取,以及财务审计报告的数据核对工作。
物体识别 Logo 此类封装lua Logo识别接口 Public methods function logo_callBack(string logo_status) logo识别状态回调 Logo LogoDemo() demo.
有部分钱币、动漫、烟酒等tag无上层标签 +baike_info 否 object 对应识别结果的百科词条名称 ++baike_url 否 string 对应识别结果百度百科页面链接 ++image_url 否 string 对应识别结果百科图片链接 ++description 否 string 对应识别结果百科内容描述 返回示例 Plain Text 复制 1 HTTP/1.1 200 OK 2
使用产品 人脸识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 人脸识别开启智能云考勤 价值成果 天津威腾软件技术有限公司通过使用人脸识别考勤机,实现实时云平台数据的管理分析,考核评定。极大地提升了企业考勤的管理效率。在使用过程中,人脸识别速度约为1s左右、准确率达到99%。完全满足高峰时段考勤高效应用,轻松实现智能化的考勤管理和日常考核功能,降低了企业的运营成本。