使用产品 iOCR自定义模板文字识别 磅单识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 OCR助力大宗货运物流交易提效 价值成果 货大大打造煤炭运力交易平台“运销宝”,为煤炭货主和司机提供运力匹配、运输监控、在线结算等服务。在结算环节,应用iOCR通用版,个性化定制磅单识别模板,解决大宗商品交易磅单数据录入问题。司机仅需拍摄、上传磅单图片,即可识别录入车牌号、时间、净重等关键信息。
用户使用流程: Step1:进入识车宝小程序,拍摄/上传车型图片 Step2:识别车型,获取车型介绍信息,如品牌、车款、价格、基础配置等 Step3:根据识别结果进行后续操作,如了解详情、预约试驾 2、部件识别 识车宝基于百度相似图搜索技术,为车企、车展主办方、4S店等B端用户提供汽车电子说明书定制模板,商家按照要求上传整车及汽车部件图片,并为车型、各个部件添加相应的文字、图片、视频介绍,生成车型专属的电子说明书
使用产品 表格文字识别 通用文字识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 百度OCR助力供应商资质智能核实 价值成果 谦润和通过接入百度OCR能力,优化供应商资质审核流程,实现资质信息的自动比对。通过通用文字识别和表格文字识别两项能力,实现供应商合同、试验报告信息的快速提取,以及财务审计报告的数据核对工作。
2024-03-14 语音质检服务上新 产品分类: 语音识别 功能描述: 将坐席人员的通话内容转写为文字,并进行AI自动化质检,解决人工抽检成本高昂、覆盖不全等问题,大幅提高语音质量监控效率,助力通话数据分析挖掘。 适用场景: 金融风控、信贷营销、快递物流等多种行业场景,准确率业界领先!
云志愿平台迫切需要在短时间内将各省的《招生计划》和《报考指南》进行电子化,给用户提供志愿填报指导服务,因此云志愿对百度OCR技术的核心诉求如下: 1.OCR技术整体识别率需要达到95%以上; 2.OCR技术支持表格文字的识别; 3.能够返回文字在图片中的位置信息; 4.能够实现文本上下行之间的自动合行。
接口能力 接口名称 接口能力简要描述 语音识别 采用国际领先的流式端到端语音语言一体化建模算法,将语音快速准确识别为文字,支持手机应用语音交互、语音内容分析、机器人对话等多个场景。 短语音识别 将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。
呼叫中心语音-音频文件转写(8K) 接口描述 音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。 步骤 : 1、根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务,获取task_id参数。 2、根据task_id的数组批量查询音频转写任务结果。
音频文件转写API 接口描述 音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。 步骤 : 1、根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务,获取task_id参数。 2、根据task_id的数组批量查询音频转写任务结果。
解决方案 龙髯云通过结合百度iOCR自定义模板文字识别技术后,成功研发出物流运输行业通用的智能化物流运输平台——龙髯云。平台针对iOCR技术定制化的特点进行二次开发,通过上传一张磅单模板图片,对图片中需要识别的字段进行Key-Value的对应关系框选,从而创建磅单识别模板。在使用过程中,司机及雇主只需上传磅单照片即可实现磅单结构化识别和输出,使整个流程智能化,效率提升显著。
音频文件转写极速版API-邀测 接口描述 支持提取视频、音频文件中的语音内容,极速返回识别结果及时间戳,适用于对实时性有一要求的内容分析、字幕生产、录音转写场景。