案例故事 核心诉求 APP内置『翻译助手』功能,用户在出境旅途中对外文内容直接的拍摄,扫描识别,并进行中文翻译;自行开发OCR识别功能,成本非常高,且识别效果不理想,直接导致用户体验受影响。希望可以帮助旅客在出境游的旅途中,对外文的路牌、菜单等直接拍摄来进行识别及翻译,打造私人翻译助理。识别及准确的翻译是基于精准、快捷的文字扫描功能来实现。
返回的识别信息 logid int 唯一的log id,用于问题定位 result说明 名称 类型 描述 llm_result string 用户请求的实际返回结果 ocr_result list[dict] OCR 接口返回的识别文字信息 ocr_result说明 名称 类型 描述 rect dict 文字所在的位置,识别为矩形框 word string 文字内容 rect说明 名称 类型 描述
使用产品 语音识别 图像识别 人脸识别 点明科技运用百度AI创造“智慧双眼” 软件工具 基于百度语音识别,解决视障者对语音输入的需求,为用户提供了多层次的优秀体验。基于百度文字识别、图像识别与语音合成技术,通过拍摄照片或者从图库中选择图片获取其中的文字信息或图像内容,极大提升了读屏体验。
因此,借助AI技术,打造一证两码识别小程序,实现防疫信息随时随地自主申报和核验,是校方技术人员孟令永的核心需求。 解决方案 应用OCR防疫场景文字识别技术,可对上传的健康码、核酸证明、行程卡截图进行结构化识别,核验师生、家长的状态,如是否是绿码、核酸时间是否超过48小时,以及是否途径风险地等,从而判断师生、家长是否符合防疫要求。
第一步:采用高速扫描仪将纸质发票转化为电子化发票信息; 第二步:使用百度iOCR自定义模板文字识别技术创建发票识别模板,实现结构化提取模板中的指定文字信息,如发票代码、发票号码、收款方识别号等9类必要信息; 第三步:提取出的发票信息与业务数据(开票信息)比对; 第四步:开票信息与发票信息匹配成功后,实现账目自动核销。
使用产品 长语音识别 点明科技运用百度AI创造“智慧双眼” 软件工具 基于百度语音识别,解决视障者对语音输入的需求,为用户提供了多层次的优秀体验。基于百度文字识别、图像识别与语音合成技术,通过拍摄照片或者从图库中选择图片获取其中的文字信息或图像内容,极大提升了读屏体验。
使用产品 通用文字识别 EasyDL零门槛AI开发平台 短文本相似度 相似图片搜索 品牌logo识别 图像审核技术为网站内容质量保驾护航 企业服务 中国加盟网(jmw.com.cn)是一个历经15年的加盟创业服务平台,现已有16.9万个招商加盟品牌入驻,依托良好的页面质量服务用户。
平均下单时间由3分钟缩短至15秒,用户体验提升 使用产品: 通用文字识别 地址识别 查看详情 智收银:AI语音合成技术,让移动支付更便捷 百度AI语音合成技术的引入,使用户在进行支付操作时,因有更好的听觉体验加持,有效地帮助用户节省时间, 为通联支付越来越多的商户提供了更轻松、便捷的支付服务和体验 使用产品: 语音合成 查看详情 OCR 助力机票购买更便捷 误填购票信息的旅客仅需上传身份证照片,即可进行身份信息比对
使用产品 通用文字识别 EasyDL零门槛AI开发平台 短文本相似度 相似图片搜索 品牌logo识别 AI助力餐饮设计平台全面智能化升级 企业服务 铺美美是北京思库文化有限公司打造的国内唯一一家专注于餐饮行业的互联网智能设计平台,面向中小型线下餐饮商家提供海报设计、菜单制作等营销服务,致力于通过AI技术和设计师平台搭建,一站式解决餐饮商家设计、印刷、配送等难题。
在AI+三农方面 针对大部分农民注册农银e管家之时需要耗费大量时间和精力在身份证等信息的输入上,农行金融大脑OCR文字识别+人脸识别技术可以轻松识别农民提供的各种信息,绑卡开户快速完成,让农民真正享受到快速、便捷的金融服务。