以下是百度大脑相关AI能力在地址下单业务中的示例: 1、通过百度大脑OCR对图片中的地址信息进行文字识别,完成文本信息提取; 2、通过地址识别接口对文本信息进行结构化处理、地址信息纠正和补全; 3、完成以上流程后,点击下单寄件即可完成快递寄件。
解决方案 白描在开发过程中共使用了两项百度的技术: 首先是最核心的文字识别功能利用了百度文字识别技术,用户选择一张图片之后,可进行裁剪与旋转,确认之后即利用百度的文字识别接口提交到百度进行识别,进而根据识别的位置信息在原图还原文字位置覆盖图层,方便用户手指滑动选择文字或段落。在此基础上研发了自动分段功能方便简化了用户的使用步骤。
本地特征抽取:所有在SDK中运行的人脸图片,都可以完成本地特征抽取,以便进行对比或识别操作。
呼叫中心语音-语音识别(8K) 接口描述及运行环境 本文档是百度呼叫中心语音MRCP的用户指南。 本程序做为MRCP Server端,集成了呼叫中心8K采样率语音识别(ASR)和呼叫中心专属发音人语音合成(TTS)两种能力,用户可分别单独使用某一种或同时使用。
图像内容理解 接口描述 该请求用于图像内容理解,支持输入图片和提问信息,多维度识别与理解图片内容,包括人、物、行为、场景、文字等,输出对图片内容的描述。用于图片内容问答,图片打标签,图片物体识别等业务场景。图像内容理解服务涉及 2 个子接口,分别为: 图像内容理解-提交请求:支持传入图片、提问等参数,创建图像内容理解任务,该接口会返回任务ID。
lib目录为动态库so和jar包 assets目录为模型文件 java目录为用户组管理、人脸SDK操作、视频流、图片等操作辅助类 2.2.2 示例代码介绍 model名称 功能说明 FaceIdCompareActivity 人证对比,包括选择证件照图片和视频流实时采集人脸进行人脸识别比对,根据比对的结果分数确认是否为同一个人,核验是否通过。
解决方案 在引入百度大脑自然语言处理的地址识别接口后,德邦快递下单业务实现了对用户输入的文本信息进行一键解析的功能。不仅能对地址文本进行结构化处理,还可以对缺失、错误的地址信息进行补全和纠错。 地址识别在下单业务的应用示例: 第一步,用户进入创建地址界面; 第二步,录入地址信息,可支持语音和图片识别功能; 第三步,完成地址信息的识别和解析,自动完成信息录入。
车辆检测 接口描述 传入单帧图像, 检测图片中所有机动车辆,返回每辆车的类型和坐标位置 ,可识别小汽车、卡车、巴士、摩托车、三轮车5类车辆, 并对每类车辆分别计数 ,同时可定位小汽车、卡车、巴士的车牌位置,支持指定矩形区域的车辆检测与数量统计。
base64编码后的结果 3.2 开始请求 点击右上角蓝色“send”,即可在下方返回值区域中获取图片识别后的结果。
RecognizeListener 为人脸识别监听器接口。