地标识别 检测用户上传的地标图片,返回地标名称。 车辆属性识别 传入单帧图像,检测图片中所有车辆,返回每辆车的类型和坐标位置,可识别小汽车、卡车、巴士、摩托车、三轮车、自行车6大类车辆,并针对小汽车识别11种外观属性 车辆外观损伤识别 针对常见的小汽车车型,识别车辆外观受损部件及损伤类型,支持32种车辆部件、5大类外观损伤。
然后在本地安装智能边缘控制台,在界面上完成模型部署工作。 效果优化 如果训练得到的模型效果未达到预期,可通过查看模型评估报告来进行分析,并针对性进行效果优化。通过查看模型评估报告,发现识别漏的Badcase主要是烟头目标过小,识别错的Badcase主要是存在一些与烟头近似的物体。
通用文字识别(高精度版) 接口描述 在通用文字识别的基础上,提供更高精度的识别服务,支持更多语种识别(丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语、泰语、越语、阿拉伯语、印地语及部分中国少数民族语言),并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字。
安装 1.在 官方网站 下载C# SDK压缩工具包。 2.解压后,将 AipSdk.dll 和 Newtonsoft.Json.dll 中添加为引用。 新建交互类 Baidu.Aip.Ocr.Ocr是文字识别的交互类,为使用文字识别的开发人员提供了一系列的交互方法。
表格文字识别(异步接口) 该接口已停止更新且即将下线,如需更好的识别效果,请使用 表格文字识别V2 ,此服务支持识别更多类型表格,包括有线表格、无线表格、合并单元格表格等。 接口描述 对图片中的表格文字内容进行提取和识别,结构化输出表头、表尾及每个单元格的文字内容。支持识别常规表格及含合并单元格表格,并可选择以JSON或Excel形式进行返回。
接口说明 身份证识别(金融加密版)接口支持所有 身份证识别 接口的能力,并在此基础上,提供信息传输加密,身份证图片的加密与识别结果的解密操作需要在您的服务端完成。 支持对二代居民身份证正反面所有8个字段进行结构化识别,包括姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限,识别准确率超过99%;同时支持身份证正面头像检测,并返回头像切片的base64编码及位置信息。
医疗费用结算单识别 接口描述 支持识别全国医疗费用结算单的姓名、出/入院时间、发票总金额、自费金额、医保支付金额等 6 个关键字段,其中北京地区票据识别效果最佳。 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
表格文字识别(同步接口) 该接口已停止更新且即将下线,如需更好的识别效果,请使用 表格文字识别V2 ,此服务支持识别更多类型表格,包括有线表格、无线表格、合并单元格表格等。 接口描述 支持识别表格线齐全的常规表格和无框线表格的单元格内容,结构化输出表头、表尾及每个单元格的文字内容。 本接口为同步接口,相比于异步接口,本接口在请求后会实时返回请求结果。
业务应用策略 通用流程概述 如上图所示,人脸识别的核心业务流程可以分为三个步骤。 检测采集:通过视频流实时检测跟踪,并采集到符合质量要求的人脸图片,用于后续的识别。 活体判断:为可选步骤,主要保障业务操作者为真人,避免业务作弊。加上这步的校验,即只有满足活体判断通过,人脸图片才会被采集。
表格文字识别V2 接口描述 支持识别图片/PDF格式文档中的表格内容,返回各表格的表头表尾内容、单元格文字内容及其行列位置信息,全面覆盖各类表格样式,包括常规有线表格、无线表格、含合并单元格表格。同时,支持多表格内容识别。 视频教程请参见 表格文字识别V2使用教程 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。