value 是 array[] value 文字行的信息 ++++ word 是 string value 文字行的文字结果 ++++ line__probability 是 string value 文字行的文字结果识别置信度 ++++ line_location 是 object{} value 文字行的位置 +++++ left 是 uint32 表示 value 文字行定位位置的长方形左上顶点的水平坐标
医疗发票识别 接口描述 支持识别全国各地门诊/住院发票的全字段信息,包括业务流水号、发票号、姓名、性别、社保卡号、金额大/小写、收款单位、省市、医保统筹支付、个人账户支付等关键字段,及收费项目明细、各省直辖市的专有信息,其中北京/广东/河北/河南/江苏/山东/上海/天津/浙江等地区票据识别效果较佳。
产品介绍 EasyDL-OCR 已停止迭代更新,推荐使用 文档抽取 ,该产品支持大模型自定义字段快速提取,无需训练,欢迎免费体验 功能介绍 EasyDL文字识别,可定制识别图片中的文字信息,结构化输出关键字段内容,极大提升OCR模型训练效率,满足个性化卡证票据识别需求 数据标注 创建数据集并上传真实图片,定义数据识别字段作为标注标签,在图片中框选对应的 Key/Value 内容区域,自动识别框选区域内容完成转写
接口描述 iOCR 全场景识别采用 MoE 混合专家架构, 无需分类调用、无需定制训练,一个接口实现全场景结构化识别 。基于意图识别模型,自动将同一任务中的不同类型文件分发至对应专家模型,已预置 10 余种 OCR 识别模型与通用抽取大模型,同时支持自定义文档抽取模型,不限类型与版式,轻松提取复杂文档关键字段。
快速入门 安装通用文字识别 Node SDK 通用文字识别 Node SDK目录结构 Plain Text 复制 1 ├── src 2 │ ├── auth //授权相关类 3 │ ├── http //Http通信相关类 4 │ ├── client //公用类 5 │ ├── util //工具类 6 │ └── const //常量类 7 ├── AipOcr.js //通用文字识别交互类
AipOcrSdk -o AipOcrSdk.framework/AipOcrSdk 8 lipo -remove i386 AipOcrSdk.framework/AipOcrSdk -o AipOcrSdk.framework/AipOcrSdk 9 # 再次查看 10 lipo -info AipBase.framework/AipBase # Architectures in the fat
2 4 words_result : [ 5 { 6 words : OCR 7 } , 8 { 9 words : 百度通用文字识别高精度版 10 } 11 ] 12 } 通用文字识别(含位置信息版) 用户向服务请求识别某张图中的所有文字,并返回文字在图中的位置信息。
文件检测分类 接口描述 对图片中的文档、卡证、票据等含文字的主体进行检测、分类,可同时支持一张图片中多张主体的情况,返回每个主体的类别及位置信息。 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
如上传的为多页PDF,仅识别第一页 templateSign 否 string - 模板 ID,自定义模板或预置模板的唯一标示,可用于调用指定的识别模板进行结构化识别,可在 「模板管理」 页查看并复制使用 classifierId 否 string - 分类器Id,分类器的唯一标示,可用于调用指定的分类器对传入的图片进行自动分类及识别 与 templateSign 至少存在一个,如同时存在,则优先级
接口说明 通用文字识别 用户向服务请求识别某张图中的所有文字。