表示定位位置的长方形的宽度 ++height 是 uint32 表示定位位置的长方形的高度 +words 否 string 识别结果字符串 +chars 否 array() 单字符结果,recognize_granularity=small时存在 ++location 是 array() 位置数组(坐标0点为左上角) +++left 是 uint32 表示定位位置的长方形左上顶点的水平坐标 +++
名词解释 票据: 报销场景常用的各类票据凭证,如各类发票、交通票据等,通常打印在专用纸张,且各字段有固定打印位置 单据: 财税场景常用的各类单据,如银行对账单、银行回单、银行汇票、银行支票等,通常由银行开具,用于内部财税核对 固定版式: 指不同图片中的对应字段文字虽内容不同、长短不同,但可能出现的位置及范围固定不变的一类图片,如身份证、学生证、结婚证、火车票等;若图片中存在前文内容长度影响后文位置、
网络图片文字识别(含位置版) 支持识别艺术字体或背景复杂的文字内容,除文字信息外,还可返回每行文字的位置信息、行置信度,以及单字符内容和位置等 办公文档识别 可对办公类文档的版面进行分析,输出图、表、标题、文本、目录、栏、页眉、页脚、页码和脚注的位置,并输出分版块内容的OCR识别结果 数字识别 识别图片中的数字,适用于手机号提取、快递单号提取、充值号码提取等场景 手写文字识别 对手写汉字或手写数字进行识别
网络图片文字识别 针对网络图片进行专项优化,对艺术字体或背景复杂的文字内容具有更优的识别效果 网络图片文字识别(含位置版) 支持识别艺术字体或背景复杂的文字内容,除文字信息外,还可返回每行文字的位置信息、行置信度,以及单字符内容和位置等 办公文档识别 可对办公类文档的版面进行分析,输出图、表、标题、文本、目录、栏、页眉、页脚、页码和脚注的位置,并输出分版块内容的OCR识别结果 数字识别 识别图片中的数字
识别图片中的文字信息(包含文字区域的坐标信息) 通用文字识别(高精度版) 更高精度地识别图片中的文字信息 通用文字识别(高精度含位置版) 更高精度地识别图片中的文字信息(包含文字区域的坐标信息) 网络图片文字识别 针对网络图片进行专项优化,对艺术字体或背景复杂的文字内容具有更优的识别效果 网络图片文字识别(含位置版) 支持识别艺术字体或背景复杂的文字内容,除文字信息外,还可返回每行文字的位置信息
位置数组(坐标0点为左上角) +++ left 是 uint32 表示定位位置的长方形左上顶点的水平坐标 +++ top 是 uint32 表示定位位置的长方形左上顶点的垂直坐标 +++ width 是 uint32 表示定位定位位置的长方形的宽度 +++ height 是 uint32 表示位置的长方形的高度 + chars 否 array[] result_type=small时返回。
不支持单字位置。
说明: 参照字段: 相同版式的不同图片中位置和内容固定不变的字段,可框选做为图片的锚点,用做对后续传入的图片进行模板匹配和矫正 识别区 :图片中需要进行识别的字段,可通过框选及命名构建 「字段名称 : 识别区内容」 的 Key : Value 对应关系,用于对后续传入的相同版式图片的相同位置内容进行结构化识别 自定义分类器 针对已发布的多个识别模板,只需每类上传 30 张训练集图片或填写分类关键词即可创建分类器
small 时存在 ++ char 否 string 单字符识别结果 ++ location 否 object{} 位置数组(坐标0点为左上角) +++ left 否 uint32 表示定位位置的长方形左上顶点的水平坐标 +++ top 否 uint32 表示定位位置的长方形左上顶点的垂直坐标 +++ width 否 uint32 表示定位定位位置的长方形的宽度 +++ height 否 uint32
big:不定位单字符位置;small:定位单字符位置。