高级功能 模板图片预处理 为保证模板的识别效果,建议上传的模板图片 字迹清晰且摆放端正 ,以保证后续传入的同版式图片能被匹配、矫正并准确识别。 如您无法保证上传的模板图片摆放端正,可 在框选参照字段/识别区前 通过我们提供的模板图片预处理功能对模板图片进行 旋转/透视裁剪 操作纠正倾斜图片。 图片旋转 点击编辑区左侧工具栏中的 「图片旋转」 按钮,即可进入旋转处理页面。
高级功能 模板图片预处理 为保证模板的识别效果,建议上传的模板图片 字迹清晰且摆放端正 ,以保证后续传入的同版式图片能被匹配、矫正并准确识别。 如您无法保证上传的模板图片摆放端正,可 在框选参照字段/识别区前 通过我们提供的模板图片预处理功能对模板图片进行 旋转/透视裁剪 操作纠正倾斜图片。 图片旋转 点击编辑区左侧工具栏中的 「图片旋转」 按钮,即可进入旋转处理页面。
iOCR 通用版提供三大自定义功能: 自定义模板: 针对需要识别的图片版式,仅需上传一张模板图片,即可通过框选参照字段和识别区自助制作一个识别模板,并建立图片中文字的 Key-Value 对应关系,实现对相同版式图片的结构化识别 自定义分类器: 针对已发布的多个识别模板,只需每类上传 30 张训练集图片或填写分类关键词即可创建分类器,实现对不同版式图片的自动分类,省去人工分类成本,一步实现图片的自动分类和结构化识别
A:不一定,我们建议您每个模板提供30张同模板的训练集,如果您训练图片较丰富可以提供100张以下的图片,每张图片建议不超过500kb,选择的图片要尽量覆盖到使用的场景。同时更多的图片会导致训练时间加长。 Q:分类的细粒度大概是什么样的? A:现在分类的细粒度为视觉元素层面有较明显的区分的图片,如身份证、银行卡、户口本这些人类能快速区分开的卡证、票据。
二、代码实现 调用Api要先获取access_token,获取的代码如下 static String getAccessToken() throws IOException { MediaType mediaType = MediaType.parse( application/x-www-form-urlencoded ); RequestBody body = RequestBody.create
二、代码实现 调用Api要先获取access_token,获取的代码如下 static String getAccessToken() throws IOException { MediaType mediaType = MediaType.parse( application/x-www-form-urlencoded ); RequestBody body = RequestBody.create
A:有以下几个原因: (1)图片尺寸过小,图片尺寸小于15px,无法进行识别。 (2)图片画质太差,例如图片过暗,文字内容不可辨识。 (3)文字内容存在水印、印章、褶皱等遮挡。 (4)图片样式与接口支持类型不符。例如, 身份证识别 只支持识别二代居民身份证,不支持识别护照、银行卡等。 (5)如果有返回错误码,请参考 错误码 排查问题。
网络图片文字识别 请求参数详情 参数名称 是否必选 类型 可选值范围 默认值 说明 image 是 mixed 本地图片路径或者图片二进制数据 url 是 String 图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式,当image字段存在时url字段失效 detect_direction
可按照示例直接传入本地图片路径,如需传值,请传入图片的二进制数据,SDK会自行base64编码。
表格行列不固定等情况的需针对不同情况制作多个模板 参照字段: 相同版式的不同图片中 位置和内容固定不变的字段 ,可框选做为图片的锚点,用做对后续传入的图片进行模板匹配和矫正;建议选取 8 个以上、分散在图片四周、且不重复无换行的参照字段,效果最佳 识别区: 图片中需要进行识别的字段,可通过框选及命名构建 「字段名称 : 识别区内容」 的 Key : Value 对应关系,用于对后续传入的相同版式图片的相同位置内容进行结构化识别