使用流程
使用说明
本文档主要说明如何在 iOCR 财会版的可视化界面中完成模板、分类器及字段类型的自定义,同时对模板图片预处理、框选表格识别区等高级功能进行说明。
自定义模板
创建自定义模板的基本流程如下图所示,仅需上传一张规范的模板图片,通过简单框选,5 分钟即可完成结构化识别模板的制作。
Step 1: 上传模板图片
在 iOCR 财会版 - 模板管理页面 点击「自定义模板」标签页下方 「创建模板」 按钮,在弹出框中上传一张 字迹清晰且摆放端正 的模板图片(大小不超过4M,最长边不超过4096像素),并对模板进行命名。
Step 2: 框选参照字段
进入模板编辑页面,右侧操作步骤中选择 「第1步:框选参照字段」 标签,左侧工具栏选择 「框选参照字段」 按钮,使用鼠标在模板图片中框选位置和内容都固定不变的文字,如下图所示橘色矩形框选区域。
注意: 「参照字段」为相同版式的不同图片中位置和内容固定不变的字段,可做为图片的锚点,用做对后续传入的图片进行模板匹配和矫正
框选Tips:
- 参照字段个数需保证在4个以上(推荐8个以上),并尽量分散在四角
- 单个参照字段不可跨行,推荐字数在4个以内
- 参照字段文字内容在上下文中不会重复出现
- 仅支持框选中英文、数字,不可包含符号、图案
Step 3: 框选识别区
右侧操作步骤中点击 「第2步:框选识别区」 标签,左侧工具栏选择 「框选识别区」 按钮,使用鼠标在模板图片上框选业务场景需要进行识别的字段,如下图所示 蓝色矩形 框选区域;同时,填写 「字段名称」,并选择合适的 「字段类型」 以提高识别准确率。
注意: 「识别区」为图片中需要进行识别的字段,可通过框选及命名构建 「字段名称 : 识别区内容」 的 Key : Value 对应关系,用于对后续传入的相同版式图片的相同位置内容进行结构化识别
框选Tips:
- 尽量扩大识别区框选范围,保证后续传入图片的对应字段内容可被完全覆盖,但同时也需保证不框选到其他字段内容
- 选择合适的字段类型有助于提升字段识别效果
- 如需识别图片内列宽固定的表格,可点击工具栏中「插入表格」按钮框选表格识别区,可参考表格识别区使用说明
Step 4: 试一试
参照字段和识别区全部框选完毕后,可点击页面右上角的 「试一试」 按钮进行识别效果测试,在弹出框中上传任意一张相同版式的图片即可,如下图所示。可点击图片下方「更换图片」按钮更换测试图片,如多次测试效果满意即可进行发布;如效果不满意可返回继续编辑。
注意:
- 如试一试结果出现图片无法匹配模板的情况,需确认上传的测试图片与模板图片是否为同一版式,如确认无误可调节参照字段框选范围或更换参照字段,以提升模板匹配准确率
- 如试一试结果中出现识别结果错误的情况,可调整识别区框选范围或更换识别区字段类型,以提升识别准确率
Step 5: 发布模板,调用API进行使用
如测试效果满意,可点击试一试弹出框右下角的 「立即发布」 按钮或模板编辑页面右上角的 「发布」 按钮进行发布,发布成功后即可通过模板ID调用该模板,调用方式可查看 API文档。
注意: 只有发布后的模板才能通过线上接口进行调用,如果编辑未发布,那么仅仅是生成了一个新的版本,此时对模板的任何修改都不会影响线上调用。
自定义分类器
创建自定义分类器仅需针对每个已发布的模板上传 30 张相同版式的训练集图片或填写分类关键词,即可自动训练一个能够对所选模板进行自动分类的分类器。
预置分类器默认已添加并发布,可直接复制对应的 classifierId(财会票据分类器:10001) 使用API进行调用
Step 1: 选择模板
在 iOCR 财会版 - 分类器管理页面 点击右上角 「创建分类器」 按钮,在弹出框中填写「分类器名称」及「功能描述」,填写完毕点击 「确认」 即可进入分类器编辑页面。
在分类器编辑页面中点击 「添加自定义模板」 或 「添加预置模板」,选择 已发布的 自定义模板或预置模板加入训练队列。
说明:
预置模板: 系统预置的常用卡证、票据模板,已上传100张训练集图片并已填写分类关键词信息,可直接勾选用于对应图片的自动分类和结构化识别
自定义模板: 已发布的自定义模板
Step 2: 上传训练集/填写分类关键词
点击选中的自定义模板所在行右侧的 「编辑训练集」 按钮,在弹出框中上传一个包含 30 张以上相同版式图片、不超过 200MB 的 ZIP 格式压缩包。
注意:「训练集」为针对已发布的识别模板上传的相同版式的图片集合,用于训练分类器对后续上传的图片进行自动分类;为了最佳的分类效果,训练集至少包含 30 张以上不重复的、版式相同的图片;系统模版已预置 100 张训练集图片,无需上传
也可在「分类关键词」列填写对应模板图片中的关键文字内容,需保证填写的关键词在该版式图片中均有出现,且具有特异性,可根据填写的关键词唯一确定图片所属模板类别
如身份证人像面的“姓名”、“性别”、“民族”、“出生”、“公民身份号码”五个字段在每一张身份证人像面均会出现,且 5 个字段全部出现时基本可确定该图片为身份证人像面,则此 5 个字段即可作为身份证人像面的分类关键词
注意:每个模板最多可设置 5 个分类关键词,每个关键词最多包含 15 个中英文字符,不可包含其他特殊符号,关键词之间使用(中/英文)逗号进行间隔
Step 3: 训练
参与分类的模板及其训练集图片数量或分类关键词符合标准后,即可点击页面左下角的 「开始训练」 按钮进行训练,等待训练完毕后即可在分类器列表中进行查看,训练完成后的分类器有以下三种分类形式:
- 纯图片特征分类器:如所有模板各上传了 30 张以上相同版式训练集图片,但均未填写分类关键词,则训练出的分类器将完全依据图片特征进行分类;
- 纯文字特征分类器:如所有模板均填写了分类关键词,但部分或全部模板未上传训练集图片,则训练出的分类器将完全依据关键词的文字信息进行分类;
- 图文协同分类器:如所有模板各上传了 30 张以上相同版式训练集图片,且部分或全部模板填写了分类关键词,则训练出的分类器将先进行关键词匹配,如匹配到相同关键词则再根据图片特征进行区分。
Step 4: 测试
在分类器管理页面的分类器列表中点击训练完毕的分类器右侧的 「测试」 按钮进行效果测试,在弹出框中上传任意一张图片即可,如下图所示,测试结果中包含分类结果及结构化识别结果。可点击图片下方「更换图片」按钮更换测试图片,如多次测试效果满意即可进行发布;如效果不满意可返回继续编辑。
Step 5: 发布
如测试效果满意,可点击测试弹出框右下角的 「立即发布」 按钮或分类器列表右侧的 「发布」 按钮进行发布,发布成功后即可通过分类器ID调用该分类器,实现图片的自动分类及结构化识别,调用方式可查看API文档。
自定义字段类型
创建自定义字段类型的基本流程如下图所示,仅需输入全部可能出现的输出值,即可创建一个自定义字段类型在制作模板时进行使用,用于字段识别结果的规范和智能纠正。
Step 1: 编辑字段词典
在 iOCR 财会版 - 字段类型管理页面 点击下方 「创建字段类型」 按钮,在弹出框中填写「字段类型名称」及「词典内容」,在词典内容中列举全部可能出现的输出值内容,填写完毕点击 「立即创建」 即可完成创建;也可点击 「添加预置类型」 按钮直接添加预置的常用字段类型,无需自行编辑词典内容。
Step 2: 开始使用
创建成功的字段类型即可在制作自定义模板选择字段类型时,点击 「我的字段类型」 进行勾选使用,使用后即可对该字段的识别结果进行规范或智能纠正。
高级功能
模板图片预处理
为保证模板的识别效果,建议上传的模板图片 字迹清晰且摆放端正,以保证后续传入的同版式图片能被匹配、矫正并准确识别。
如您无法保证上传的模板图片摆放端正,可 在框选参照字段/识别区前 通过我们提供的模板图片预处理功能对模板图片进行 旋转/透视裁剪 操作纠正倾斜图片。
图片旋转
点击编辑区左侧工具栏中的 「图片旋转」 按钮,即可进入旋转处理页面。
在旋转处理页面,使用鼠标按住上方旋转按钮拖动图片顺时针/逆时针旋转,旋转效果满意后松开鼠标点击 「保存」 按钮即可。
图片透视裁剪
点击编辑区左侧工具栏中的 「透视裁剪」 按钮,即可进入裁剪处理页面。
在裁剪处理页面,使用鼠标按住四角点小圆点进行拖拽,使四边紧贴卡证或票据边缘,拖拽完毕后点击 「保存」 按钮即可。
框选表格识别区
如果要识别的图片中存在行列固定的表格,可点击工具栏中的 「插入表格」 按钮添加指定列数的表格识别区,通过拖拽表格四角及列分隔线的小白点使识别区覆盖表格区域,并使各列识别区与表格各列对应,即可对表格内容进行结构化识别。
注意: 表格识别区仅需覆盖表格内容,无需将表头内容进行框选
如您在操作过程中出现上述内容未说明的问题,可参考 iOCR常见问题,或在 OCR论坛 发布您的问题,也可加入百度iOCR交流群(群号:570832882)与更多开发者进行交流。