文字识别

    使用流程

    使用说明

    本文档主要说明如何在 iOCR通用版的可视化界面中完成模板、分类器及字段类型的自定义,同时对模板图片预处理、框选表格识别区等高级功能进行说明。

    自定义模板

    创建自定义模板的基本流程如下图所示,仅需上传一张规范的模板图片,通过简单框选,5 分钟即可完成结构化识别模板的制作。

    自定义模板流程

    Step 1: 上传模板图片

    iOCR - 模板管理页面 点击下方 「创建模板」 按钮,在弹出框中上传一张 字迹清晰且摆放端正 的模板图片(大小不超过4M,最长边不超过4096像素),并对模板进行命名。

    自定义模板1

    Step 2: 框选参照字段

    进入模板编辑页面,右侧操作步骤中选择 「第1步:框选参照字段」 标签,左侧工具栏选择 「框选参照字段」 按钮,使用鼠标在模板图片中框选位置和内容都固定不变的文字,如下图所示 橘色矩形 框选区域。

    自定义模板2

    注意: 「参照字段」为相同版式的不同图片中位置和内容固定不变的字段,可做为图片的锚点,用做对后续传入的图片进行模板匹配和矫正

    框选Tips:

    1. 参照字段个数需保证在4个以上(推荐8个以上),并尽量分散在四角
    2. 单个参照字段不可跨行,推荐字数在4个以内
    3. 参照字段文字内容在上下文中不会重复出现
    4. 仅支持框选中英文、数字,不可包含符号、图案

    Step 3: 框选识别区

    右侧操作步骤中点击 「第2步:框选识别区」 标签,左侧工具栏选择 「框选识别区」 按钮,使用鼠标在模板图片上框选业务场景需要进行识别的字段,如下图所示 蓝色矩形 框选区域;同时,填写 「字段名称」,并选择合适的 「字段类型」 以提高识别准确率。

    自定义模板3

    注意:「识别区」为图片中需要进行识别的字段,可通过框选及命名构建 「字段名称 : 识别区内容」 的 Key : Value 对应关系,用于对后续传入的相同版式图片的相同位置内容进行结构化识别

    框选Tips:

    1. 尽量扩大识别区框选范围,保证后续传入图片的对应字段内容可被完全覆盖,但同时也需保证不框选到其他字段内容
    2. 选择合适的字段类型有助于提升字段识别效果
    3. 如需识别图片内列宽固定的表格,可点击工具栏中「插入表格」按钮框选表格识别区,可参考 表格识别区使用说明

    Step 4: 试一试

    参照字段和识别区全部框选完毕后,可点击页面右上角的 「试一试」 按钮进行识别效果测试,在弹出框中上传任意一张相同版式的图片即可,如下图所示。可点击图片下方「更换图片」按钮更换测试图片,如多次测试效果满意即可进行发布;如效果不满意可返回继续编辑。

    自定义模板4

    注意:

    1. 如试一试结果出现图片无法匹配模板的情况,需确认上传的测试图片与模板图片是否为同一版式,如确认无误可调节参照字段框选范围或更换参照字段,以提升模板匹配准确率
    2. 如试一试结果中出现识别结果错误的情况,可调整识别区框选范围或更换识别区字段类型,以提升识别准确率

    Step 5: 发布模板,调用API进行使用

    如测试效果满意,可点击试一试弹出框右下角的 「立即发布」 按钮或模板编辑页面右上角的 「发布」 按钮进行发布,发布成功后即可通过模板ID调用该模板,调用方式可查看 API文档

    自定义模板5

    注意: 只有发布后的模板才能通过线上接口进行调用,如果编辑未发布,那么仅仅是生成了一个新的版本,此时对模板的任何修改都不会影响线上调用。

    自定义分类器

    创建自定义分类器的基本流程如下图所示,仅需针对每个模板上传 30 张相同版式的训练集图片,即可自动训练一个能够对所选模板进行自动分类的分类器。

    自定义分类器流程

    Step 1: 选择模板

    iOCR - 分类器管理页面 点击下方 「创建分类器」 按钮,在弹出框中填写「分类器名称」及「功能描述」,填写完毕点击 「确认」 即可进入分类器编辑页面。

    在分类器编辑页面中点击 「添加我的模板」「添加系统模板」,选择 已发布的 自定义模板或系统预置模板加入训练队列。

    自定义分类器1

    说明:

    我的模板: 已发布的自定义模板

    系统模板: 系统预置的常用卡证、票据模板,已上传100张训练集图片,可直接勾选用于对应图片的自动分类和结构化识别

    Step 2: 上传训练集

    点击选中的自定义模板所在行右侧的 「编辑训练集」 按钮,在弹出框中上传一个包含 30 张以上相同版式图片、不超过 200MB 的 ZIP 格式压缩包。

    自定义分类器2

    注意: 「训练集」为针对已发布的识别模板上传的相同版式的图片集合,用于训练分类器对后续上传的图片进行自动分类;为了最佳的分类效果,训练集至少包含 30 张以上不重复的、版式相同的图片;系统模版已预置 100 张训练集图片,无需上传

    Step 3: 训练

    参与分类的模板及训练集图片数量符合标准后,即可点击页面左下角的 「开始训练」 按钮进行训练,等待训练完毕后即可在分类器列表中进行查看。

    自定义分类器3

    Step 4: 测试

    在分类器管理页面的分类器列表中点击训练完毕的分类器右侧的 「测试」 按钮进行效果测试,在弹出框中上传任意一张图片即可,如下图所示,测试结果中包含分类结果及结构化识别结果。可点击图片下方「更换图片」按钮更换测试图片,如多次测试效果满意即可进行发布;如效果不满意可返回继续编辑。

    自定义分类器4

    Step 5: 发布

    如测试效果满意,可点击测试弹出框右下角的 「立即发布」 按钮或分类器列表右侧的 「发布」 按钮进行发布,发布成功后即可通过分类器ID调用该分类器,实现图片的自动分类及结构化识别,调用方式可查看 API文档

    自定义分类器5

    自定义字段类型

    创建自定义字段类型的基本流程如下图所示,仅需输入全部可能出现的输出值,即可创建一个自定义字段类型在制作模板时进行使用,用于字段识别结果的规范和智能纠正。

    自定义字段类型流程

    Step 1: 编辑字段词典

    iOCR - 字段类型管理页面 点击下方 「创建字段类型」 按钮,在弹出框中填写「字段类型名称」及「词典内容」,在词典内容中列举全部可能出现的输出值内容,填写完毕点击 「立即创建」 即可完成创建;也可点击 「添加预置类型」 按钮直接添加预置的常用字段类型,无需自行编辑词典内容。

    自定义字段类型1

    Step 2: 开始使用

    创建成功的字段类型即可在制作自定义模板选择字段类型时,点击 「我的字段类型」 进行勾选使用,使用后即可对该字段的识别结果进行规范或智能纠正。

    自定义字段类型2

    高级功能

    模板图片预处理

    为保证模板的识别效果,建议上传的模板图片 字迹清晰且摆放端正,以保证后续传入的同版式图片能被匹配、矫正并准确识别。

    如您无法保证上传的模板图片摆放端正,可 在框选参照字段/识别区前 通过我们提供的模板图片预处理功能对模板图片进行 旋转/透视裁剪 操作纠正倾斜图片。

    图片旋转

    点击编辑区左侧工具栏中的 「图片旋转」 按钮,即可进入旋转处理页面。

    在旋转处理页面,使用鼠标按住上方旋转按钮拖动图片顺时针/逆时针旋转,旋转效果满意后松开鼠标点击 「保存」 按钮即可。

    图片旋转

    图片透视裁剪

    点击编辑区左侧工具栏中的 「透视裁剪」 按钮,即可进入裁剪处理页面。

    在裁剪处理页面,使用鼠标按住四角点小圆点进行拖拽,使四边紧贴卡证或票据边缘,拖拽完毕后点击 「保存」 按钮即可。

    图片裁剪

    框选表格识别区

    如果要识别的图片中存在行列固定的表格,可点击工具栏中的 「插入表格」 按钮添加指定列数的表格识别区,通过拖拽表格四角及列分隔线的小白点使识别区覆盖表格区域,并使各列识别区与表格各列对应,即可对表格内容进行结构化识别。

    注意: 表格识别区仅需覆盖表格内容,无需将表头内容进行框选

    表格识别区框选

    如您在操作过程中出现上述内容未说明的问题,可参考 iOCR常见问题,或在OCR论坛发布您的问题,也可加入百度iOCR交流群(群号:570832882)与更多开发者进行交流。

    上一篇
    简介
    下一篇
    API文档