使用流程

更新时间：2026-04-02

使用说明

本文档主要说明如何在 iOCR 通用版的可视化界面中完成模板、分类器及字段类型的自定义，同时对模板图片预处理、框选表格识别区等高级功能进行说明。视频教程请参见 iOCR通用版使用教程。

自定义模板

创建自定义模板的基本流程如下图所示，仅需上传一张规范的模板图片，通过简单框选，5 分钟即可完成结构化识别模板的制作。

自定义模板流程

Step 1: 上传模板图片

在 iOCR通用版 - 模板管理页面点击「自定义模板」标签页下方 「创建模板」 按钮，在弹出框中上传一张 字迹清晰且摆放端正 的模板图片（大小不超过4M，最长边不超过4096像素），并对模板进行命名。

自定义模板1

Step 2: 框选参照字段

进入模板编辑页面，右侧操作步骤中选择 「第1步：框选参照字段」 标签，左侧工具栏选择 「框选参照字段」 按钮，使用鼠标在模板图片中框选位置和内容都固定不变的文字，如下图所示 橘色矩形 框选区域。

自定义模板2

注意： 「参照字段」为相同版式的不同图片中位置和内容固定不变的字段，可做为图片的锚点，用做对后续传入的图片进行模板匹配和矫正

框选Tips：

参照字段个数需保证在4个以上（推荐8个以上），并尽量分散在四角

单个参照字段不可跨行，推荐字数在4个以内

参照字段文字内容在上下文中不会重复出现

仅支持框选中英文、数字，不可包含符号、图案

Step 3: 框选识别区

右侧操作步骤中点击 「第2步：框选识别区」 标签，左侧工具栏选择 「框选识别区」 按钮，使用鼠标在模板图片上框选业务场景需要进行识别的字段，如下图所示 蓝色矩形 框选区域；同时，填写 「字段名称」，并选择合适的 「字段类型」 以提高识别准确率。

自定义模板3

注意：「识别区」为图片中需要进行识别的字段，可通过框选及命名构建「字段名称 : 识别区内容」的 Key : Value 对应关系，用于对后续传入的相同版式图片的相同位置内容进行结构化识别

框选Tips：

尽量扩大识别区框选范围，保证后续传入图片的对应字段内容可被完全覆盖，但同时也需保证不框选到其他字段内容

选择合适的字段类型有助于提升字段识别效果

如需识别图片内列宽固定的表格，可点击工具栏中「插入表格」按钮框选表格识别区，可参考表格识别区使用说明

Step 4: 试一试

参照字段和识别区全部框选完毕后，可点击页面右上角的 「试一试」 按钮进行识别效果测试，在弹出框中上传任意一张相同版式的图片即可，如下图所示。可点击图片下方「更换图片」按钮更换测试图片，如多次测试效果满意即可进行发布；如效果不满意可返回继续编辑。

自定义模板4

注意：

如试一试结果出现图片无法匹配模板的情况，需确认上传的测试图片与模板图片是否为同一版式，如确认无误可调节参照字段框选范围或更换参照字段，以提升模板匹配准确率

如试一试结果中出现识别结果错误的情况，可调整识别区框选范围或更换识别区字段类型，以提升识别准确率

Step 5: 发布模板，调用API进行使用

如测试效果满意，可点击试一试弹出框右下角的 「立即发布」 按钮或模板编辑页面右上角的 「发布」 按钮进行发布，发布成功后即可通过模板ID调用该模板，调用方式可查看 API文档。

自定义模板5

注意： 只有发布后的模板才能通过线上接口进行调用，如果编辑未发布，那么仅仅是生成了一个新的版本，此时对模板的任何修改都不会影响线上调用。

自定义分类器

创建自定义分类器的基本流程如下图所示，仅需针对每个模板上传 30 张相同版式的训练集图片或填写分类关键词，即可自动训练一个能够对所选模板进行自动分类的分类器。

自定义分类器流程

Step 1: 选择模板

在 iOCR通用版 - 分类器管理页面点击下方 「创建分类器」 按钮，在弹出框中填写「分类器名称」及「功能描述」，填写完毕点击 「确认」 即可进入分类器编辑页面。

在分类器编辑页面中点击 「添加预置模板」 或 「添加自定义模板」，选择 已发布的 自定义模板或系统预置模板加入训练队列。

自定义分类器1

说明：

预置模板： 系统预置的常用卡证、票据模板，已上传100张训练集图片并已填写分类关键词信息，可直接勾选用于对应图片的自动分类和结构化识别

自定义模板： 已发布的自定义模板

Step 2: 上传训练集/填写分类关键词

点击选中的自定义模板所在行右侧的 「编辑训练集」 按钮，在弹出框中上传一个包含 30 张以上相同版式图片、不超过 200MB 的 ZIP 格式压缩包。

自定义分类器2

注意： 「图片训练集」为针对已发布的识别模板上传的相同版式的图片集合，用于训练分类器对后续上传的图片进行自动分类；为了最佳的分类效果，训练集至少包含 30 张以上不重复的、版式相同的图片；系统模版已预置 100 张训练集图片，无需上传

也可在「分类关键词」列填写对应模板图片中的关键文字内容，需保证填写的关键词在该版式图片中均有出现，且具有特异性，可根据填写的关键词唯一确定图片所属模板类别

如身份证人像面的“姓名”、“性别”、“民族”、“出生”、“公民身份号码”五个字段在每一张身份证人像面均会出现，且 5 个字段全部出现时基本可确定该图片为身份证人像面，则此 5 个字段即可作为身份证人像面的分类关键词

注意：每个模板最多可设置 5 个分类关键词，每个关键词最多包含 15 个中英文字符，不可包含其他特殊符号，关键词之间使用（中/英文）逗号进行间隔

Step 3: 训练

参与分类的模板及其训练集图片数量或分类关键词符合标准后，即可点击页面左下角的 「开始训练」 按钮进行训练，等待训练完毕后即可在分类器列表中进行查看，训练完成后的分类器有以下三种分类形式：

纯图片特征分类器：如所有模板各上传了 30 张以上相同版式训练集图片，但均未填写分类关键词，则训练出的分类器将完全依据图片特征进行分类；
纯文字特征分类器：如所有模板均填写了分类关键词，但部分或全部模板未上传训练集图片，则训练出的分类器将完全依据关键词的文字信息进行分类；
图文协同分类器：如所有模板各上传了 30 张以上相同版式训练集图片，且部分或全部模板填写了分类关键词，则训练出的分类器将先进行关键词匹配，如匹配到相同关键词则再根据图片特征进行区分。

自定义分类器3

Step 4: 测试

在分类器管理页面的分类器列表中点击训练完毕的分类器右侧的 「测试」 按钮进行效果测试，在弹出框中上传任意一张图片即可，如下图所示，测试结果中包含分类结果及结构化识别结果。可点击图片下方「更换图片」按钮更换测试图片，如多次测试效果满意即可进行发布；如效果不满意可返回继续编辑。

自定义分类器4

Step 5: 发布

如测试效果满意，可点击测试弹出框右下角的 「立即发布」 按钮或分类器列表右侧的 「发布」 按钮进行发布，发布成功后即可通过分类器ID调用该分类器，实现图片的自动分类及结构化识别，调用方式可查看 API文档。

自定义分类器5

自定义字段类型

创建自定义字段类型的基本流程如下图所示，仅需输入全部可能出现的输出值，即可创建一个自定义字段类型在制作模板时进行使用，用于字段识别结果的规范和智能纠正。

自定义字段类型流程

Step 1: 编辑字段词典

在 iOCR通用版 - 字段类型管理页面点击下方 「创建字段类型」 按钮，在弹出框中填写「字段类型名称」及「词典内容」，在词典内容中列举全部可能出现的输出值内容，填写完毕点击 「立即创建」 即可完成创建；也可点击 「添加预置类型」 按钮直接添加预置的常用字段类型，无需自行编辑词典内容。

自定义字段类型1

Step 2: 开始使用

创建成功的字段类型即可在制作自定义模板选择字段类型时，点击 「我的字段类型」 进行勾选使用，使用后即可对该字段的识别结果进行规范或智能纠正。

自定义字段类型2

高级功能

模板图片预处理

为保证模板的识别效果，建议上传的模板图片 字迹清晰且摆放端正，以保证后续传入的同版式图片能被匹配、矫正并准确识别。

如您无法保证上传的模板图片摆放端正，可 在框选参照字段/识别区前 通过我们提供的模板图片预处理功能对模板图片进行 旋转/透视裁剪 操作纠正倾斜图片。

图片旋转

点击编辑区左侧工具栏中的 「图片旋转」 按钮，即可进入旋转处理页面。

在旋转处理页面，使用鼠标按住上方旋转按钮拖动图片顺时针/逆时针旋转，旋转效果满意后松开鼠标点击 「保存」 按钮即可。

图片旋转

图片透视裁剪

点击编辑区左侧工具栏中的 「透视裁剪」 按钮，即可进入裁剪处理页面。

在裁剪处理页面，使用鼠标按住四角点小圆点进行拖拽，使四边紧贴卡证或票据边缘，拖拽完毕后点击 「保存」 按钮即可。

图片裁剪

框选表格识别区

如果要识别的图片中存在行列固定的表格，可点击工具栏中的 「插入表格」 按钮添加指定列数的表格识别区，通过拖拽表格四角及列分隔线的小白点使识别区覆盖表格区域，并使各列识别区与表格各列对应，即可对表格内容进行结构化识别。

注意： 表格识别区仅需覆盖表格内容，无需将表头内容进行框选

表格识别区框选

如您在操作过程中出现上述内容未说明的问题，可参考 iOCR常见问题。

评价此篇文章

有帮助没帮助

简介

API文档

百度智能云

文字识别

文字识别

使用流程

使用说明

自定义模板

Step 1: 上传模板图片

Step 2: 框选参照字段

Step 3: 框选识别区

Step 4: 试一试

Step 5: 发布模板，调用API进行使用

自定义分类器

Step 1: 选择模板

Step 2: 上传训练集/填写分类关键词

Step 3: 训练

Step 4: 测试

Step 5: 发布

自定义字段类型

Step 1: 编辑字段词典

Step 2: 开始使用

高级功能

模板图片预处理

图片旋转

图片透视裁剪

框选表格识别区