评估分析器

更新时间：2026-05-25

分析器发布后，通过构建评估集评估抽取的准确程度。

评估模块分为两个部分：评估集和评估记录，评估集是用于验证分析器性能的测试数据集，评估记录是分析器每次评估任务的历史数据存档。

前提条件

在评估集界面可查看具体文件数量，以及不同状态（已确认、未确认和未标注）下评估集数量。

评估模块通过tab选择评估集，单击列表右上方导入数据按钮，对评估文档文件进行上传，目前支持本体导入和媒体集导入两种方式。具体配置详情可参见下表：

配置项名称	说明
导入方式	目前支持本地导入、媒体集导入两种方式。选择本体导入时，拖动文件到目标位置或单击上传按钮，上传文件，支持.pdf、.docx、.xlsx、xls、.txt、.md及图片格式。
媒体集	选择媒体集导入方式时，单击浏览按钮，选择媒体集。限制：单次最多可以从媒体集中选择1000份文档。
自动标注	配置是否开启自动标注能力，开启后系统将对导入文档自动完成内容抽取、标签生成、字段识别等智能处理。
分析器版本	选择本次任务使用的分析器引擎版本。

导入成功的文件文档以列表形式展示，支持按照数据名称进行搜索，同时支持按照标注状态（未标注/已确认/标注中/自动标注/已标注）进行筛选。

评估集列表操作：单击列表操作项按钮，对评估集进行不同操作。

标注：单击标注后进入标注流程，在右侧标注字段部分，单击自动标注>选择标注标注版本后确定，进行字段标注；当需要手动修改，手动标注需要单击字段的编辑按钮，从文档中选取需要修改的字段内容。
删除：单击删除按钮，删除当前评估集。注意：评估集删除后无法恢复，请谨慎操作。

评估记录是分析器版本的评估记录，通过评估记录追溯分析器版本的准确性。记录以列表形式展示，支持按照评估记录名称进行搜索，按照评估状态（等待中/运行中/已完成/失败）进行筛选。

在评估记录列表右上方单击创建评估按钮，填写创建评估任务相关配置项后确定，评估任务创建完成。创建成功的评估任务以列表形式展示，相关操作项说明参照下表。

表1 创建评估任务配置项说明

配置项名称	说明
任务名称	填写评估任务名称。
评估版本	下拉选择分析器版本。
评估规则	选择匹配方式，严格匹配 / 模糊匹配。注意：严格匹配会字符进行一一比对，模糊匹配会移除抽取字段中的空格和标点符号，不区分大小写进行评估判定。
评估模型	下拉选择执行评估的模型。

表2 评估任务列表说明

列表项	说明
评估任务	当前评估任务的名称。
任务 ID	评估任务的唯一标识，系统自动生成。
评估状态	当前评估任务的运行状态（等待中/运行中/已完成/失败）。
评估时间	当前评估任务开始执行的具体时间。
分析器版本	本次评估所使用的分析器版本。
F1	Precision 与 Recall 的调和平均，即在评估集上的准确性。
精确率	所有字段正确抽取结果占所有抽取结果的百分比，TP / (TP + FP)。精确率越高，预测的假正例越少。
召回率	所有字段正确抽取结果占真实正确结果的百分比，TP / (TP + FN)。召回率越高，假负例越少，即出差错的预测越少。
操作	单击操作列不同按钮，对评估任务进行不同操作。详情：单击详情按钮跳转评估详情页。

评价此篇文章

有帮助没帮助