功能概述
更新时间:2026-04-10
模型训练是通过标注数据和算法优化,训练出能够识别特定场景、特定目标的视觉AI模型的过程。模型训练模块为一见平台提供核心的视觉识别能力,让企业可以根据自身业务场景,训练出高精度、高适配的专属模型。
模型
| 视觉模型 | 多模态大模型 | |
|---|---|---|
| 定义 | 专注处理图像 / 视频视觉信号的专用模型,核心能力为图像分类、目标检测、分割、OCR、视觉追踪等,仅支持单视觉模态输入输出 | 同时理解并处理文本、图像、视频等多种模态信息的大模型,具备跨模态语义对齐、理解与生成能力,可实现图文交互、多模态推理 |
| 核心优势 | 1. 视觉任务精度高,专项视觉场景(检测 / 分割 / 识别)效果更优2. 模型轻量化,推理速度快、延迟低3. 算力 / 显存占用小,部署成本低4. 易针对垂直视觉场景做专项优化 | 1. 支持跨模态交互,可实现图文问答、图像语义理解、文图指令执行2. 融合自然语言语义与视觉信息,可直接响应自然语言指令3. 泛化能力强,适配复杂场景的理解任务 |
| 核心劣势 | 1. 无文本理解 / 生成能力,无法理解自然语言指令2. 仅支持纯视觉任务,无法实现跨模态交互3. 难以理解复杂场景 | 1. 参数量大,算力与显存需求高2. 推理速度慢,延迟高于专用视觉模型3. 细分视觉任务精度不如专项视觉模型4. 部署与微调成本更高 |
| 适用场景 | 1. 纯视觉类独立技能:目标检测、工业视觉质检、视频监控分析、OCR 文字提取、人脸 / 物体识别2. 低延迟、轻量化部署的视觉推理场景3. 仅需视觉信号处理,无需文本交互的自动化视觉任务 | 1. 图文协同类技能:图像问答、图像内容解析、视频理解2. 无数据积累的新场景3. 复杂跨模态推理场景 |
数据集
数据集是用于模型训练的原始数据集合,包含大量未标注或已标注的图像。
数据集类型:
- 训练集:模型在训练过程中直接学习的数据集
- 验证集:模型训练过程中使用的数据集,主要用于实时评估模型在未见过数据上的表现、调整超参数、选择模型结构、监控过拟合,指导训练早停
- 测试集:模型训练与调优全部完成后,最终用于评估模型泛化能力的独立数据集。
- 评测集:用于评测模型/技能的效果
数据集要求:
- 数据量:每个类别至少50-100张图片(推荐200+)
- 多样性:涵盖不同光照、角度、背景、尺寸
- 质量:图片清晰,标注准确
- 平衡性:各类别数据量相对均衡
训练
定义:训练是使用标注好的数据,通过算法优化模型参数,让模型学会识别特定目标的过程。
训练流程:
Plain Text
11. 准备数据集
2 ├── 导入图片
3 ├── 数据清洗
4 └── 数据增强
5
62. 标注数据
7 ├── 创建标注任务
8 ├── 在线标注
9 ├── 质量审核
10 └── 标注完成
11
123. 划分数据集
13 ├── 训练集
14 ├── 验证集
15 └── 测试集
16
174. 选择训练模板
18 ├── 目标检测模板
19 ├── 图像分类模板
20 └── 自定义模型
21
225. 配置训练参数
23 ├── 学习率
24 ├── 训练轮数
25 ├── 批大小
26 └── 数据增强策略
27
286. 开始训练
29 ├── 训练进度监控
30 ├── 损失曲线查看
31 └── 精度曲线查看
32
337. 模型评估
34 ├── 在测试集上评估
35 ├── 查看评估指标
36 └── 分析评估报告
37
388. 模型发布
39 ├── 保存模型版本
40 ├── 添加版本说明
41 └── 发布到模型库
42
439. 模型部署
44 ├── 在技能中调用
45 ├── API接口调用
46 └── 部署到边缘设备
推理服务
将训练好的 AI 模型部署为可被调用的在线服务,通过标准化接口(如 HTTP/gRPC)接收外部请求、加载模型执行推理计算、返回结构化结果,并支持并发控制、资源调度、服务监控与弹性扩缩等运维能力,是模型能力对外落地的可运行服务形态。
模型训练与其他模块的关系
1. 模型训练与数据的关系
数据是模型训练的基础:
- 数据管理模块提供数据集
- 数据集用于模型训练和评估
- 数据质量直接影响模型效果
关系图:
Plain Text
1数据管理模块
2 ↓ (提供数据集)
3模型训练
4 ↓ (使用数据训练)
5训练好的模型
6 ↓ (评估效果)
7数据反馈优化
典型场景:
- 数据管理模块导入门店监控图片
- 模型训练使用这些图片训练"店员识别模型"
- 训练完成后,使用新的数据评估模型效果
- 根据评估结果,优化数据集,重新训练
2. 模型训练与技能的关系
模型为技能提供识别能力:
- 模型训练产生的模型,可以在技能中调用
- 技能通过模型节点使用训练好的模型
- 模型的质量决定技能的效果
- 技能的反馈可以优化模型
关系图:
Plain Text
1模型训练
2 ↓ (训练模型)
3模型库
4 ↓ (模型节点调用)
5技能生产
6 ↓ (构建技能)
7视觉应用
8 ↓ (实际使用)
9效果反馈
10 ↓ (优化数据)
11模型训练(闭环)
典型场景:
- 模型训练训练了一个"安全帽检测模型"
- 技能生产中通过模型节点调用这个模型
- 构建"安全生产监控技能"
- 技能上线后,发现某些场景识别不准
- 收集这些场景的数据,重新训练模型
评价此篇文章
