功能概述

更新时间：2026-04-10

模型训练是通过标注数据和算法优化，训练出能够识别特定场景、特定目标的视觉AI模型的过程。模型训练模块为一见平台提供核心的视觉识别能力，让企业可以根据自身业务场景，训练出高精度、高适配的专属模型。

模型

	视觉模型	多模态大模型
定义	专注处理图像 / 视频视觉信号的专用模型，核心能力为图像分类、目标检测、分割、OCR、视觉追踪等，仅支持单视觉模态输入输出	同时理解并处理文本、图像、视频等多种模态信息的大模型，具备跨模态语义对齐、理解与生成能力，可实现图文交互、多模态推理
核心优势	1. 视觉任务精度高，专项视觉场景（检测 / 分割 / 识别）效果更优 2. 模型轻量化，推理速度快、延迟低 3. 算力 / 显存占用小，部署成本低 4. 易针对垂直视觉场景做专项优化	1. 支持跨模态交互，可实现图文问答、图像语义理解、文图指令执行 2. 融合自然语言语义与视觉信息，可直接响应自然语言指令 3. 泛化能力强，适配复杂场景的理解任务
核心劣势	1. 无文本理解 / 生成能力，无法理解自然语言指令 2. 仅支持纯视觉任务，无法实现跨模态交互 3. 难以理解复杂场景	1. 参数量大，算力与显存需求高 2. 推理速度慢，延迟高于专用视觉模型 3. 细分视觉任务精度不如专项视觉模型 4. 部署与微调成本更高
适用场景	1. 纯视觉类独立技能：目标检测、工业视觉质检、视频监控分析、OCR 文字提取、人脸 / 物体识别 2. 低延迟、轻量化部署的视觉推理场景 3. 仅需视觉信号处理，无需文本交互的自动化视觉任务	1. 图文协同类技能：图像问答、图像内容解析、视频理解 2. 无数据积累的新场景 3. 复杂跨模态推理场景

数据集

数据集是用于模型训练的原始数据集合，包含大量未标注或已标注的图像。

数据集类型：

训练集：模型在训练过程中直接学习的数据集
验证集：模型训练过程中使用的数据集，主要用于实时评估模型在未见过数据上的表现、调整超参数、选择模型结构、监控过拟合，指导训练早停
测试集：模型训练与调优全部完成后，最终用于评估模型泛化能力的独立数据集。
评测集：用于评测模型/技能的效果

数据集要求：

数据量：每个类别至少50-100张图片（推荐200+）
多样性：涵盖不同光照、角度、背景、尺寸
质量：图片清晰，标注准确
平衡性：各类别数据量相对均衡

训练

定义：训练是使用标注好的数据，通过算法优化模型参数，让模型学会识别特定目标的过程。

训练流程：

Plain Text

11. 准备数据集
2   ├── 导入图片
3   ├── 数据清洗
4   └── 数据增强
5
62. 标注数据
7   ├── 创建标注任务
8   ├── 在线标注
9   ├── 质量审核
10   └── 标注完成
11
123. 划分数据集
13   ├── 训练集
14   ├── 验证集
15   └── 测试集
16
174. 选择训练模板
18   ├── 目标检测模板
19   ├── 图像分类模板
20   └── 自定义模型
21
225. 配置训练参数
23   ├── 学习率
24   ├── 训练轮数
25   ├── 批大小
26   └── 数据增强策略
27
286. 开始训练
29   ├── 训练进度监控
30   ├── 损失曲线查看
31   └── 精度曲线查看
32
337. 模型评估
34   ├── 在测试集上评估
35   ├── 查看评估指标
36   └── 分析评估报告
37
388. 模型发布
39   ├── 保存模型版本
40   ├── 添加版本说明
41   └── 发布到模型库
42
439. 模型部署
44   ├── 在技能中调用
45   ├── API接口调用
46   └── 部署到边缘设备

推理服务

将训练好的 AI 模型部署为可被调用的在线服务，通过标准化接口（如 HTTP/gRPC）接收外部请求、加载模型执行推理计算、返回结构化结果，并支持并发控制、资源调度、服务监控与弹性扩缩等运维能力，是模型能力对外落地的可运行服务形态。

模型训练与其他模块的关系

1. 模型训练与数据的关系

数据是模型训练的基础：

数据管理模块提供数据集
数据集用于模型训练和评估
数据质量直接影响模型效果

关系图：

Plain Text

1数据管理模块
2    ↓ (提供数据集)
3模型训练
4    ↓ (使用数据训练)
5训练好的模型
6    ↓ (评估效果)
7数据反馈优化

典型场景：

数据管理模块导入门店监控图片
模型训练使用这些图片训练"店员识别模型"
训练完成后，使用新的数据评估模型效果
根据评估结果，优化数据集，重新训练

2. 模型训练与技能的关系

模型为技能提供识别能力：

模型训练产生的模型，可以在技能中调用
技能通过模型节点使用训练好的模型
模型的质量决定技能的效果
技能的反馈可以优化模型

关系图：

Plain Text

1模型训练
2    ↓ (训练模型)
3模型库
4    ↓ (模型节点调用)
5技能生产
6    ↓ (构建技能)
7视觉应用
8    ↓ (实际使用)
9效果反馈
10    ↓ (优化数据)
11模型训练（闭环）

典型场景：

模型训练训练了一个"安全帽检测模型"
技能生产中通过模型节点调用这个模型
构建"安全生产监控技能"
技能上线后，发现某些场景识别不准
收集这些场景的数据，重新训练模型

评价此篇文章

有帮助没帮助

技能生产

百度智能云

百度一见视觉智能体平台

百度一见视觉智能体平台

功能概述

模型

数据集

训练

推理服务

模型训练与其他模块的关系

1. 模型训练与数据的关系

2. 模型训练与技能的关系

百度一见 视觉智能体平台

功能概述

模型

数据集

训练

推理服务

模型训练与其他模块的关系

1. 模型训练与数据的关系

2. 模型训练与技能的关系

百度一见视觉智能体平台