平台架构
更新时间:2026-05-26
百度一见 视觉智能体平台分为视觉应用、技能开发两个子平台。 视觉应用为连锁、能源、制造等企业业务部门提供端到端的视觉AI应用,包括视频监控实时AI分析及视图文件批量AI分析应用。 技能开发为企业IT部门及一见伙伴提供低门槛的视觉AI技能生产能力,赋能企业低成本完成视觉AI技能的生产及应用。

视觉应用
资产
- 设备:设备是接入一见系统的物理硬件单元,如一见接入的摄像头、NVR、边缘分析盒子等,为视觉AI分析提供基础视图数据采集能力。
- 点位:点位代表一个视频采集单元,指视频监控系统中单个摄像头的物理安装位置及其所覆盖的监控区域,通常以 “点位” 为单位进行统计和管理。
- 技能:视觉应用技能支持从技能广场添加,也支持基于技能开发平台自定义,并发布至视觉应用平台。
应用
视频监控
- 实时预览:基于多分屏观看实时监控视频画面,支持手动抓图、点位切换、视频录制、云台控制。
- 录像回放:支持配置点位录像计划并进行录像回看。
监测预警
- 技能运行计划:关联摄像头点位与视觉AI技能,配置视觉AI分析计划。
- 预警:平台根据视觉AI分析计划运行视觉AI分析任务,当出现符合视觉AI技能的判断条件则触发一个预警。
- 复判:平台可配置多模态大模型AI技能用于复判,提升视觉AI分析效果。
视图分析
- 视图文件:支持上传视图文件,可选择所需的视觉AI技能,并创建单次或循环视图分析计划。
- 事件:当视图文件出现符合视觉AI技能的判断条件则触发一个事件。
SOP合规分析
- SOP规则:一个SOP规则用“环节”和“步骤”描述一个标准作业规则,每个步骤支持关联一个视觉AI技能,关联至摄像头点位后,平台将依据标准作业要求分析实际作业情况。
- 非标准作业预警:当出现未做、做错、超时等不符合标准作业规则的情况则触发一个非标准作业预警。
技能开发
探索
- 技能广场:一见的视觉AI技能定义为一个能解决一个视觉分析需求的AI能力,包含小模型视觉AI技能、多模态视觉AI技能、大小模型混合视觉AI技能。技能广场包含了丰富的AI技能,覆盖连锁、港口、矿山、石化、电力、水务、钢铁等20+行业,可按需选配。
- 场景模型:场景模型包含了各类一见提供的成熟模型,包含视觉小模型及多模态大模型。
工作空间
- 工作空间:空间是一见技能开发的资源组织单元,不同空间内的数据和资源相互隔离,一个空间内支持设置多种用户角色,空间内的资源在空间成员内共享,一个用户支持创建多个工作空间。
- 技能:技能是「一见」平台面向视觉任务的核心功能单元,通过灵活编排模型推理节点与后处理逻辑节点,实现对图像/视频数据的智能化分析与业务化加工,技能支持发布为公有云API,也支持部署在一见的边缘软硬一体产品上独立或联动云端使用。
- 模型:模型训练模块置多种通用模型训练模板及丰富的场景化训练模板,可通过上传部分场景数据进行快速迭代调优。
- 数据:数据集是用于模型训练的数据管理单元,编辑状态数据集支持人工标注、智能预标注、数据筛选等能力,发布后的数据集不可编辑,用于模型训练及评估测试。数据集支持基于数据湖回流的应用数据自动构建。
数据湖
- 数据湖:数据湖作为一见平台的数据管理底座,负责存储技能开放平台和视觉管理平台应用的所有图像数据(图片/视频),主要用于回流、沉淀高价值的行业场景数据,驱动模型迭代,不断提升应用效果。
评价此篇文章
