核心概念
更新时间:2025-04-22
数据处理相关
工作流
通过编排数据处理任务和各种计算资源,以实现多模态数据处理的完整过程。
计算资源
包含常驻资源、Serverless资源两种类型。
数据管理相关
数据目录(Catalog)
是组织和管理资产的层级结构(资产包括数据、模型、算子),提供跨工作空间的细粒度授权、审计和数据发现能力。
数据模式(Schema)
用于管理资产的最小集合,类似于传统的数据库。
数据卷(Volume)
用于存储和管理非结构化数据。
数据表(Table)
用于存储和管理结构化数据。
算子(Operator)
一段可以被重复调用的代码块,用于执行特定的任务或操作。
数据开发相关
工作空间
是实现多团队协同,数据管理、数据开发、数据处理的协作空间,完成数据工程、数据科学、数据分析的工作。
文件管理
类似操作系统的文件系统,有目录管理和文件编辑,用户可以新建、上传和管理工程文件和类库等。
