名词解释

TensorFlow

TensorFlow是一个采用数据流图,用于数值计算的开源软件库,广泛应用于各类机器学习算法的编程实现,由谷歌人工智能团队谷歌大脑开发和维护。

PaddlePaddle

PaddlePaddle是百度推出的开源深度学习框架,支持机器视觉、自然语言处理、推荐系统等先进算法。Paddle(Parallel Distributed Deep Learning,并行分布式深度学习),具有易用性,灵活性,高效性,扩展性等特点,详见官网

Infinite目前支持Paddle Fluid v1.4深度学习框架。

对象存储BOS

百度对象存储BOS (Baidu Object Storage) 提供稳定、安全、高效以及高扩展存储服务,支持单文件最大5TB的文本、多媒体、二进制等任何类型的数据存储。Infinite通过BOS访问数据、存储训练结果及日志到指定的BOS地址中,所以在开通Infinite服务时,需要授权访问用户BOS地址。

工作区

工作区提供了内置PaddlePaddle、TensorFlow和PyTorch等算法框架的可视化代码运行环境Jupyter,用于进行基础数据处理及训练作业创建。

作业管理

提供高性能的计算环境,用于进行大规模分布式的模型训练及优化。包括深度学习作业、机器学习作业、AutoDL作业、AutoML作业。

每位用户在公共集群(免费试用)资源上最多同时支持3个作业(包括4种类型作业)在排队或运行。

预测服务

Infinite 平台提供的模型预测服务功能模块。根据模型应用的需求,合理的配置调度服务资源,搭建部署高可用的在线预测集群服务。

预测模型

预测模型:是部署预测服务所需模型数据、部署镜像及配置逻辑的信息集合。

模板配置

模板配置:是定义预测服务运行内容的一组配置信息。
模版配置信息包括选择使用预测模型、每个模型配置版本需要的资源类型(例如:GPU或CPU 套餐)、计划部署的实例数量、和模型配置版本间的流量配比。预测服务可以使用多个版本的模型,实现流量分流和A/B Test。

端点

端点:根据模板配置信息部署的一个在线预测服务的实体单位。端点完成创建发布,则可生成提供一个在线实时访问的服务url,提供预测服务。

容器镜像

服务运行所需的软件环境,包含os,基础库,ML框架,预测服务SDK和用户自定义逻辑等。