AI开发平台 Infinite

AI development platform Infinite

面向数据科学家和AI开发者的端到端开发、部署平台,可一站式完成数据预处理、模型训练与评估、服务部署等工作
AI开发平台Infinite内测期免费,欢迎申请!

产品概述

百度云AI开发平台Infinite是一款端到端的AI开发和部署平台。基于Infinite,用户可以一站式完成数据处理,模型训练与评估,服务部署等工作。平台提供了高性能的集群训练环境,海量算法框架与模型案例,以及操作便捷的预测服务工具,让用户可以专注于模型与算法本身,并得到优质的模型与预测效果。

产品功能

工作区

Jupyter Lab运行环境

在工作区实例中,默认托管了jupyter lab运行环境,您可基于jupyter lab轻松构建深度学习模型并为训练任务做好准备。

为什么要使用 Jupyter Lab:  

  • 数据科学家获得的数据通常不能直接分析,需要数据准备和探索的过程。数据量大,用编程的方式处理数据更有效率。
  • 交互式编辑展示功能,完美契合了数据分析的工作流。
  • Jupyter Lab支持多目录和文件的管理环境, 是Jupyter 向IDE发展的一个版本。

内置PaddlePaddle算法

百度深度学习开源框架,支持机器视觉、自然语言处理、推荐系统等先进算法。PaddlePaddle具有易用性、灵活性、高效性、扩展性等特点,详见官网(http://www.PaddlePaddle.org)。

对象存储BOS支持

Infinite提供了快速链接到您的训练数据所需的功能,您可以轻松浏览和访问在百度对象存储BOS中存储的训练数据。

快速发起作业

在您完成训练任务代码的编辑调试后,可以在jupyter lab页面一键发起作业任务,您的代码内容将被快速拷贝并提交到新建作业页面。

作业管理

PaddlePaddle最新版本

同步更新支持PaddlePaddle最新版本,并基于PaddlePaddle特性做深度兼容定制,最大化提升训练效率及效果。

高性能作业调度

平台采用k8s调度系统,提供丰富的计算资源。目前支持单机单卡GPU训练,近期将支持多机多卡集群训练。

模型增量迭代

支持基于已有模型进行增量迭代,PaddlePaddle已开源丰富的深度学习模型,站在巨人肩膀上走得更远。

第三方软件库

通过引入第三方软件库,支持更灵活,更符合业务需要的模型训练。

预测服务

预测模型库

匹配模型数据和模型运行环境(Container Image), 管理(增/删/改)可部署的预测模型和其版本。

资源管理

为服务端点配置集群资源,监控生产环境中的服务,保证服务可用性的条件下在线变更服务资源。

A/B Test

端点服务支持不同版本模型的上线,从而支持客户对不同版本模型的效果评估。

负载管理

控制流向不同端点的数据流量,为业务中新模型的灰度上线,负载均衡和服务质量控制提供有效机制。

产品定位


工作区
模型训练
预测服务
 需求
  • 公民数据科学家
  • 离线的交互环境
  • 交互模式
  • 关注易用性和使用时长
  • 少量的专家数据科学家
  • 离线的实验室环境
  • 作业模式
  • 关注性能和资源利用率
  • 业务管理及运维人员
  • 面对极大量的应用使用者
  • 在线的生产环境
  • 实时处理
  • 关注性能和资源利用率
痛点
  • 成本高:长期占用高价值资源
  • 软件环境复杂:需要自行配置开发环境和安装软件
  • 示例代码缺乏:不知道开发工作如何逐步开展
  • 成本高&工程复杂:硬件和系统建立复杂,价格高,高性能集群的配置复杂
  • 资产折旧快:技术和系统更新快
  • 资源利用率:每人独占多台物理资源,复用困难,资源利用率低
  • 没有成熟的工具和方法论支持部署
  • 对多个模型版本的运行状态和机制无法有效管理
  • 手工上线部署,过程复杂
  • 新模型部署出错时,无法有效控制
功能
  • “开机即用” 的类IDE开发环境,支持最新发布的Jupyter Lab
  • 工作区环境可以长期保存,秒级重启
  • 提供多种示例代码,供用户参考使用
  • 数据源可以由本地上传至 Jupyter Lab 中,也可直接读取百度云BOS
  • 已经建立的集群训练环境
  • 作业调度,提高资源使用率
  • 即用即付,支持高到低的各种不同的GPU计算类型
  • 预测模型管理
  • 模型上线过程可控,支持灰度发布和流量分配
  • 自动部署模型的配置,出错可以回退

产品优势

快速上手

所有后端资源采用容器技术,可快速启动和释放。Infinite可显著缩短训练、调整和部署深度学习模型所需时间。

一站式开发&部署

通过在控制台进行简单点击或使用API调用,可一站式完成发起训练任务、获取训练模型、启动预测服务工作。


模块间灵活解耦

三个核心服务采用模块式设计,您可同时使用所有模块,也可单独使用其中某一个模块与您现有工作流程对接。

轻松搭建预测服务

模型的自动化部署和灰度测试,提供安全稳定的HTTPS服务端点,您可以基于此服务端点轻松集成预测服务到应用程序中。