名词解释
TensorFlow
TensorFlow是一个采用数据流图,用于数值计算的开源软件库,广泛应用于各类机器学习算法的编程实现,由谷歌人工智能团队谷歌大脑开发和维护。
PaddlePaddle
PaddlePaddle是百度推出的开源深度学习框架,支持机器视觉、自然语言处理、推荐系统等先进算法。Paddle(Parallel Distributed Deep Learning,并行分布式深度学习),具有易用性,灵活性,高效性,扩展性等特点,详见官网。
BML目前支持Paddle Fluid v1.5深度学习框架。
对象存储BOS
百度对象存储BOS (Baidu Object Storage) 提供稳定、安全、高效以及高扩展存储服务,支持单文件最大5TB的文本、多媒体、二进制等任何类型的数据存储。BML通过BOS访问数据、存储训练结果及日志到指定的BOS地址中,所以在开通BML服务时,需要授权访问用户BOS地址。
Notebook
Notebook提供了内置TensorFlow、PyTorch、Keras、Caffe、Mxnet、Chainer和PaddlePaddle等算法框架的可视化代码运行环境Jupyter,用于进行数据处理及建模。
作业建模
提供高性能的计算环境,用于进行大规模分布式的模型训练及优化。包括深度学习作业、机器学习作业、AutoDL作业、AutoML作业。
预测服务
BML平台提供的模型预测服务功能模块。根据模型应用的需求,合理的配置调度服务资源,搭建部署高可用的在线预测集群服务。
预测模型
预测模型:是部署预测服务所需模型数据、部署镜像及配置逻辑的信息集合。
在线预测
根据用户模型生成的在线api,用户可以通过向api发送请求进行数据预测,也可以通过建立多版本的服务进行小流量实验。
容器镜像
服务运行所需的软件环境,包含OS,基础库,ML框架,预测服务SDK和用户自定义逻辑等。
超级资源码
超级资源码是BML CodeLab云端为每名用户默认生成的唯一认证码,由AK&SK组成,用于在BML CodeLab客户端一键绑定该码对应的全部云端计算资源和存储资源。
共享资源码
共享资源码是在BML CodeLab云端为指定资源生成的授权认证码,由AK&SK组成。用户可以将共享资源码分享给其他用户,被分享者通过BML CodeLab客户端绑定共享资源码,便可拥有该资源码对应的计算资源的共同使用权。
百度资源
百度资源是由百度智能云提供的算力资源。
第三方资源
第三方资源是BML CodeLab接入的,由第三方算力供应商提供的消费级算力资源,当前仅提供GeForce RTX 2080Ti,GeForce RTX 3080等其他GPU类型敬请期待!
Blackhole
Blackhole是百度自研的高性能计算引擎,CodeLab中内嵌了该引擎。Blackhole在Dataframe数据分析、机器学习、SQL查询等场景下,可以对GB到TB级的大数据做分析和训练加速,同时提供用法类似Pandas、Sklearn的易用接口。
API调度
API调度是CodeLab里任务的一种执行方式。用户在CodeLab的任务管理里,新建本地任务和云端任务时,可以选择执行方式为API调度方式。 用户可以在别的机器上,通过curl命令执行带参数的API来运行在CodeLab里创建的任务。
周期调度
周期调度是CodeLab里的任务的一种执行方式。用户在CodeLab的任务管理里,新建本地任务和云端任务时,可以选择执行方式为周期调度方式。周期调度支持使用crontab表达式设置任务执行的周期。任务创建后,将按照预定的周期,自动执行。