在BIE控制台部署从AI中台下载的模型
本文介绍如何将BML训练的模型,通过BIE下发至边缘节点。
前提条件
- 有一个可用的测试边缘节点设备,本案例使用一个2核8G的BCC云服务器作为测试设备。
- 按照快速入门教程,将测试边缘节点连接云端。
- 该模型是CPU模型,边缘节点Docker Runtime不能使用
nvidia
,必须使用runc
。 - 该模型使用的tensorflow版本依赖avx指令,无该指令的盒子将无法运行该模型,建议更换模型或采用更高规格的边缘盒子。模型运行具体报错如下: 通过命令 more /proc/cpuinfo | grep flags 可查看cpu支持的指令集。
BML介绍
BML是百度全功能AI开发平台,提供一站式人工智能模型建设功能服务集。面向用户同时提供机器学习和深度学习环境,实现从数据源管理、数据标注,数据集存储、数据预处理、模型训练生产到模型管理、预测推理服务管理、全服务监控等AI建设全工作周期的服务能力。
从BML模型仓库下载模型
打开BML控制台,进入到模型仓库->模型列表,在模型列表当中找到样例模型ve_mnist,如下图所示:
ve_mnist是一个手写字识别的模型,能够识别0~9的数字。点击ve_mnist,查看模型详情,在右上角点击下载,获得模型文件tf_mnist.zip,如下图所示:
将模型上传对象存储
本案例使用minio作为对象存储,将 tf_mnist.zip 这个模型压缩包上传至Minio的model-upload目录当中,如下图所示:
tf_mnist.zip文件的MD5值为:
1879eae40da840465c90afca70787885
,这个在后续创建模型文件配置项时会用到。
在BIE当中创建模型文件配置项
打开BIE控制台,进入到配置管理,在配置项tab页点击创建配置项,在弹出框中填写如下内容:
- 名称:tf-mnist-model
- 描述:可选
- 配置项:选择引入文件,填写上一步当中tf_mnist.zip在对象存储当中的信息。
创建AI应用并下发
创建应用
打开BIE控制台,进入应用部署,点击创建应用,填写应用名称:tf-mnist-app,描述可为空,如下图所示:
然后点击下一步,进入到服务配置,此处可以不做任何修改。再点击下一步,进入到目标节点,此处也不做任何修改,直接点击创建,这样一个边缘应用创建完毕。
添加服务
在应用部署列表界面,打开tf-mnist-app应用,点击添加服务,在弹出框当中填写服务信息。如下图所示:
-
基本信息
- 服务名称:mnist-prediction
- 服务镜像地址:hub.baidubce.com/aiot/tensorflow-serving:1.15-gpu-4.2
-
卷配置
- 卷名称:tf-minist-model
- 类型:配置项
- 参数:从下拉框当中选择前面创建的AI模型配置项,tf-minist-model
- 容器目录:/home/bml/model,可以任意目录,但是需要与环境变量当中的
MODEL_PATH
保持一致。 - 读写权限:读写
-
端口映射
- 宿主机端口:8010
- 容器端口:8010
- 协议:TCP
-
环境变量
- MAX_BATCH_SIZE: 1000
- MODEL_SOURCE_TYPE: local
- SERVING_CONSTRANT: predict
- BATCH_TIMEOUT_MICROS: 0
- MAX_ENQUEUED_BATCHES: 10
- NVIDIA_VISIBLE_DEVICES: none
- MODEL_PATH: /home/bml/model
- MODEL_TYPE: TFSERVING
- MODEL_NAME: tf-serving
- MODEL_PROTOCOL: pb/pbtxt
- OUTPUT_NODES:
- LANG: en_US.UTF-8
- INPUT_NODES:
- DEPLOY_ENV: private
-
其他配置
- 使用默认项
设置目标节点
在tf-mnist-app的应用详情界面,设置目标节点,如下图所示,通过标签匹配到bcc-node这个边缘节点,设置标签以后,应用自动部署。部署完毕以后,部署状态为已部署
验证边缘AI服务
准备测试数据
通过SSH登录到边缘节点,新建一个test.json文件,在测试文件当中填入测试数据,可以通过以下命令完成。
# 创建test.json
sudo vim test.json
# 输入以下内容
{"instances": [{"images}], "signature_name": "predict_images"}
调用AI服务
在准备好测试数据以后,我们需要找出AI服务对外的ip地址,然后通过curl
命令调用http服务,可以通过以下命令完成。
kubectl get pod -A -owide
curl 10.42.0.21:8010/v1/models/tf-serving:predict -X POST -d@test.json
# 因为前面做了端口映射,所以也可以直接用127.0.0.1这个地址访问服务
curl 127.0.0.1:8010/v1/models/tf-serving:predict -X POST -d@test.json
最终执行结果如下图所示:
如上图所示,给出了测试数据从0~9的概率,其中为7的概率是0.99597472,可以对上述输出结果做二次处理,然后直接返回结果7。
具体mnist数据可以参考官网。