【Sugar BI 预测服务】快速通过机器学习,进行数据预测分析

作者:xxinjiang2023.05.30 15:42浏览量:3046

简介:Sugar BI 作为对数据进行分析的可视化平台,支持用户对自己的数据使用机器学习算法进行探索试分

什么是预测服务?

机器学习是一门关于数据学习的科学技术,它能帮助机器从现有的复杂数据中学习规律,以预测未来的行为结果和趋势。

Sugar BI 作为对数据进行分析的可视化平台,也支持用户对自己的数据使用机器学习算法进行探索试分析和趋势预测。

预测服务包含以下三种:

  • 一种是内置预测服务,包含一些常用的分类算法和回归算法。
  • 一种是训练预测服务,用户可以使用机器学习平台选择更丰富的算法来训练模型并发布为服务,在数据模型中的预测服务中使用。
  • 还有一种是BML/EasyDL 预测服务,用户可以使用 BML 或 EasyDL 提供的表格数据在线预测服务 API 来进行数据预测。

内置预测服务在 SaaS 高级版和多账号版本(非 2 账号版本)的私有部署中支持。训练预测服务在开启智能预测功能的私有部署中支持。BML/EasyDL 预测服务在 Saas 高级版支持,私有部署版本中则和训练预测服务一致,需要有开启智能预测功能的 License。

如何新建预测服务?

在数据模型的编辑页面,可以通过新建预测服务按钮来创建预测服务。弹出的配置界面中包括内置,BML/EasyDL和训练三种预测服务类别,下面会分别介绍。
25139bb36a3cfa4e.png

对于报表和大屏,也可以像计算字段一样,选中图表,即可建立页面级别的预测字段。
ad3fb17dd6c50ad2.png

内置预测服务

内置预测服务提供了两大类算法,分类和回归。分类包括:K-MEANS,DBSCAN。回归包括:线性回归,指数(e)回归,对数(ln)回归,幂函数回归,多项式回归,决策树回归。

分类算法
以K-MEANS 为例,配置如下:
37372affedf1f95a.png

  • 配置参数
    聚类个数: 将数据分为几类,最少为 2。
    最大迭代次数: 将数据迭代运算多少次,为保证性能最多为 10。
    初始中心点: 初始中心点的选择方式,包括固定前 K 个点、固定后 K 个点、kmeans++算法计算、随机选择。

输入设置中选择要进行计算的度量,最多可以选择五个。
最后设置输出的维度信息即可。

回归算法

以线性回归为例,配置如下:
d565065fcae1c81d.png

  • 配置参数
    增强鲁棒性: 提升算法的稳定性,但会存在数据是奇异矩阵(matrix is singular)的情况,这种情况下,需要关闭该参数。
  • 输入设置中设置函数的自变量和因变量。
  • 最后设置输出的度量信息即可。

训练预测服务

训练预测服务在开启智能预测功能的私有部署中支持,需要购买包含智能预测功能的 License,SaaS 版本暂不支持。

训练预测服务可以根据您的数据使用 AutoML 或指定的算法训练出模型然后发布为预测服务,并应用在数据模型中对新数据进行预测,模型的训练和发布请参考模型训练。

这里说明下训练好的预测服务如何应用在数据模型中,与内置预测服务一样,点击「新建预测服务」进行添加:
e722c63f1690ca38.png
根据预测服务所属的模型类别在预测服务列表里选择需要的预测服务:
27f378f164ecaa37.png

如果在列表中没有找到服务,请检查是否已从模型训练中将模型发布为了预测服务
选择好预测服务后,需要将数据模型中的字段和预测服务所需的输入字段进行绑定:
7bf53d8a9ea041c0.png

系统会自动识别名称和数据类型相同的字段自动进行绑定,如果有不准确和遗漏的可以进行手动调整。

预测服务的输出字段会作为新的字段被添加到数据模型中。对于分类模型的服务来说,输出预测标签和预测概率;对于回归模型的服务来说,输出预测值。

这里可以修改输出字段的名称:
e08c4cabbde55f15.png

BML/EasyDL 预测服务

BML/EasyDL 预测服务在 Saas 高级版支持,私有部署版本中则和训练预测服务一致,需要有开启智能预测功能的 License。

BML/EasyDL 预测服务,用户可以使用 BML 或 EasyDL 提供的表格数据在线预测服务 API 来进行数据预测。

首先在预测服务的管理页面新建 BML/EasyDL预测服务。
1f4bbfd90efd8bd2.png

在弹出的对话框中,设置必要的参数。

  • 预测服务来源,即预测服务发布平台的来源是 BML 还是 EasyDL。
  • 预测服务地址,填写的是您在 BML/EasyDL 发布的在线预测服务的 API 地址。
  • QPS/TPS,QPS/TPS 指的是预测服务的每秒查询率,对于公有云的预测服务会有相应的 QPS 值,对于私有云的预测服务有相应的 TPS 值。请填写对应服务的 QPS/TPS 值。
  • 模型类别,指的是发布预测服务所以依赖的预测模型类别,包括二分类、多分类和回归,与模型训练所产出的模型类别是一致的。
  • 选择 API 认证,对于公有云的预测服务可以使用『BML/EasyDL AK/SK 认证(公有云)』或『自定义 API 换 token』方式来进行认证,对于私有云的预测服务依据服务调用方式可以是『无认证』、『BML/EasyDL AK/SK 认证(私有云)』和『Access Code』方式。如果您的预测服务需要进行 API 认证,请在API 认证中新建对应的认证逻辑。
  • 输入设置,需要配置此预测服务所依赖的输入字段。
  • 输出设置,对于分类模型的服务来说,输出预测标签,可以勾选是否需要预测结果概率;对于回归模型的服务来说,输出预测值。

947d7e41d8219ca4.png

设置完成后,可以测试预测服务是否可以正常使用,下图是我们配置的 EasyDL 的多分类预测服务,其中 QPS/TPS 值为 10,(注意注意注意:这是在 BML/EasyDL 平台发布预测服务的时候,给服务设置的 TPS 值,这个值并不是随便填写的,一定要和预测服务所以提供的的一致),选择认证的方式是将 Access Code 值放在 URL 来进行验证。

8bd2adfd49aa4b48.png

建立好的 BML/EasyDL 预测服务与训练预测服务的使用一致,在数据模型的编辑页面,「新建预测服务」,然后在「预测服务类别」这里选择 BML/EasyDL 即可。绑定要使用的预测服务,设置好输入输出字段即可。

76758d31b2b871ee.png

验证新建的预测服务

设置完成后可以看到数据模型中相应的配置,带有 M(machine learning) 标志的表示该字段是预测服务生成的字段。
24231abeebb573c5.png

在相应的文件夹上右键可以新增、修改、删除预测服务。
5cb68334f1af8f37.png

点击查看数据,即可看到数据的预测结果。
9ed45b0da8640d27.png

页面级的预测服务添加完成后,会在相应的维度和度量区域中添加预测字段,同样在文件夹上右键可以修改、删除预测服务。
32be27423ea30137.png

预测服务在图表中使用

预测字段在图表中使用和其他字段一样,直接拖入即可。
图片.jpg

对于内置预测服务,如果需要对算法的参数进行快速的调整,可以直接在字段上右键「修改预测服务」。需要注意的是,算法的切换只能同类型进行切换,例如:K-MEANS 切换为 DBSCAN。
169054f3329b3abc.png