百度数据科学平台

    JUPYTER代码建模流程:预测PM2.5

    以下是基于Jarvis2.0平台,完成PM2.5值指标预测的步骤。

    数据集准备

    使用UCI开源数据集,https://archive.ics.uci.edu/ml/machine-learning-databases/00381/

    目前Jarvis平台不支持远程数据上传,请在https://archive.ics.uci.edu/ml/machine-learning-databases/00381/ 链接中下载对应数据。

    数据相关说明详见https://archive.ics.uci.edu/ml/datasets/Beijing+PM2.5+Data#

    新建项目

    在Jarvis项目列表页新建属于你自己的项目。

    数据集上传

    1. 选择下载的数据进行上传

    2. 对数据集进行预处理操作, 识别数据集schema信息, 指定target列

    3. 也可以对上传成功的数据集进行拆分操作

    4. 为了辅助用户分析数据集,提供了可视化工具

    5. 文件上传后可以通过“查看详情”查看数据sample。
      数据schema详见https://archive.ics.uci.edu/ml/datasets/Beijing+PM2.5+Data#

      数据集ID在这个页面上查看,后面会用到此处的ID。

    文件中生成并运行代码

    此处为演示需要,直接用了一个已经完成的PM2.5预测代码。

    查看生成的模型

    通过工作区的上述步骤后,模型已经成功导出到模型服务器。

    导出的模型在“模型页”查看。

    可以把修改的代码,『同步』到Git代码库。如果有冲突,可以先『拉取』最新版本,再『同步』。

    一篇
    操作指南
    一篇
    FORM表单建模方式:预测PM2.5