百度数据科学平台

    FORM表单建模方式:预测PM2.5

    导入数据集

    1. 复制数据ID。

    2. 点Import Files,在search框中输入 jarvis://粘贴数据ID

    3. 点『Import』按钮。

    数据解析

    1. 数据导入以后,点击『parse these files』。

      在交互表单上,可以选择解析本文件的分隔符、首行处理方法,也可以设置每列的数据类型。

    2. 操作完毕后,点击左下方『Parse』。

      说明:数据处理和探查中,有很多搜索功能,例如输入”y”可以快速搜索到相关列。

    数据探查

    1. 『Parse』完毕后,点击『View』可以对数据做多方位探查。

    2. 点击某列『pm2.5』可以查看数据详细信息。

      也可以对数据做填充处理:点击上图中action -> 『Impute』。然后选中需要处理的列『colume』,选择Group By(可以多选,按着mac上的command/windows的ctrl 再选择)。例如下图是按year&month&lws GroupBy后求均值来填充空值。

    数据切分

    可以调节切分比例,下图使用75%训练集,25%测试集。

    建模

    1. 选择数据集,点击『build model』建立模型。

    2. 填写必要的模型参数,点最下方『build model』开始建模。

    3. 训练完毕后,可以常看模型的各种信息:训练过程、结果、特征重要性等。可以分析在验证集上的结果。

    批量预估及模型导出

    1. 点击Model图中的『download』可以下载模型,点击『predict』可以进行模型预估。

    2. 点击Model图中的『export』可以导出模型到项目。

    在线服务部署

    点击『部署』按钮,可以一键部署到IntelliS线上服务。

    Form建模其他常见命令

    任何时候,输入assist,然后运行(shift+enter) 可以提示命令集。

    也可以使用上方的菜单:

    • 列出所有的数据:List all frames
    • 列出所有的任务:Jobs
    • 列出所有的模型:List all models

    右侧工具栏中,FLOWS可以查看所有的建模文件。启动时可以加载历史文件。

    Outlines可以查看建模的workflow,可以显示宏观步骤,也可以对此快捷键操作(例如dd可以删除):

    一篇
    JUPYTER代码建模流程:预测PM2.5
    一篇
    使用百度PADDLEPADDLE建模:波士顿房价预估