数据集

数据集标签页面,包含数据集上传,下载,数据集预处理、可视化,查看,删除等功能。

数据集支持上传本地CSV文件。

限制:本地上传支持1GB以内的CSV文件。

数据列表展示

数据集以分页列表形式展示。

数据集导入

本地文件上传

  1. 点击“导入数据集”按钮,下拉展示导入类型,本地上传弹出浏览器文件选择框,选择csv文件或zip压缩文件,点击“打开”即可开始数据集上传。

    • 本地上传文件类型:
      目前数据集支持上传CSV文件和ZIP压缩文件。
  2. 数据集上传完成会弹出完成提示,并且在数据集列表可见。

对数据集进行预处理操作, 识别数据集schema信息, 指定target列。

也可以对上传成功的数据集进行拆分操作。

为了辅助用户分析数据集,提供了可视化工具。Overview为数据的整体统计分析信息。可按列特征进行排序,或按特征名称筛选展示数据。Dive可选择不同列查看列间的数据分布关系。

文件上传后可以通过“查看详情”查看数据sample。

数据schema详见https://archive.ics.uci.edu/ml/datasets/Beijing+PM2.5+Data#

数据集ID在这个页面上查看,后面会用到此处的ID。

数据集查看

选中需要查看的数据集,点击“查看详情”,会打开一个详情页面,以文本形式显示对应数据集的内容。

数据集操作

选中对应的数据集,点击最右侧的“…”,展开菜单,可以对数据集进行下载、更新、删除和复制ID的操作。

注意:数据集更名时如果修改为非csv后缀,将不会有“查看详情”的功能。