百度数据科学平台

    数据集

    数据集标签页面,包含数据集上传,下载,数据集预处理、可视化,查看,删除等功能。

    数据集支持上传本地CSV文件。

    限制:本地上传支持1GB以内的CSV文件。

    数据列表展示

    数据集以分页列表形式展示。

    数据集导入

    本地文件上传

    1. 点击“导入数据集”按钮,下拉展示导入类型,本地上传弹出浏览器文件选择框,选择csv文件或zip压缩文件,点击“打开”即可开始数据集上传。

      • 本地上传文件类型:
        目前数据集支持上传CSV文件和ZIP压缩文件。
    2. 数据集上传完成会弹出完成提示,并且在数据集列表可见。

    对数据集进行预处理操作, 识别数据集schema信息, 指定target列。

    也可以对上传成功的数据集进行拆分操作。

    为了辅助用户分析数据集,提供了可视化工具。Overview为数据的整体统计分析信息。可按列特征进行排序,或按特征名称筛选展示数据。Dive可选择不同列查看列间的数据分布关系。

    文件上传后可以通过“查看详情”查看数据sample。

    数据schema详见https://archive.ics.uci.edu/ml/datasets/Beijing+PM2.5+Data#

    数据集ID在这个页面上查看,后面会用到此处的ID。

    数据集查看

    选中需要查看的数据集,点击“查看详情”,会打开一个详情页面,以文本形式显示对应数据集的内容。

    数据集操作

    选中对应的数据集,点击最右侧的“…”,展开菜单,可以对数据集进行下载、更新、删除和复制ID的操作。

    注意:数据集更名时如果修改为非csv后缀,将不会有“查看详情”的功能。

    上一篇
    项目
    下一篇
    文件