输出数据集

在完成输入数据源后,需将训练数据ID化,生成BML内部通用的数据单元:数据集Dataset。一份训练数据只需要执行一次预处理,就可以应用BML中所有的算法训练模型,并可以多次训练,直到找出最优的模型。具体如下:

  1. 拖拽左侧导航的“输出数据集”至画布中,点击该数据集,在右侧“参数配置”区输入数据集名称。
  2. 若数据源为BML专属格式数据,连接“输入数据源”与“输出数据集”并点击右上方的运行按钮开始输出数据集;若数据源为CSV/TSV格式的数据,且经过数据处理组件处理了,则连接组件与“输出数据集”并点击右上方的运行按钮开始输出数据集。
  3. (可选)保存当前的数据集为实验,以便后期复用,请点击页面上方的保存图标,则该数据集保存至实验列表,可在实验列表页通过实验名称查找该实验。
  4. 输出数据集创建成功后可至“产品服务>百度机器学习BML-数据集列表”中查看生成的数据集。
  5. 如需查看数据集详情,请点击数据集名称。数据集详情如下: