Pytorch 1.7.1 Pytorch 训练代码 基于Pytorch框架的MNIST图像分类示例代码,数据集请点击 这里 下载。 单机训练时(计算节点等于1),示例代码如下: import argparse import torch import torch . nn as nn import torch . nn . functional as F import torch . optim
导入已标注数据 目录 导入已标注数据方式说明 从已有数据集导入已标注数据 查看已标注数据 导入已标注数据方式说明 如果您已有标注好的数据,支持快速导入到BML,方便直接进入后续训练环节。 实例分割任务向选定的数据集导入已标注好的数据目前支持一种方式: 将其他数据集已经标注好的数据导入 从已有数据集导入已标注数据 从已有数据集导入已标注数据,支持选择数据集及导入的具体标签进行导入。 查看已标注数据
013-模型评估组件 模型评估组件 二分类评估 评估模块支持计算 AUC、KS 及 F1 score,同时输出数据用于画 PR 曲线、ROC 曲线、KS 曲线、LIFT chart、Gain chart,同时也支持分组评估。 输入 最多可输入4个数据集,用户需要选择原始标签列、预测标签列和正样本标签值,还可以提供scoreColumn获得更多指标。 输出 第一个输出是summary数据集,第二个输
从本地导入模型 在新建版本时可以导入本地模型。 前提条件 已创建模型,且该模型的模型来源为“本地上传”。 操作步骤 在左侧导航栏中选择“模型仓库”>“模型管理”。 在模型列表页中,单击“来源”为“本地上传”的模型所在行的“新建版本”,进入“新建版本”页面。 根据页面提示填写相关信息以及上传文件: 对于图像分类、物体检测在上传文件时以及提交时进行文件校验,如校验出错,请根据提示进行修改。 对于表格数
004-查看特征重要性 对于LR二分类、LR多分类、广义线性回归、XGBoost二分类、XGBoost多分类、XGBoost回归等算子组件,支持 在算子运行成功后 ,查看其重要特征。 实验运行成功后,鼠标右键点击相应的算子组件,如“XGboost多分类“,选择“查看特征重要性”,即可显示前50个重要的特征。 如需查看全部特征的特征重要性指标,可以点击弹框上方的“下载完整内容”,下载完整的特征重要性
005-AutoML(自动调参) AutoML(自动调参) 为了帮助模型达到更精准的效果,平台支持自动调参。支持自动调参的组件有XGBoost二分类、XGBoost多分类、XGBoost回归等等。 点击“AutoML 按钮。 在弹出的“自动调参”页面中,选择对应的算法组件。 在调参配置中,设置数据拆分比例、网格拆分数、参数范围和调参方式等。 设置调参模型的评估标准。 点击“确定”,完成自动调参。
序列标注标注说明 1.标注体系说明 在序列标注任务中,一般会定义一个标签集合,来表示所有可能取到的预测结果。 标签是对字符串的token序列进行的表示: 对于英文字符串而言,token可以是一个单词(e.g. baidu),也可以是一个字符(e.g. b); 对于中文字符串而言,token可以是一个分词后的词语,也可以是单个汉字字符; 当前平台支持主流的IOB、IO、IOE、IOBES四种标注体系
模型训练计费说明 BML平台模型训练模块均已开放计费,支持按量计费(后付费)的计费方式 具体计费规则如下: 未开通付费时,仅支持使用免费额度,免费额度用完即停止训练任务。 开通付费后,优先消耗免费额度,免费额度用完后自动转为按量后付费 按分钟计费,不足1分钟按1分钟计。 预置模型调参与自定义作业模块 在任务结束后统一扣费,任务运行中欠费不会中断任务。 Notebook 启动后实时计费,请保证账户余
007-异常检测算法 异常检测算法 IsolationForest 在高维数据集中实现异常值检测的一种有效方法是使用随机森林。隔离森林(IsolationForest)通过随机选择特征然后随机选择所选特征的最大值和最小值之间的分割值来隔离观测。 由于递归划分可以由树形结构表示,因此隔离样本所需的分割次数等同于从根节点到终止节点的路径长度。 在这样的随机树的森林中取平均的路径长度作为决策量度。 随机
文字识别任务简介 文字识别模型类型 文字识别模型即是常说的OCR模型,预置模型调参目前提供了通用的全文本识别场景,可以应对常规的文字识别任务,且支持多种文字。 文字识别模型应用场景 纸质文档电子化 通用文字识别模型支持针对多语种的纸质文档进行电子化,开发者可以采集文档图片并标注,对模型进行训练,从而实现纸质文档的自动电子化,提升工作效率。 图像转文字 通用文字识别模型支持识别图像上的文字,开发者可