文字识别任务简介 文字识别模型类型 文字识别模型即是常说的OCR模型,预置模型调参目前提供了通用的全文本识别场景,可以应对常规的文字识别任务,且支持多种文字。 文字识别模型应用场景 纸质文档电子化 通用文字识别模型支持针对多语种的纸质文档进行电子化,开发者可以采集文档图片并标注,对模型进行训练,从而实现纸质文档的自动电子化,提升工作效率。 图像转文字 通用文字识别模型支持识别图像上的文字,开发者可
006-组件列选择 在选择特征列或标签列时,支持单独勾选与批量选择的方式选择数据列,支持搜索查找数据列。 当需要选择的数据列比较少时,可以直接勾选数据列进行选择。 当数据列比较多时,点击【批量操作】后,选择需要的数据列,将数据列从左侧列表移动到右侧列表,点击确定即可, 数据列已经按照字段类型进行了分类 。 如果只需要在大量数据列中找某个数据列,则可以使用搜索查找,直接在搜索框输入字段信息即可。
yaml文件编写规范 yaml文件编写规范 如下所示是进化算法pbt的yaml文件配置示例: yaml文件中主要分为四大部分: 搜索算法参数: algo:指定选择的搜索策略,下表为各种搜索算法对应的字段。 搜索策略 英文字段 随机搜索 RANDOM_SEARCH 贝叶斯搜索 TPE_SEARCH 进化算法 PBT_SEARCH 进化-CMAES CMAES_SEARCH 粒子群算法 PARTICL
Sklearn 0.23.2 Sklearn sklearn框架下,自定义作业支持发布保存模型为 pickle 和 joblib 格式,并且在发布至模型仓库时需要选择相应的模型文件。使用下面代码进行模型训练时,训练程序可以自行加载数据,训练数据选择空文件夹即可。 pickle格式模型示例代码: # -*- coding:utf-8 -*- sklearn train demo im
预置模型调参简介 在BML中,面向初级的AI开发者提供了预置模型调参建模方式。在该方式下,开发者无需关注构建模型的代码细节,而只需要选择合适的预训练模型以及网络即可。对于系统预置的可配置网络参数,可以适用于大部分场景,开发者也可以根据自己的经验进行调整,以获得更适合特定场景的模型。 预置模型调参支持视觉和自然语言处理两大技术方向: 技术方向 类型 视觉 图像分类 物体检测 实例分割 自然语言处理
004-查看特征重要性 对于LR二分类、LR多分类、广义线性回归、XGBoost二分类、XGBoost多分类、XGBoost回归等算子组件,支持 在算子运行成功后 ,查看其重要特征。 实验运行成功后,鼠标右键点击相应的算子组件,如“XGboost多分类“,选择“查看特征重要性”,即可显示前50个重要的特征。 如需查看全部特征的特征重要性指标,可以点击弹框上方的“下载完整内容”,下载完整的特征重要性
如何发布私有API 训练完毕后,可以在左侧导航栏中找到【EasyEdge本地部署】,选择通用【服务器】,点击【发布新服务】,进入发布界面。 step1.部署方式选择服务器,集成方式选择私有API后,选择需要发布的模型及版本,上传指纹文件,勾选业务场景需要的操作系统与硬件芯片。设置完毕点击下一步 step2. 填写完基本信息之后,点击 提交 ,即可申请将模型封装成可离线计算的部署包,申请通过后,即可
表格预测任务简介 脚本调参支持多种表格预测任务,训练得到的模型可以应用到广泛实际场景中。 表格预测模型类型 表格预测帮助用户通过机器学习技术发现已有数据中的规律,从而创建机器学习模型,并基于机器学习模型处理新的数据,为业务应用生成预测结果。脚本调参中提供的表格数据预测支持创建回归、二分类、多分类三种类型的机器学习模型。 回归:目标列是连续的实数范围,或者属于某一段连续的实数区间。如在销量预测场景中
超参数配置参考 超参来源 目前BML脚本调参任务类型支持三种方法配置任务中网络的超参数,你可以沿用「脚本编辑」中设定的超参数,为获取更高的模型精度,也可以选择「自动超参搜索」对网络的超参数进行搜索。选择「已有超参搜索结果」时,可以在预训练模型和预训练网络相同的任务中,复用自动超参搜索结果,高效地训练出高精度模型。 自动超参搜索 在超参搜索的过程中,由于模型复杂、计算成本很高,且每个超参数都有较大的
Pytorch 1.7.1 Pytorch 训练代码 基于Pytorch框架的MNIST图像分类示例代码,数据集请点击 这里 下载。 单机训练时(计算节点等于1),示例代码如下: import argparse import torch import torch . nn as nn import torch . nn . functional as F import torch . optim