使用智能标注,可以通过提供少量人工标注数据和未标注数据,通过智能标注能力进行自动标注,或使用现有的模型对新增的数据进行预标注,辅助您快速完成数据标注工作,并将数据用于模型的训练。 模型训练 数据准备工作完成后,选择物体检测任务类型,点击创建模型,根据您的实际需求对模型进行命名。
产品介绍 功能介绍 EasyDL文字识别,可定制识别图片中的文字信息,结构化输出关键字段内容,极大提升OCR模型训练效率,满足个性化卡证票据识别需求 数据标注 创建数据集并上传真实图片,定义数据识别字段作为标注标签,在图片中框选对应的 Key/Value 内容区域,自动识别框选区域内容完成转写,标注人员对识别结果进行查验纠正即可完成标注 数据生成 基于已标注数据,将图中已框选 Value 区内容进行抹除
EasyDL OCR介绍 功能介绍 EasyDL文字识别,可定制识别图片中的文字信息,结构化输出关键字段内容,极大提升OCR模型训练效率,满足个性化卡证票据识别需求 数据标注 创建数据集并上传真实图片,定义数据识别字段作为标注标签,在图片中框选对应的 Key/Value 内容区域,自动识别框选区域内容完成转写,标注人员对识别结果进行查验纠正即可完成标注 数据生成 基于已标注数据,将图中已框选 Value
现阶段主要依赖人工进行分类后建立数据底库的形式来建设功能应用,其中耗费的人力成本过高,且识别效果不理想。某电商企业希望通过建立AI图像分类的能力来实现以图搜商品、商品自动分类等应用。 业务难点 AI模型的训练需要有图片对应标注的数据集,海量的鞋品图片需要进行标注,成本高,且人工标注效率低。模型效果调优周期长,需要反复添加数据进行模型迭代,效率低下。
导入时,可以导入无标注信息 00.摘要生成-未标注数据-压缩包导入.zip 或有标注信息 sample-text-dialog-unsort-annotated-train-训练样本700条.jsonl.zip 八、SFT 先新建任务 然后新建一个SFT运行任务,采用上面导入的已标注数据 九、RLHF RLHF分为两个步骤,奖励模型训练+强化学习训练, 奖励模型训练 使用 已排序标注数据 进行奖励模型的训练
导入时,可以导入无标注信息 00.摘要生成-未标注数据-压缩包导入.zip 或有标注信息 sample-text-dialog-unsort-annotated-train-训练样本700条.jsonl.zip 八、SFT 先新建任务 然后新建一个SFT运行任务,采用上面导入的已标注数据 九、RLHF RLHF分为两个步骤,奖励模型训练+强化学习训练, 奖励模型训练 使用 已排序标注数据 进行奖励模型的训练
识别错误图片示例 通过分标签查看模型识别错误的图片,直寻找其中的共性,进而有针对性的扩充训练数据;或发现是标注错误,从而直接点击修改标注来将标注修正 如下图所示,可以通过勾选「误识别」、「漏识别」来分别查看两种错误识别的情况: 误识别:红框内没有目标物体(准备训练数据时没有标注),但模型识别到了目标物体 观察误识别的目标有什么共性:例如,一个检测电动车的模型,把很多自行车误识别成了电动车(因为电动车和自行车外观上比较相似
图中物体检测定位等,适用于图片内容检索、安防监控、工业质检等场景 EasyDL 文本: 定制基于文心大模型的语义理解AI模型,提供一整套文本定制与应用能力,适用于文本内容审核、文本自动生成、留言分类、电商评价打分等场景 EasyDL 语音: 定制语音识别模型,精准识别业务专有名词,适用于数据采集录入、语音指令、呼叫中心等场景,以及定制声音分类模型,适用于区分不同声音类别等场景 EasyDL OCR:
创建及导入数据集 1、在官网界面点击【数据总览】,进入数据集操作界面,点击【创建数据集】。 2、进入创建数据集界面,填写相关信息,选择数据和标注类型(注意训练集、验证集、测试集需要分开创建)。 3、数据集创建完成后,可以在数据总览界面看到刚才创建好的数据集ID,点击【导入】,将自己要训练的数据集导入。 以本地导入-上传压缩包为例:导入方式选择【本地导入】,选择标注格式,点击【上传压缩包】。
识别错误图片示例 通过分标签查看模型识别错误的图片,直寻找其中的共性,进而有针对性的扩充训练数据;或发现是标注错误,从而直接点击修改标注来将标注修正 如下图所示,可以通过勾选「误识别」、「漏识别」来分别查看两种错误识别的情况: 误识别:红框内没有目标物体(准备训练数据时没有标注),但模型识别到了目标物体 观察误识别的目标有什么共性:例如,一个检测电动车的模型,把很多自行车误识别成了电动车(因为电动车和自行车外观上比较相似