导入Prompt+图片数据
更新时间:2025-05-15
登录到千帆ModelBuilder操作台,在左侧功能列选择通用数据集,进入主任务界面。
数据格式说明
Prompt+图片:文生图对话数据,文本提问与图片回答一一对应。适用于模型精调的SFT文生图大模型训练。
 
- 无标注数据集:数据集中仅包含图像生成结果。
平台支持上传无标注样例,您可在平台上进行数据标注,标注方式包括在线标注/多人标注。只有标注完成的数据集,才能被发布并用于训练。
- 有标注数据集:数据集中图像和对应的标注文件一一对应,注意同一样本的图片和标注文件(生成图片的prompt)文件名需要相同。
                JSON
                
            
            1"prompt":"一只肥胖的橘猫趴在太阳下,闭着眼睛伸懒腰,需要动漫风格。"数据文件要求
| 文件类型 | 格式要求 | 
|---|---|
| 图片 | 
  | 
| 标注文件(生成图片的prompt) | 
 | 
数据导入方式
创建数据集完成后,在数据集管理页面中,找到该数据集,点击右侧操作列下的“导入”按钮,即可进入导入数据页面。

您可以使用以下方案上传数据集:本地导入、BOS导入、分享链接导入、平台已有数据集。在相同的导入方式下,平台对于文件大小及数量的限制,与您选择的存储类型有关。
| 导入方式 | 存储类型:对象存储BOS | 存储类型:平台共享存储 | 
|---|---|---|
| 本地导入 | 
   | 
   | 
| BOS导入 | 
   | 
   | 
| 分享链接导入 | 
   | 
   | 
| 平台已有数据集 | 
 | 
 | 
个人账户图片数据集总数限制:≤10万张,需扩容可提交工单。

