导入其他厂商模型服务 在千帆Agent开发平台中,支持通过标准化接口接入其他云厂商或模型提供方的模型服务,从而实现跨平台模型资源的调用。 接入的第三方厂商接入的模型服务本身需兼容OpenAI SDK或Anthropic SDK接口类型。可在千帆平台中各个模型选择的入口完成导入及选择,例如自主规划Agent中的规划/问答/追问模型等选择入口。
3、选择新的数据源 如果导入文件中的报表和大屏中用到了数据库类型的数据源,您需要选择这些数据源在目标报表空间中对应的新数据源。如果没有,您需要在报表空间中先创建好新的对应数据源后再进行导入操作。
为了解决这个问题, DBSC 提供了强大的数据导入功能,帮助用户轻松地将大量的数据从文件中导入到目标数据库中。 功能介绍 DBSC 的数据导入功能可以帮助用户将包含大量数据的文件导入到目标数据库中。
平台已有数据集 支持选择相同数据格式的非空数据集版本。 支持选择相同数据格式的非空数据集版本。 FAQ挖掘 基于导入文档通过大模型服务自动挖掘生产问答对,需配置服务及应用。大模型挖掘问答对数量取决于您的语料文档字符数量。平均而言,每2000字符大约可挖掘出10个问答对。
导入Prompt集数据 登录到 千帆ModelBuilder操作台 ,在左侧功能列选择 通用数据集 ,进入 训练数据集 主任务界面。 数据格式说明 Prompt集:仅含用户提问、不含模型回答的文本数据集。适用于模型蒸馏,将作为输入数据源,批量请求教师模型生成蒸馏数据。
导入Prompt+Chosen+Rejected数据 登录到 千帆ModelBuilder操作台 ,在左侧功能列选 通用数据集 ,进入主任务界面。 数据格式说明 Prompt+Chosen+Rejected:单轮或多轮的文本对话数据,每个提示词存在对应的正负偏好回答。适用于模型精调的DPO直接偏好优化或SimPO简单偏好优化,为显现训练效果,推荐数据量至少100条。
导入Prompt+Chosen或Rejected数据 登录到 千帆ModelBuilder操作台 ,在左侧功能列选 通用数据集 ,进入主任务界面。 数据格式说明 Prompt+Chosen/Rejected:单轮或多轮的文本对话数据,每个提示词存在对应的正或负偏好回答。适用于模型精调的KTO训练,为显示训练效果,推荐数据量至少100条。
导入纯文本数据 登录到 千帆ModelBuilder操作台 ,在左侧功能列选 通用数据集 ,进入主任务界面。 数据格式说明 纯文本:特定领域的大规模无标注数据。适用于模型精调的Post-pretrain自监督预训练,作为后续Post-pretrain的训练输入,推荐数据量至少10亿tokens,如需试用,则推荐1千万tokens及以上的数据量,凸显训练效果。
工具调用场景包括信息检索、数据库操作、知识图谱搜索与推理、操作系统、触发外部操作等。 使用包含工具调用的样本进行精调,可以让模型学习到更准确且稳定的工具调用方式和输出结果。工具调用场景的精调数据样本需要同时包含:1. tools (list, optional) 工具列表描述工具功能;2. messages (list, required) 对话列表说明期望的工具调用方式和输出结果。
导入Prompt+图片数据 登录到 千帆ModelBuilder操作台 ,在左侧功能列选择 通用数据集 ,进入主任务界面。 数据格式说明 Prompt+图片:文生图对话数据,文本提问与图片回答一一对应。适用于模型精调的SFT文生图大模型训练。 无标注数据集:数据集中仅包含图像生成结果。 平台支持上传无标注样例,您可在平台上进行数据标注,标注方式包括在线标注/多人标注。