txt文件 对话生成的数据序列格式要求为 prompt 。 文件内单条数据格式要求为 prompt内容 [[ response内容 ]]。 压缩包 支持 tar.gz/zip 压缩包。 文件编码支持UTF-8。 数据导入方式 创建数据集完成后,在数据集管理页面中,找到该数据集,点击右侧操作列下的“导入”按钮,即可进入导入数据页面。
private final static String HOST = your_host ; private final static int PORT = 8040 ; private final static String DATABASE = db1 ; // 要导入的数据库 private final static String TABLE = tbl1 ; // 要导入的表 private
获取访问凭证 根据步骤一获取的API Key、Secret Key,获取access_token。参考以下获取access_token,更多详情方法请参考 获取access_token 。 注意:access_token默认有效期30天,生产环境注意及时刷新。
import Configuration # 从用户输入中获取要导入的文件路径或名称 path_file = input( 请输入你要导入的知识库名称: ) # 如果文件路径中包含 .docx ,则使用 Docx2txtLoader 加载文档 if .docx in path_file: loader = Docx2txtLoader(path_file) documents = loader.load
您可以使用3种方案上传数据,分别为: 本地导入 BOS目录导入 分享链接导入 本地导入 您可以通过以下三种方式进行本地数据的导入: 以压缩包的方式上传 以TXT文本文件方式上传 以Excel文件的方式上传 通过压缩包上传时,需注意: 压缩包内的一个文本文件将作为一个样本上传。
您可以使用4种方案上传文本分类的数据,分别为: 本地导入 BOS目录导入 分享链接导入 平台已有数据集 本地导入 您可以通过以下三种方式进行本地数据的导入: 以压缩包的方式上传 以TXT文本文件方式上传 以Excel文件的方式上传 以压缩包方式上传 如果您想上传的数据为压缩包,请根据您的数据是否已标注,按照以下格式要求完成数据上传。
您可以使用3种方案上传数据,分别为: 本地导入 BOS目录导入 分享链接导入 本地导入 您可以通过以下三种方式进行本地数据的导入: 以压缩包的方式上传 以TXT文本文件方式上传 以Excel文件的方式上传 通过压缩包上传时,需注意: 压缩包内每一个txt文件为一个样本,文本文件编码须为UTF-8,每个样本字符数不得超过512个字符(包括汉字、数字、符号等),超出将被截断 压缩包的格式为zip;压缩包最大不超过
导入方式,分别为「本地导入」、「BOS目录导入」、「分享链接导入」、「平台已有数据集」; 通过本地导入时,可通过excel文件、TXT文件、压缩包形式上传 通过文本上传时,需注意: 文本文件内数据格式要求为 文本内容\n (即每行一个样本,使用回车换行),每一行表示一组数据,每组数据的数建议不超过512个字符,超出将被截断 文本文件类型支持txt,编码仅支持UTF-8,单次上传限制100个文本文件,
SK”进行签名计算鉴权,即使用安全认证中的Access Key ID 和 Secret Access Key进行鉴权,具体鉴权认证机制参考 HTTP调用鉴权说明 。
文件类型支持xlsx格式,单次上传限制100个文件 BOS目录导入 需选择Bucket地址与对应的文件夹地址。 请确保将全部文本已通过txt文件保存至同一层文件目录,该层目录下子文件目录及非相关内容(包括压缩包格式等)不导入。 分享链接导入 需输入链接地址。