userName String 是 用户名称(长度:1~32(数据库长度为1024)) Image String 是 用户图片信息(总数据大小应小于10M),图片的base64值,base64编码后的图片数据(编码后的图片大小不超过2M) groupId String 是 用户组ID,标识一组用户组(由数字、字母、下划线组成,长度:1~48(数据库长度为1024)) 请求示例 { "
字节使用 CHAR 如果字节长度 <= 65536 字节使用 VARCHAR 如果字节长度 <= 16,777,215 字节使用 MEDIUMTEXT 其他使用 LONGTEXT
OFF:Innodb表的单例索引长度最多为767个字节,索引长度超出后,主键索引会创建失败,辅助索引会被截断成为前缀索引。 解决方案 使用前缀索引,减少字段索引长度。 设置MySQL的全局参数innodb_large_prefix=ON,将InnoDB表的索引长度上限扩大到3072个字节。
序列长度 序列长度(Sequence Length),单条数据的最大长度,包括输入和输出。该长度在模型的训练和推理过程中全部适用,超过该长度的部分将在推理时自动截断,单位为token。如果数据集中的文本普遍较短,建议选择较短的序列长度以提高计算效率。
序列长度 序列长度(Sequence Length),单条数据的最大长度,包括输入和输出。该长度在模型的训练和推理过程中全部适用,超过该长度的部分将在推理时自动截断,单位为token。如果数据集中的文本普遍较短,建议选择较短的序列长度以提高计算效率。
序列长度 序列长度(Sequence Length),单条数据的最大长度,包括输入和输出。该长度在模型的训练和推理过程中全部适用,超过该长度的部分将在推理时自动截断,单位为token。如果数据集中的文本普遍较短,建议选择较短的序列长度以提高计算效率。
二维数组的每一个元素必须是一个长度为1的一维数组。
序列长度 序列长度(Sequence Length),单条数据的最大长度,包括输入和输出。该长度在模型的训练和推理过程中全部适用,超过该长度的部分将在推理时自动截断,单位为token。如果数据集中的文本普遍较短,建议选择较短的序列长度以提高计算效率。
表三 公共代码参数说明(*表示必填) 参数 描述 基本信息 *代码中文名称 支持中文、英文、数字、特殊字符等,长度不能超过128个字符。 *代码英文名称 支持英文、数字、下划线、中划线,长度不能超过128个字符。 *代码编码 仅支持英文、数字、下划线、中划线,长度不能超过128个字符。 描述 支持中文、英文、数字、特殊字符等,长度不能超过500个字符。
序列长度 单条数据的长度,单位为token。如果数据集中每条数据的长度(输入)都在4096 tokens 以内,建议选择4096,针对短序列可以达到更优的训练效果。 全局批大小 全局批大小(GlobalBatchsize),每次训练迭代使用的样本数,为了加快训练效率,多条样本会使用Packing尽可能拼接到一个序列长度内。