创建DB  client . create_database ( db_test )  # 选择数据库  db = client . database ( document )  # 定义数据表的字段  fields = [  Field ( id , FieldType .
Post-pretrain最佳实践 本内容为您提供了Post-pretrain的支持文档,引导并指引当前聚焦问题,使得您方便并快速应用Post-pretrain。 流程大纲 一、识别应用场景 什么时候我们考虑使用 Post-pretrain ?
什么是Post-pretrain 目录 定义 优势 应用场景 定义 Post-pretrain是一种预训练的模型训练方法。在本平台中,我们需要先对泛文本无标注数据进行预训练,得到一个强大的通用语言模型。然后,在此预训练模型的基础上进行SFT,调整部分参数后,得到一个更强大的模型。 关于如何创建一个Post-pretrain任务可查看 指导说明 。
创建Post-pretrain任务 目录 创建任务 新建运行 数据配置 大模型预训练是开发者可以基于大量的泛文本无标注数据使用Post-pretrain的方式训练出一个定制的预训练模型。 在Post-pretrain任务中调优预训练模型提升模型效果,完成预训练后,可以在SFT调优预训练模型。 登录到 本平台 ,在左侧功能列选择 Post-pretrain ,进入大模型预训练的主任务界面。
DocumentDownload - 下载文档 API访问域名 请求方式 POST base url https://keyue.cloud.baidu.com 后缀接口 /open/v1/api/v2/llm/document/download Authentication token为API Key 说明 请求参数 Header参数 名称 类型 必选 中文名 说明 Content-Type string
DocumentDelete - 删除文档 API访问域名 请求方式 POST base url https://keyue.cloud.baidu.com 后缀接口 /open/v1/api/v2/llm/document/batchDelete Authentication token为API Key 说明 无 请求参数 Header参数 名称 类型 必选 中文名 说明 Content-Type
DocumentUpload - 上传文档 API访问域名 请求方式 POST base url https://keyue.cloud.baidu.com 后缀接口 /open/v1/api/v2/task/create/llm_document_import Authentication token为API Key 说明 请求参数 Header参数 名称 类型 必选 中文名 说明 Content-Type
注意: Status Code: 200 OK 才会认为消息推送成功,否则将会重试; 对于过载保护的情况,支持 Status Code: 429 Too Many Requests 返回值,会间隔一段时间再重试; 请求 请求语法 http POST /?
查看与管理Post-pretrain 目录 详情 去SFT 评估报告 训练日志 训练过程可视化 删除 在 Post-pretrain 任务界面,可以查看任务的详情、新建运行任务和删除整个任务(包括运行)。 在 指定任务的详情 页面,可以查看所有的模型训练运行任务状态及其他相关内容。 登录到 本平台 ,在左侧功能列选择 Post-pretrain ,进入Post-pretrain主任务界面。
DocumentUpdate - 修改文档生失效时间 API访问域名 请求方式 POST base url https://keyue.cloud.baidu.com 后缀接口 /open/v1/api/v2/llm/document/batchUpdate Authentication token为API Key 说明 无 请求参数 Header参数 名称 类型 必选 中文名 说明 Content-Type