jobs:各类任务的统计信息,可查看指定数据库的 Job 的统计信息,如果 dbId = -1, 则返回所有库的汇总信息。 load_error_hub:PALO 支持将 load 作业产生的错误信息集中存储到一个 error hub 中。然后直接通过 SHOW LOAD WARNINGS; 语句查看错误信息。这里展示的就是 error hub 的配置信息。
创建知识库 概述 【个人空间-知识库】用于存储和管理各类知识文档,以辅助各类型原生应用的快速搭建并查看效果。 登录 百度千帆 。 在左侧菜单栏中,选择【个人空间-知识库】,进入该页面后,可查看到当前所有知识库列表,列表中包含知识库ID、托管资源等信息,当前可支持创建100个知识库。
创建知识库 概述 【个人空间-知识库】用于存储和管理各类知识文档,以辅助各类型原生应用的快速搭建并查看效果。 登录 百度智能云千帆-AppBuilder ,进入控制台界面。 在左侧菜单栏中,选择【个人空间-知识库】,进入该页面后,可查看到当前所有知识库列表,当前可支持创建100个知识库, 创建一个知识库 。 1.
第三方存储 百度智能云以外的第三方对象存储,当支持的第三方:AWS S3、阿里云OSS、腾讯云COS。若回源至第三方私有存储桶,需开启私有访问鉴权,并填写有效的鉴权信息 回源协议 参数 说明 HTTP回源 HTTP/HTTPS 访问均使用 HTTP 回源,HTTP 回源端口未配置时默认为80。
表属性 PALO 的建表语句中可以指定建表属性,包括: 分桶数 (buckets):决定数据在表中的分布; 存储介质 (storage_medium):控制数据的存储方式,如使用 HDD、SSD 或远程共享存储; 副本数 (replication_num):控制数据副本的数量,以保证数据的冗余和可靠性; 冷热分离存储策略 (storage_policy) :控制数据的冷热分离存储的迁移策略; 这些属性作用于分区
冲突策略 覆盖该文件:保留源数据集中的文件 跳过该文件:不导入该文件 保留两者:在目标数据集中同时保存两个同名数据文件| |目标数据集|当前操作的数据集| |目标数据版本|导入数据存储的版本,每个版本对应一个存储路径| 提交转储任务,在数据集详情的【转储任务】Tab页可以查看转储任务记录及状态。
S3 认证和连接信息 这里以 AWS S3 为例,从其他对象存储系统导入也可以作为参考。 AK 和 SK:首先需要找到或者重新生成 AWS Access keys ,可以在 AWS console 的 My Security Credentials 找到生成方式。 REGION 和 ENDPOINT:REGION 可以在创建桶的时候选择也可以在桶列表中查看到。
S3 认证和连接信息 这里以 AWS S3 为例,从其他对象存储系统导入也可以作为参考。 AK 和 SK:首先需要找到或者重新生成 AWS Access keys ,可以在 AWS console 的 My Security Credentials 找到生成方式。 REGION 和 ENDPOINT:REGION 可以在创建桶的时候选择也可以在桶列表中查看到。
向量划分的桶数,较高的值意味着向量数据会被划分到更多的桶,每个桶内到数据更少,查询单个桶的向量数据的资源消耗和时间都会减少,但是查询时相同数量的桶包含的向量数量变少了,召回率可能会下降。查询时需要设置合理的 nprobes 参数以保证召回率。一般建议 nlist = C * sqrt(N),C为用户自选的常数,可以根据具体情况调整,比如可以从C=4开始尝试,再根据业务所需要的召回率来调整测试。
请求参数 参数名称 类型 是否必选 参数位置 参数描述 modelId String 是 Query参数 模型ID storageBucket String 是 Body参数 模型存储的BOS桶 storagePath String 是 Body参数 BOS桶中的存储路径 description String 否 Body参数 描述 source String 是 Body参数 该版本模型的来源UserUpload