上传数据集 您可以上传带有标注信息的数据,和无标注信息的数据。您可以根据自己的情况,选择上传方式,目前平台提供上传方式有: 上传Excel文件 上传TXT文本 上传压缩包 通过API导入 下面分别为您介绍几种上传方式 以Excel文件上传 Excel文件内数据格式要求为:每行是一个样本,使用第一列和第二列分别作为需要计算相似度的两个文本,第三列为相似度标签(如果导入无标注数据,此列无数据)。
当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。此时分为几种情况,如下: 数据集中有未标注样本,上传重复的已标注样本,此时未标注样本将被覆盖 数据集中有已标注样本,上传重复的未标注样本,此时已标注样本将被覆盖 数据集中有已标注样本,上传不同标注的已标注样本,此时已有的标注样本将被覆盖
删除数据集 您可以通过容器引擎管理控制台删除不再需要的数据集。 前提条件 您已成功安装CCE Fluid组件,否则此功能将无法使用。 您已成功创建数据集。 操作步骤 登录 百度智能云官网 ,并进入管理控制台。 选择“产品服务 > 云原生 > 容器引擎 CCE”,单击进入容器引擎管理控制台。 单击左侧导航栏中的 集群管理 > 集群列表 。 在集群列表页面中,单击目标集群名称进入集群管理页面。
数据集 制作数据集 [{ prompt : 类型#上衣*材质#牛仔布*颜色#白色*风格#简约*图案#刺绣*衣样式#外套*衣款式#破洞 , response : [[ 简约而不简单的牛仔外套,白色的衣身十分百搭。衣身多处有做旧破洞设计,打破单调乏味,增加一丝造型看点。衣身后背处有趣味刺绣装饰,丰富层次感,彰显别样时尚。
数据集 制作数据集 [{ prompt : 类型#上衣*材质#牛仔布*颜色#白色*风格#简约*图案#刺绣*衣样式#外套*衣款式#破洞 , response : [[ 简约而不简单的牛仔外套,白色的衣身十分百搭。衣身多处有做旧破洞设计,打破单调乏味,增加一丝造型看点。衣身后背处有趣味刺绣装饰,丰富层次感,彰显别样时尚。
当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。此时分为几种情况,如下: 数据集中有未标注样本,上传重复的已标注样本,此时未标注样本将被覆盖 数据集中有已标注样本,上传重复的未标注样本,此时已标注样本将被覆盖 数据集中有已标注样本,上传不同标注的已标注样本,此时已有的标注样本将被覆盖
查询语句的编写,请参考 《数据查询语法和函数》 同时,控制台提供了常用的「查询语句模板」帮助开发者引入示例语句,根据实际消息格式选取相近的模板,在此基础上进行编辑修改,快速完成查询语句的编写。
配置专家模式表格数据预测任务 表格预测任务支持AutoML和专家两种运行方式: AutoML模式:全流程自动建模,用户只需设置数据集、目标列以及制定任务类型即可,而无需关注数据处理以及算法配置等过程,系统会自动完成建模过程,并从中挑选最优的模型作为训练任务的运行结果。 专家模式:高度开放的建模方式,用户可以进行特征工程、算法、超参搜索等配置,具备相关技能的开发者可以在方式下获得更多的开发自由度。
以下以最常用的Claude Code和Cursor为例,详细拆解配置步骤,其他工具可参考此逻辑,核心配置思路一致。
检查当前实例是否已开启数据开发功能。 进入 “数据开发” 页面后会进入到 DBSC 数据开发的SQL 窗口模块,用户即可在此页面便捷管理向量数据库数据。 DBSC 数据开发中的 SQL 窗口具体操作及其指引文档,请参见下表。