短文本匹配数据导入与标注 1. 创建数据集 您可以在控制面板中,选择“数据总览”并点击按钮“创建数据集”,即可完成一个数据集的创建。 2.导入短文本相似度数据 进入到新创建的短文本数据集中,如果您手中的数据是未标注数据,可以选择数据标注状态为“无标注信息”,如果您手中的数据是完成标注的数据,可以选择数据标注状态为“有标注信息”。
关系模型与数据划分 本文档主要介绍 PALO 的建表和数据划分,以及建表操作中可能遇到的问题和解决方法。 基本概念 在 PALO 中,数据都以关系表(Table)的形式进行逻辑上的描述。 Row & Column 一张表包括行(Row)和列(Column)。Row 即用户的一行数据。Column 用于描述一行数据中不同的字段。 在默认的数据模型中,Column 只分为排序列和非排序列。
导入数据 导入单条数据 以下示例创建单个文档并导入数据。 PUT index_name/_doc/1 { "name": "Amber Adams", "age": 32 } 导入数据成功,返回如下结果。
通过外部表同步数据 PALO 可以创建通过 ODBC 协议访问的外部表。创建完成后,可以通过 SELECT 语句直接查询外部表的数据,也可以通过 INSERT INTO SELECT 的方式导入外部表的数据。 本文档主要介绍如何创建通过 ODBC 协议访问的外部表,以及如何导入这些外部表的数据。
写入和查询数据 写入数据 bulk写入 用户创建向量索引后,即可使用ES BULK API写入数据。不同的 index_type 与 space_type ,在数据写入时没有区别。 在以下示例中,我们向 my_index 索引的 field_hnsw 和 field_linear 字段分别写入样例向量数据。
选择统计项、采样周期、统计时间,即可查看最新数据。
您可查看最近1小时-40天内的监控数据。 监控项包括: 内存使用量、缓存命中率、网络流量、QPS、数据淘汰率、CPU使用率。 以 网络流量 监控项为例: 点击监控曲线图的 缩放按钮 ,可查看详细信息。 选择统计项、采样周期、统计时间,即可查看最新数据。 查看指定节点的监控数据 选择监控管理页面的 分片监控 页签,进入分片监控页面。
选择统计项、采样周期、统计时间,即可查看最新数据。
上传数据集 您可以上传带有标注信息的数据,和无标注信息的数据。您可以根据自己的情况,选择上传方式,目前平台提供上传方式有: 上传Excel文件 上传TXT文本 上传压缩包 通过API导入 下面分别为您介绍几种上传方式 以Excel文件上传 Excel文件内数据格式要求为:每行是一个样本,使用第一列和第二列分别作为需要计算相似度的两个文本,第三列为相似度标签(如果导入无标注数据,此列无数据)。
上传数据集 上传目标跟踪数据集 已标注数据上传 基于CVAT标注好的数据以MOT1.1的数据集形式导出,上传数据压缩包: 压缩包仅支持zip格式,大小限制5GB以内 压缩包内单个视频长度限制在10分钟内,至少应上传4个视频标注压缩包 从CVAT导出的标注数据压缩包可多次上传一起导入数据集组。