查看监控数据 云数据库Redis版性能监控提供了 CPU使用率、内存使用率、平均时延、QPS 等性能监控指标。您可以查询过去指定时间段的监控数据,排查性能问题。 查看监控数据 登录 云数据库 Redis 管理控制台 。 在控制台页面左上角,选择实例所在 地域 ,进入“云数据库 Redis-实例列表”页面。 找到目标实例,点击 实例名称 ,进入实例详情页面。
写入和查询数据 写入数据 bulk写入 用户创建向量索引后,即可使用ES BULK API写入数据。不同的 index_type 与 space_type ,在数据写入时没有区别。 在以下示例中,我们向 my_index 索引的 field_hnsw 和 field_linear 字段分别写入样例向量数据。
数据准备 以准备Web日志数据为例,您可以直接使用百度智能云提供的样例数据,也可根据说明构造自己的输入数据: 使用百度智能云提供的样例数据,路径如下: 存储在“华北-北京”区域的样例数据路径为:bos://datamart-bj/web-log-10k/,仅华北区域的BMR集群可用。
获取数据元信息 概述 数据元信息(Object Meta)是对上传到 BOS 的文件的属性描述,分为两种:系统定义的 Meta 和 User Meta(用户自定义元信息)。数据元信息可以在各种方式上传时或者拷贝文件时进行设置。
上传数据集 您可以上传带有标注信息的数据,和无标注信息的数据。您可以根据自己的情况,选择上传方式,目前平台提供上传方式有: 上传Excel文件 上传TXT文本 上传压缩包 通过API导入 下面分别为您介绍几种上传方式 以Excel文件上传 Excel文件内数据格式要求为:每行是一个样本,使用第一列和第二列分别作为需要计算相似度的两个文本,第三列为相似度标签(如果导入无标注数据,此列无数据)。
注意:当您确定了数据集为去重或非去重的属性后,便不可修改 当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。
当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。此时分为几种情况,如下: 数据集中有未标注样本,上传重复的已标注样本,此时未标注样本将被覆盖 数据集中有已标注样本,上传重复的未标注样本,此时已标注样本将被覆盖 数据集中有已标注样本,上传不同标注的已标注样本,此时已有的标注样本将被覆盖
平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。注意:当您确定了数据集为去重或非去重的属性后,便不可修改。 当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。
平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。注意:当您确定了数据集为去重或非去重的属性后,便不可修改。 当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。
当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。此时分为几种情况,如下: 数据集中有未标注样本,上传重复的已标注样本,此时未标注样本将被覆盖 数据集中有已标注样本,上传重复的未标注样本,此时已标注样本将被覆盖 数据集中有已标注样本,上传不同标注的已标注样本,此时已有的标注样本将被覆盖