Table 操作
更新时间:2025-01-13
创建表
功能介绍
在指定的库中新建一个表。
请求示例
package main
import (
"log"
"github.com/baidu/mochow-sdk-go/mochow"
"github.com/baidu/mochow-sdk-go/mochow/api"
)
func main() {
clientConfig := &mochow.ClientConfiguration{
Account: "root",
APIKey: "您的账户API密钥",
Endpoint: "您的实例访问端点", // 例如:'http://127.0.0.1:5287'
}
// create mochow client
client, err := mochow.NewClientWithConfig(clientConfig)
if err != nil {
log.Fatalf("Fail to init mochow client due to error:%v", err)
return
}
// Fields
fields := []api.FieldSchema{
{
FieldName: "id",
FieldType: api.FieldTypeString,
PrimaryKey: true,
PartitionKey: true,
AutoIncrement: false,
NotNull: true,
},
{
FieldName: "bookName",
FieldType: api.FieldTypeString,
NotNull: true,
},
{
FieldName: "author",
FieldType: api.FieldTypeString,
NotNull: true,
},
{
FieldName: "vector",
FieldType: api.FieldTypeFloatVector,
NotNull: true,
Dimension: 3,
},
}
// Indexes
autoBuildPolicy := api.NewAutoBuildIncrementPolicy()
autoBuildPolicy.AddRowCountIncrement(5000)
indexes := []api.IndexSchema{
{
IndexName: "book_name_idx",
Field: "bookName",
IndexType: api.SecondaryIndex,
},
{
IndexName: "filtering_idx",
IndexType: api.FilteringIndex,
FilterIndexFields: []api.FilteringIndexField{
{
Field: "bookName",
},
},
},
{
IndexName: "vector_idx",
Field: "vector",
IndexType: api.HNSW,
MetricType: api.L2,
Params: api.VectorIndexParams{
"M": 16,
"efConstruction": 200,
},
AutoBuild: true,
AutoBuildPolicy: autoBuildPolicy.Params(),
},
}
// create table
createTableArgs := &api.CreateTableArgs{
Database: "db_test",
Table: "table_test",
Replication: 3,
Partition: &api.PartitionParams{
PartitionType: api.HASH,
PartitionNum: 3,
},
EnableDynamicField: false,
Schema: &api.TableSchema{
Fields: fields,
Indexes: indexes,
},
}
if err := client.CreateTable(createTableArgs); err != nil {
log.Fatalf("Fail to create table due to error: %v", err)
return
}
}
请求参数
参数 | 参数类型 | 是否必选 | 参数含义 |
---|---|---|---|
createTableArgs | CreateTableArgs | 是 | 创建表参数。 |
CreateTableArgs
参数 | 参数类型 | 是否必选 | 参数含义 |
---|---|---|---|
Database | String | 是 | 指定库的名称。库名称命名要求如下: 支持大小写字母、数字以及_特殊字符,必须以字母开头; 长度限制为1~255。 表的字段详情列表。 |
Table | String | 是 | 指定表的名称。表的命名要求如下: 仅支持大小写字母、数字以及下划线(_),且必须以字母开头; 长度限制为1~255。 表的索引详情列表。 |
Description | String | 否 | 数据表的描述。 |
Replication | Int | 是 | 单个分区的总副本数(含主副本),取值范围为[1,10]。 若需要高可用特性,副本总数需>=3。 注意:副本数需要小于等于数据节点的数量,否则无法建表。 |
Partition | PartitionParams | 是 | 表的分区数量,取值范围为[1, 1000]。 |
若非FLAT索引,则建议将单个分区的记录总数控制在100万到1000万之间,过大过小都不太合适。 | |||
EnableDynamicField | Boolean | 否 | 表是否支持自动增加字段,默认值为False。 |
Schema | TableSchema | 是 | 表的Schema信息。 |
PartitionParams
参数名称 | 参数类型 | 描述 |
---|---|---|
PartitionType | String | 分区类型枚举,当前仅支持"HASH"。 |
PartitionNum | Int | 分区的数量,取值范围为[1,1000]。 |
TableSchema
参数名称 | 参数类型 | 描述 |
---|---|---|
Fields | List |
数据表中字段的定义。 |
Indexes | List |
数据表中索引的定义。 |
FieldSchema
参数名称 | 参数类型 | 描述 |
---|---|---|
FieldName | String | 字段名称,要求表内唯一。 字段命名要求如下: 仅支持大小写字母、数字以及下划线(_),必须以字母开头; 长度限制为1~255。 |
FieldType | String | 字段类型,当前支持如下类型: BOOL INT8 UINT8 INT16 UINT16 INT32 UINT32 INT64 UINT64 FLOAT DOUBLE DATE DATETIME TIMESTAMP UUID STRING BINARY FLOAT_VECTOR 各数据类型的详细定义和约束请参见“产品介绍”目录的“数据类型”页面。 |
PrimaryKey | Boolean | 是否为主键,默认值为False。 当前仅支持单一字段作为主键。 主键字段不支持如下类型:BOOL、FLOAT、DOUBLE和FLOAT_VECTOR。 |
PartitionKey | Boolean | 是否为分区键,默认值为False。 当前仅支持单一字段作为分区键,分区键可以是主键,也可以不是主键,但一张表只能有一个分区键,每行记录都会根据分区键的取值哈希映射到不同的分区。 分区键字段不支持如下类型:BOOL、FLOAT、DOUBLE和FLOAT_VECTOR。 |
AutoIncrement | Boolean | 是否自增主键,默认值为False。 仅适用于类型为UINT64的主键字段,非主键字段请勿填写属性值。 |
NotNull | Boolean | 是否非空,默认值为False。 不可以为空值的字段包括:主键字段、分区键字段、向量字段和索引键字段。 |
Dimension | Int | 向量维度,仅当字段类型为FLOAT_VECTOR时,才需要指定该参数。 |
ElementType | String | 数组类型字段的元素类型。 仅当字段类型为ARRAY时,才需要指定该参数。 |
MaxCapacity | Int | 数组类型字段的最大容量,默认不限制。 仅当字段类型为ARRAY时,才需要指定该参数。 |
IndexSchema
参数名称 | 参数类型 | 描述 |
---|---|---|
IndexName | String | 索引名称,要求表内唯一。 索引命名要求如下: 仅支持大小写字母、数字以及下划线(_),必须以字母开头; 长度限制为1~255。 |
IndexType | String | 索引类型。当前支持的类型如下: SECONDARY:标量二级索引 HNSW: HNSW向量索引 HNSWPQ:HNSWPQ FLAT:FLAT向量索引(暴力检索) FILTERING:FILTERING索引 INVERTED:倒排索引 |
MetricType | String | 向量索引的距离度量算法。支持的类型如下: L2:欧几里得距离 IP:内积距离 COSINE:余弦距离 |
Params | VectorIndexParams | 向量构建索引所需参数。 1. m:表示每个节点在检索构图中可以连接多少个邻居节点。取值为[4, 128]; 2. efconstruction:搜索时,指定寻找节点邻居遍历的范围。数值越大构图效果越好,构图时间越长。取值为[8, 1024]。 1. coarseClusterCount:索引中粗聚类中心的个数; 2. fineClusterCount:每个粗聚类中心下细聚类中心个数。 1. m:表示每个节点在检索构图中可以连接多少个邻居节点。取值为[4, 128]; 2. efconstruction:搜索时,指定寻找节点邻居遍历的范围。数值越大构图效果越好,构图时间越长。取值为[8, 1024]; 3. NSQ:表示量化子空间个数,取值为[1, dim],并且要求NSQ | dim; 4. sampleRate:kmeans训练原始数据的抽样比率,取值为[0.0, 1.0],抽样总数 10000 + (rowCount - 10000)*sampleRate |
AutoBuild | Bool | 是否自动构建索引 |
AutoBuildPolicy | AutoBuildPolicy | 自动构建索引策略,当前支持如下策略: AutoBuildTiming:定时构建,指定构建的时间,构建一次,不会重复构建。例如 AutoBuildPeriodical:周期性构建,每过period_s秒构建一次索引,可重复构建。可以指定从某个时间点开始。 AutoBuildRowCountIncrement:增量行数构建。Tablet(不是table)增加或者减少指定的行数时会自动构建一次索引,可重复构建,支持具体行数以及百分比,只需传入一种即可,也可传入两种,触发其中之一便会开始构建。 |
Field | String | 索引作用于的目标字段名称。 |
InvertedIndexFields | List |
倒排索引作用于的目标字段名称。 |
InvertedIndexFieldAttributes | List |
指定建立倒排索引的列是否需要分词(默认是会分词),参数顺序应与'fields'里列名一一对应。目前支持以下选项: ATTRIBUTE_ANALYZED ATTRIBUTE_NOT_ANALYZED |
FilterIndexFields | List |
Filtering索引作用于的目标字段名称。 |
FilteringIndexField
参数 | 参数类型 | 是否必选 | 参数含义 |
---|---|---|---|
field | String | 是 | 索引作用于的目标字段名称。 支持以下通配符: |
indexStructureType | List<FilteringIndexField> | 否 | 选择FILTERING索引的内存结构。支持的类型如下: indexStructureType的缺省值为DEFAULT。如果指定了通配符@SCALAR,则使用@SCALAR字段中的indexStructureType作为缺省值。 |
删除表
功能介绍
删除指定的数据表。
请求示例
package main
import (
"log"
"github.com/baidu/mochow-sdk-go/mochow"
)
func main() {
clientConfig := &mochow.ClientConfiguration{
Account: "root",
APIKey: "您的账户API密钥",
Endpoint: "您的实例访问端点", // 例如:'http://127.0.0.1:5287'
}
// create mochow client
client, err := mochow.NewClientWithConfig(clientConfig)
if err != nil {
log.Fatalf("Fail to init mochow client due to error:%v", err)
return
}
if err := client.DropTable("db_test", "table_test"); err != nil {
log.Fatalf("Fail to drop table due to error: %v", err)
return
}
}
请求参数
参数 | 参数类型 | 是否必选 | 参数含义 |
---|---|---|---|
databaseName | String | 是 | 目标库的名称 |
tableName | String | 是 | 目标表的名称。 |
查询表详情
功能介绍
查询指定数据表的详情。
请求示例
package main
import (
"log"
"github.com/baidu/mochow-sdk-go/mochow"
)
func main() {
clientConfig := &mochow.ClientConfiguration{
Account: "root",
APIKey: "您的账户API密钥",
Endpoint: "您的实例访问端点", // 例如:'http://127.0.0.1:5287'
}
// create mochow client
client, err := mochow.NewClientWithConfig(clientConfig)
if err != nil {
log.Fatalf("Fail to init mochow client due to error:%v", err)
return
}
describeTableResult, err := client.DescTable("db_test", "table_test")
if err != nil {
log.Fatalf("Fail to describe table due to error: %v", err)
return
}
log.Printf("describe table response: %v", describeTableResult)
}
请求参数
参数 | 参数类型 | 是否必选 | 参数含义 |
---|---|---|---|
dabaseName | String | 是 | 目标库的名称 |
tableName | String | 是 | 目标表的名称。 |
返回参数
参数 | 参数类型 | 参数含义 |
---|---|---|
describeTableResult | DescTableResult | Table详情 |
DescTableResult
参数 | 参数类型 | 参数含义 |
---|---|---|
Database | String | 指定库的名称。库名称命名要求如下: 支持大小写字母、数字以及_特殊字符,必须以字母开头; 长度限制为1~255。 表的字段详情列表。 |
Table | String | 指定表的名称。表的命名要求如下: 仅支持大小写字母、数字以及下划线(_),且必须以字母开头; 长度限制为1~255。 表的索引详情列表。 |
Description | String | 数据表的描述。 |
Replication | Int | 单个分区的总副本数(含主副本),取值范围为[1,10]。 若需要高可用特性,副本总数需>=3。 注意:副本数需要小于等于数据节点的数量,否则无法建表。 |
Partition | PartitionParams | 表的分区数量,取值范围为[1, 1000]。 若非FLAT索引,则建议将单个分区的记录总数控制在100万到1000万之间,过大过小都不太合适。 |
EnableDynamicField | Boolean | 表是否支持自动增加字段,默认值为False。 |
Schema | TableSchema | 表的Schema信息。 |
State | TableState | 表的当前状态,取值如下: CREATING:表处于创建中 NORMAL:表状态正常 DELETING:表正在被删除 |
查询表的列表
功能介绍
查询指定库包含的所有表。
请求示例
package main
import (
"log"
"github.com/baidu/mochow-sdk-go/mochow"
)
func main() {
clientConfig := &mochow.ClientConfiguration{
Account: "root",
APIKey: "您的账户API密钥",
Endpoint: "您的实例访问端点", // 例如:'http://127.0.0.1:5287'
}
// create mochow client
client, err := mochow.NewClientWithConfig(clientConfig)
if err != nil {
log.Fatalf("Fail to init mochow client due to error:%v", err)
return
}
listTableResult, err := client.ListTable("db_test")
if err != nil {
log.Fatalf("Fail to list table due to error: %v", err)
return
}
log.Printf("list table response: %v", listTableResult)
}
请求参数
参数 | 参数类型 | 是否必选 | 参数含义 |
---|---|---|---|
databaseName | String | 是 | 库的名称。 |
返回参数
参数 | 参数类型 | 参数含义 |
---|---|---|
listTableResult | ListTableResult | 表对象列表。 |
ListTableResult
参数 | 参数类型 | 参数含义 |
---|---|---|
Tables | List |
表名列表 |