30天平均值波动率 离群值 检测指定字段的数据与其他数据差异较大的,3倍标准差。 离群值行数、总行数、离群值比率 值域范围 指定字段的取值范围是否在规定范围内。 无效行数、有效行数、总行数、无效比率 值域范围 枚举值校验 指定字段的取值范围是否在枚举值中。
建表说明 在建表时,可以通过 DUPLICATE KEY 关键字指定明细模型。明细表必须指定数据的 Key 列,用于在存储时对数据进行排序。
数据模式名称 数据库模式名称,用于在数据库中进一步划分不同的命名空间。 数据表名称 数据表的唯一标识名称。 表类型 内部表/外部表。 数据源格式 ICEBERG。 存储路径 指定数据表在存储介质(如文件系统、对象存储等)上的存储位置路径。 表属性 数据表的自定义属性信息。 创建时间 数据表创建的具体时间。 创建人 创建该数据表的用户名。 修改时间 数据表最后一次修改的时间。
batch_size 用于指定在查询执行过程中,各个节点传输的单个数据包的行数。默认一个数据包的行数为 1024 行,即源端节点每产生 1024 行数据后,打包发给目的节点。 较大的行数,会在扫描大数据量场景下提升查询的吞吐,但可能会在小查询场景下增加查询延迟。同时,也会增加查询的内存开销。建议设置范围 1024 至 4096。
PALO 提供以下两种 分区类型 和三种 分区模式 : 分区类型 Range 分区 :根据分区列的值范围将数据行分配到对应分区。 List 分区 :根据分区列的具体值将数据行分配到对应分区。 分区模式 手动分区 :用户手动创建分区(如建表时指定或通过 ALTER 语句增加)。 动态分区 :系统根据时间调度规则自动创建分区,但写入数据时不会按需创建分区。
k1, k2, tmpk1) COLUMNS FROM PATH AS 指定从导入文件路径中抽取的列。 PRECEDING FILTER predicate 前置过滤条件。数据首先根据 column list 和 COLUMNS FROM PATH AS 按顺序拼接成原始数据行。然后按照前置过滤条件进行过滤。关于这部分详细介绍,可以参阅 列的映射,转换与过滤 文档。
如果 enable_auto_create_when_overwrite 为 false ,未找到分区的数据将累计错误行直到失败。 如果指定了覆写的 PARTITION,那么在此过程中,AUTO PARTITION 表表现得如同普通分区表一样,不满足现有分区条件的数据将被过滤,而非创建新的分区。
任务限速 在数据传输任务执行过程中,您可以根据源和目标端的读写压力情况调整传输速度,以降低数据库的负载。 前提条件 任务须处于 已暂停 或 运行异常 状态。 名词解释 每秒迁移的行数 RPS:表示 DTS 任务每秒从源端传输到目标端的数据行数。
首先,点击【数据库】按钮,选择信息来源,目前数据库支持研报库、资讯库&百科、指标数据&工商数据。 此外,您也可以自己提供数据来源,点击【添加材料】按钮,打开浮层可多选材料文件。每选择一个文件,在添加材料按钮后面增加一个文件标签(取消选择同理),点击确定按钮关闭浮层,点击文件标签的【删除】按钮可删除材料。
对于插入的数据中用户没有指定的列,如果该列有默认值,则会以默认值填充;否则,如果该列可以为 NULL,则将以 NULL 值填充;否则本次插入不成功。