数据集管理
创建数据集
概述
系统预置用户基础信息数据集、外呼记录数据集。基础信息数据集开放提供API的接口,以供外部数据导入;外呼数据集在每次外呼任务完成后实时接入此数据。数据集下分为维度数据和事实数据,维度数据存储与数据中心的各个业务领域相关的维度信息,事实数据存储大量的业务数据。
前提条件
有权限登录进入客悦客户洞察。
操作步骤
1、登录进入客悦客户洞察,点击【数据集管理】,在数据集管理下可看到系统预置的数据集。(数据集可自行创建,本版本暂不支持)

数据明细
概述
开发者创建数据集后,可查看数据集的数据记录,对已接入的数据,可按条件进行筛选或删除;也可在此查看数据字段,配置、标记字段或选择字段是否作为筛选条件。
前提条件
有权限登录进入客悦客户洞察。
操作步骤
1、登录进入客悦客户洞察,点击「数据集管理-数据集详情」。

2 进入详情页面,可查看每个用户的27类基础信息,系统默认只展示用户id、用户昵称、用户年龄、用户年龄段、用户城市、和用户性别。如需查看更多用户信息,点击「显示列」并勾选相应选项即可。

或可利用「筛选」功能高效检索,快速定位满足您要求的用户进行查询。

3、点击「数据字段」,可查看到此数据集包含的全部字段,包括字段的英文名称、中文名称、数据类型、字段描述等。

1)字段标记:通过为数据项添加标签,提高数据的可查找性、分类管理能力,优化搜索过滤功能,有助于您进行数据分析和挖掘。
系统根据不同字段设置对应字段标记,一共包含7种标记:
A.无(默认)
B.主键:用于唯一标识表中的每一行记录。
C.事件(维度表无该选项):在事实表中标识行为动作的字段,用于判断不同表中行为的识别。
D.度量(维度表无该选项,且为数字类型字段):度量字段具有可加性,即可以在不同的维度上进行聚合计算,如求和、平均值等,是数据分析的重要基础。
E.id字段:标识id类的字段。
F.敏感:字段加密,md5/sha256加密。
G.分区:根据该字段的值将数据存储在不同的分区中。每个分区都可以独立地进行查询、加载和删除操作,提高数据管理的效率和性能。(本版本暂不涉及)

2)是否作为筛选条件:当您需要从一个数据集中筛选出满足特定条件的用户时,可选择一个或多个字段作为筛选条件,您可在此设置该字段是否要作为筛选条件。
3)数据字段设置:系统预置相关字段,并根据数据类型将其划分为四大类存储:文本类(string、strings)、时间类(time)、枚举类(string)、数字类(number)。
对于如city(城市)、tags(标签)等字段,用户可根据实际需求选择文本类或枚举类作为取值方式:
A.文本类:选用文本类时,字段的取值范围不受限制,可以包含任意文本信息,适用于取值不可预知或不可穷尽的场景。
B.枚举类:若选择枚举类,字段的取值将限定于系统预先设置的枚举值范围内。但用户具备对这些枚举值进行修改、添加或删除的权限,且枚举项的key支持中文输入。适用于取值范围明确且可穷尽的情况。
点击「高级配置」,可定义字段的取值范围或枚举值,用于查询条件的下拉选项。
