接入数据
概述
接入数据是使用客户洞察服务的基础。开发者可通过API推送或文件导入的方式接入数据,并按照系统定义的字段名称和格式要求上传数据,未按规定上传数据将导致客户洞察服务无法正常使用。
前提条件
- 已创建好数据集。
- 已经准备好要接入的数据。
- 网络畅通:如果您是百度公有云的用户,需要保证您的数据可以发送到互联网;如果您是私有化部署的用户,需要保证您的数据和本系统网络是连接畅通的。
操作步骤
1、准备数据:登录进入客悦ONE客户洞察,在数据集「数据接入-文件导入-上传数据-下载数据导入模板」查看系统数据模板,根据数据结构规范准备数据,若您的数据不符合规范,需要您做数据预处理。

2、接入数据:进入数据集详情页面,点击「数据接入」可通过API推送或文件导入两种方式实现数据接入。

(1)方法1:使用curl命令快速接入验证,copy示例代码。在终端中执行,返回如下状态时,表示数据接入成功。

(2)方法2:使用对应语言的脚本 第1步:编写/获取代码模版,选择相应语言复制代码示例或者编写代码。 第2步:替换模板中的参数。复制基本信息中鉴权信息和数据API中的URL,并参考代码示例进行替换。 第3步:接入数据,返回'success':true即表明接入成功,刷新数据状态,接入必传数据即可。

(3)方法3:上传文件接入数据
第1步:点击【下载数据导入模板】按钮,使用下载的模板填充符合格式的数据。
第2步:点击【上传数据】按钮,选择并上传文件,单个文件最大支持10m,单次最多支持3个文件,且所有文件表头需相同。支持多次上传,同一ID的物料将以最后上传的数据为准进行覆盖更新。支持文件类型:excel、csv、xlsx、xls。
第3步:数据配置,在此可以配置数据的写入模式、数据映射模式。还可查看目标字段名称、目标字段类型与来源字段名称及来源字段类型的一一对应关系。来源字段名映射为系统自动匹配,若匹配错误,支持手动下拉进行修改。


数据写入模式
- 覆盖式写入:完全替换掉原有的数据,更新整个数据集。
- 增量写入:在保留原有数据的基础上添加新数据,历史数据完全相同的不更新,如果数据变化则更新为最新数据。
映射模式
- 同名映射:基于数据字段的名称来进行匹配,中文或英文字段名称相同时,同名映射自动将这些字段对应起来。
- AI语义映射:通过语义分析、自然语言处理来识别字段之间的潜在关系,进行数据映射。
3、数据预览:数据导入成功后,还可在数据源的「详情」页面,点击任一文件,进行「上传数据预览」和「数据配置预览」。

