选取数据集

创建数据集

  1. 登录百度智能云官网,点击右上角的“管理控制台”,快速进入控制台界面。
  2. 选择“产品服务>物联网产品>时序洞察”,进入“产品主页”,点击“创建数据集”,进入“数据集列表页”。

  1. 点击“创建数据集”进去创建页面。您在创建数据集时需要:

    • 数据集名称:由数字、字母、分隔符’-‘ 或下划线 ‘_’ 组成,2-40个字符。
    • 数据集描述:选填,建议填写。
    • 选择数据存储源:目前仅支持TSDB。
    • TSDB实例:选择已经创建的TSDB实例。
    • 度量:单选。
    • 域:可以多选,默认全部。

创建成功后,系统需要几分钟准备数据,并不影响您继续创建笔记本。

  1. 点击预览数据,弹窗形式展示数据详情(显示前100条数据)。
  2. 点击“创建”,完成数据集创建。

查看数据集

点击“返回数据集列表”,查看已经创建的数据集。支持单个/批量删除数据集,可通过数据集名称检索。

编辑数据集

点击“数据集名称” 查看数据集详情。可以查看数据集名称、描述、数据存储源等信息。点击“预览数据”可以查看数据详情,点击“编辑”修改创建时填写的信息。

说明:示范数据集不支持修改和删除

示范数据集

为了能更好的演示时序洞察作为一个数据分析工具可以实现的能力,系统提供了三个示范数据集,用来配合三个模型模板的使用。这三个示范数据集分别是:

1、electricDemandDemo,电量需求预测示范数据集,配合电量需求预测模型使用。

该数据集采用kaggle提供的2006年-2010年某户居民用电量的数据,原始数据可参考Kaggle公开数据。电量需求预测模型模板通过该数据进行分析和训练,使得在给定当前一个月用电数据情况下,可预测出当前日的用电情况。

该数据在TSDB中的存储形式如下:

timestamp field:
global_active_power
field:
global_intensity
field:
global_reactive_power
field:
sub_metering_1
field:
sub_metering_2
field:
sub_metering_3
field:
voltage
ID
时间戳 房屋整体有功功率 房屋整体无功功率 房屋整体电流强度 子电表1用电量 子电表2用电量 子电表3用电量 电压 居民ID
2006-12-16 08:00:00 1209.1760000000006 5180.8000000000075 34.921999999999976 0.0 546.0 4926.0 236.24376262626276 1

备注:

  • 第1列表示时间戳,第2列到第7列有field标识,代表共有6个field,第8列无特殊标识代表tag。
  • 第2行的描述在真实的TSDB实例中不存在,这里仅作描述作用。

2、trajectoryDemo,动物轨迹预测示范数据集,配合动物轨迹分类模型使用。

该数据来源于俄勒冈州斯塔基(Starkey)实验室在1996年间,通过传感器电子设备,收集的牛(Cattle)、鹿(Deer)和麋鹿(Elk)三种野生动物的时空轨迹,该数据集总共包含7万多条轨迹数据。动物轨迹分类模型模板通过对该数据集的分析,可以判断一个轨迹属于哪种动物,以及监测不属于已知分类的异常轨迹。

该数据在TSDB中的存储形式如下:

timestamp field: longtitude field: latitude id label
时间戳 经度 纬度 动物唯一区分ID 动物种类
1996-05-03 03:59:08 5008230  374715 890317E23 E

备注:

  • 第1列表示时间戳,第2列到第3列有field标识,代表共有2个field,第4列到第5列列无特殊标识代表tag。
  • 第2行的描述在真实的TSDB实例中不存在,这里仅作描述作用。

3、airQualityDemo,空气质量分析示范数据集,配合空气质量分析模板使用。

该数据来源于北京、上海、深圳从2013年12月到2018年6月的每天空气质量数据,包含AQI、PM2.5等和空气相关维度。空气质量分析模型用来探索空气质量的周期性、趋势性;分析空气质量和天气、百度搜索指数之间关系;探索不同城市之间空气质量差别。

该数据集在TSDB中的存储形式如下:

timestamp field:
PM2_5
field:
PM10
field:
SO2
field:
CO
field:
NO2
field:
O3_8h
field:
AQI
field:
Quality
field:
bd_index
field:
mobile_index
field:
pc_index
field:
high_temp
field:
low_temp
field:
weather
field:
wind_director
field:
wind_level
city
时间戳 PM2.5 浓度 (ug/m^3) PM10 浓度 (ug/m^3) SO2 浓度 (ug/m^3) CO 浓度 (mg/m^3) NO2 浓度 (ug/m^3) O3 8小时浓度 (ug/m^3) 空气污染指数 空气质量等级 'PM2.5'关键词百度搜索指数 'PM2.5'关键词手机端百度搜索指数 'PM2.5'关键词PC端百度搜索指数 最高温度 最低温度 天气 风向 风等级 城市
2013-12-02 08:00:00 109.0 138.0 61.0 2.6 88.0 11.0 142.0 轻度污染 2112.0 1076.0 1036.0 13.0 -1.0 多云转晴 西南风 小于3级 Beijing

备注:

  • 第1列表示时间戳,第2列到第17列有field标识,代表共有16个field,第18列无特殊标识,代表tag。
  • 第2行的描述在真实的TSDB实例中不存在,这里仅作描述作用。