的作用: 场景 1:展示最新数据 例如:展示数据中最新一天的销售额 我们使用核心指标组件,将「订单日期」字段拖入到「额外排序字段」中,并将「订单日期」的排序设置为 降序 ,即可达到效果: 如果您想了解背后的原理,您可以「调试」即可看到: 这时,核心指标上虽然展示了最新一天的数据,但是为了展示上更友好,您还可以将最新一天对应的具体日期,展示在核心指标的名称中,如下图在指标上 右键 并点击「修改展示名称
注意:云上Sugar BI单个图表数据缓存的大小限制是 1MB,SQL 查询结果超过 1MB 的将不会缓存;私有部署中默认 2MB 并可通过修改环境变量中的「sugar_query_result_cache_max_size=2」(单位为MB,值直接写对应的取值即可)进行自行配置。
其主要应⽤用场景为: 制作主题性数据⽹网站或主题性报表; 制作包含复杂菜单的数据⼤屏; Sugar BI 提供了数据门户案例集供您参考: 数据门户案例集 数据门户悬浮导航 数据门户的浏览、增加、删除和修改 在空间工作台左侧导航里点击「数据门户」菜单,可以进入到数据门户列表页面,您在这个页面中可以快速浏览空间内各数据门户。
平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。注意:当您确定了数据集为去重或非去重的属性后,便不可修改。 当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。
数据删除 PALO 中的数据删除有以下几种方式: TRUNCATE,该命令用于直接清空表或分区,但不会删除对应的元数据。操作代价较低,再有清空数据需求时,建议使用。 DROP,删除表或分区,会同时删除数据和元数据。 DELETE,Delete 语句用于按条件删除数据,具体说明见本文档 按条件删除 一节。
M 和 N 可自行设置,并且可设置为 0 脱敏符号 :脱敏时默认会被替换为星号,也可以自定义修改 脱敏符号个数固定 :默认情况下脱敏符号个数是和真实的数据的文字个数一致的,如真实数据是:123456,如果所有文字都脱敏的话,脱敏后将会展示为 6 个星号,有些情况下您可能需要固定展示星号的个数,如上图就会只展示 3 个星号 脱敏范围 :您可设置脱敏规则对哪些用户生效或者对哪些用户不生效,需要注意的是
平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。注意:当您确定了数据集为去重或非去重的属性后,便不可修改。 当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。
AI/robot 上述两个表中,都代表三个样本均为重复样本,后两个样本虽然标签不一,但文本内容一致,也为重复样本。 Tips: “如何利用好重复样本”,如果您在模型训练过程中,需要通过增加某个类别标签的预测权重,可以通过增加此标签的重复样本来达到此目标。 平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。注意:当您确定了数据集为去重或非去重的属性后,便不可修改。
我们假设您在 BOS 上已经存放了一个数据文件: bos://yourt_buckets/path/to/file.txt 其内容为以逗号分隔的两行数据: 10000,Smith,Hello PALO! 10001,Jack,Let's loading. 其对应的表结构为上一节中创建的表 testTable 。
数据标注师让 AI 学会“思考” 百度山西数据标注基地数据标注师的工作就是教会AI认识数据,有了足够多、足够好的数据,AI才能学会像人一样去感知、思考和决策,更好地为人类服务。百度山西数据标注基地为山西人工智能产业发展奠基。