智能业务分析

BOS提供标准存储、低频存储、冷存储三种存储类型,为用户提供不同成本的存储选择。业界产品也通常会提供 “生命周期” 功能,用户简单配置之后,系统会将数据进行自动化下沉,以此降低用户的存储成本。但用户通常会有个困扰,该如何配置数据的生命周期?如果配得天数过小,热数据过早下沉为冷数据,业务取用不便,并会在取用时产生不必要的取回费用;如果天数配得过大,业务侧已经不常使用的逐渐冷化数据依然按照较高成本存储,造成较高的存储支出。

基于上述考虑,百度智能云BOS推出了“智能业务分析” 功能,通过基于用户对数据使用情况的深度分析,科学预测出后续客户业务对数据的持续使用频次,从而给出用户最省钱的生命周期配置策略。

使用前须知

BOS当前三种存储类型:标准存储、低频存储、冷存储的容量价格依次降低,但低频存储和冷存储在取回时需要支付相应的取回费用。另外,三种存储类型的性能也有所不同。具体可参见分级存储

BOS智能业务分析,会帮助您科学地分析出标准存储向低频存储沉降的最佳天数,从而帮助您在相同的业务访问下,支付最少的存储容量费用+数据取回费用。

注意:BOS智能业务分析暂时不会向您建议标准存储或低频存储向冷存储的沉降天数,因为冷存储主要应用于冷备场景,其性能相比前两档存储类型会有较大的差距。如果您贸然将热数据过早沉降为冷存储,有可能会影响您业务侧访问时的性能体验。

操作步骤

  1. 登录BOS控制台后,在全局概览页中找到智能业务分析功能入口,点击开通服务。

    image.png

  2. 开通服务后,需要对您预期进行智能分析的文件目录进行定义.

    image.png

    可以直接以Bucket作为分析路径,则系统会以该Bucket内所有文件作为样本进行分析;也可对Bucket中的部分目录前缀进行分析。

    说明

    • 第一次提交配置,或后续增加新的待分析路径配置时,系统会从提交配置之日起分析用户对该路径下文件的访问行为。系统暂不会对该目录之前历史访问行为进行分析。
    • 对于新配置的路径,系统监测时间越长则判断越准确。因此系统会基于新提交的配置,在3天后为您提供第一份分析报告。
  3. 系统生成的报告如下图所示
    image.png

    图中关键信息说明:

    • 横坐标:Object Age,即文件寿命,单位是天。可理解为文件自上传时刻起到当前为止的时间。
    • 纵坐标:用户对各age范围文件的取用量,单位是GB。
    • 紫色线:代表用户真实取用量。以紫色线中一个点x=30,y=400为例,即代表该目录下所有文件中,距今寿命是30天的文件,平均每天会被用户取用400GB。
    • 蓝色线:是一条基准线,代表结合线上价格,标准存储和低频存储之间转换的临界值,即代表在这个取用行为走势下,使用标准或低频的消费额一样。
    • 小红旗:即蓝色线和紫色线的交汇点,代表在这个object age下,用户配置生命周期沉降最划算。
  4. 策略建议解读:
    基于蓝色线和紫色线的走势关系,BOS会结合各类情况给出智能化策略建议,即上图下方的绿色文字部分。
    因蓝线和紫线的走势形态有多种,BOS系统给出的策略大体会有如下几种:

    • 当分析发现该部分文件访问一直较频繁,BOS会建议用户一直使用标准存储类型,不做生命周期沉降策略。
    • 当分析发现该部分文件访问一直较少,BOS会建议用户将该部分文件直接配置为低频存储。
    • 当分析发现该部分文件的访问行为有章可循,热数据访问较多、冷数据访问较少,则会建议在临界点配置生命周期沉降策略。
    • 当分析发现该部分文件访问规律较弱,BOS也会结合分析数据给出相应的沉降天数建议。
      以上图为例,经过BOS系统的分析,建议该用户将标准存储向低频存储沉降的生命周期策略配置为36天。

目前BOS智能业务分析功能正在火热公测中,可点击进行公测申请