快速入门
本文介绍从开通服务到创建使用数据湖缓存加速工具RapidFS的完整流程,帮助您快速上手数据湖缓存加速工具RapidFS。
使用流程
1.开通RapidFS服务
新用户首次使用RapidFS前,请先完成百度智能云账号注册、实名认证,并在控制台开通RapidFS服务。
- 具体操作请参考:开通服务
2.创建缓存实例
开通RapidFS服务后,您需要根据业务规模、性能需求及运维方式,选择合适的RapidFS部署模式创建缓存实例。目前支持以下两种模式。
2.1.全托管模式
全托管模式下,用户无需自行购买Master节点和Cache节点,所有资源均由百度智能云平台统一托管。平台将自动构建并管理独立的RapidFS缓存集群,百度智能云团队负责集群的部署、运维及可用性、稳定性保障,用户无需自行维护节点,可更加专注于业务使用。该模式部署简单、开箱即用,按购买的缓存容量计费,适用于需要稳定缓存能力、希望降低运维复杂度,以及对BOS数据进行高性能访问加速的通用数据湖场景。
- 具体操作请参考:新建缓存实例(全托管模式)
2.2.Master托管模式
Master托管模式下,用户需购买Master节点,并自行提供Cache节点资源(如BCC、CCE、百舸全托管资源池等)。RapidFS集群创建完成后,用户需手动添加Cache节点。该模式支持复用VPC内计算节点的闲置内存或SSD资源,构建高性能分布式缓存层,按实际管理的容量计费,具备更高性价比。适用于希望降低成本、对BOS数据进行缓存加速,并具备一定运维能力的业务场景。
根据不同的Cache节点类型,具体操作流请参考:
- BCC:新建缓存实例(Master托管模式/服务器类型Cache节点)、Cache节点管理(服务器类型Cache节点)
- CCE:新建缓存实例(Master托管模式/Kubernetes集群类型Cache节点)、Cache节点管理(Kubernetes集群类型Cache节点)
- 百舸全托管资源池:新建缓存实例(Master托管模式/百舸全托管资源池类型Cache节点)、Cache节点管理(百舸全托管资源池类型Cache节点)
3.创建权限组(可选)
您可以创建权限组,以保障服务访问安全。通过权限组的白名单机制,可为不同IP或网段设置访问权限,提升数据访问安全性。RapidFS会提供一个默认权限组,支持所有IP读写。
说明:一个数据源只能绑定一个权限组,但一个权限组可以绑定多个数据源,且可在权限组中配置多条权限规则。
- 具体操作请参考:新建权限组
4.导入数据源
创建缓存实例后,您还需要导入数据源,并将数据源关联到已创建的缓存实例上。您可以创建多个数据源(最多20个),一个数据源对应BOS中的一个Bucket或目录。
- 具体操作见:导入数据源
5.挂载使用
导入数据源后,您就可以把BOS中的Bucket桶以文件系统的形式供计算节点直接读写。
根据不同计算节点,具体操作流请参考:
- BCC:使用数据源
- CCE:使用数据湖存储加速工具RapidFS
- 百舸全托管资源池:RapidFS Master托管实例缓存加速
6.监控管理
可以RapidFS控制台查看监控和报警信息。
7.数据流转
数据源创建完成后,可通过设置以下数据流转规则提升数据一致性与访问性能:
- 元数据同步规则:当通过非挂载方式操作存储桶数据导致目录不一致时,可同步存储桶中的元数据信息至数据源目录树。
- 缓存预热规则:提前将指定目录下的数据缓存至实例中,加速数据访问。
- 缓存淘汰规则:实例容量不足时,缓存默认按 LRU 策略淘汰数据;也可主动清理指定目录下的缓存,释放可用容量。
评价此篇文章
