URL列表文件迁移
背景信息
本文介绍通过 URL 列表文件迁移到 BOS 的操作教程。百度智能云数据流转平台是百度智能云提供的存储产品数据迁移服务。
使用数据流转平台 CloudFlow,您只需在控制台填写源数据地址和目标 BOS 地址信息,并创建迁移任务即可。启动迁移后,您可以通过控制台管理迁移任务,查看迁移进度等信息;也可以查看迁移失败文件列表,并中断、删除、恢复迁移任务等。
注意事项:
- 源 Object 大小限制 48.8 TB。若您在控制台上传,则文件大小上限为 5 GB。若文件大小超过 5 GB,请通过分片上传方式上传到 BOS。
- 源目录需为允许读取的状态,保证 BOS 可获取到该 Object。
- 若迁移的文件与目标 Bucket 中的某一个文件重名,Bucket 中该文件将直接被新文件覆盖。
- 传输服务运行时,第三方源路径可能会产生读取费用;BOS 写入目标 Bucket 时会产生请求费用。
- 在线导入任务会占用一定的带宽资源,因此用户需要合理安排任务执行时间,避免带宽被占满后对其他业务的影响。
准备工作
开始迁移前,您需要准备 URL 列表文件,并在百度智能云 BOS 中做一些准备工作。
URL列表文件准备
预估迁移数据
预估需要迁移的数据,包括迁移存储量和迁移文件个数。
说明: 迁移任务的迁移时间取决于待迁移文件数量和文件容量。CloudFlow 会自适应您的迁移带宽性能,但若文件数量和容量较大,迁移时间可能较长。您可以在控制台查看迁移进程,若有迁移失败的文件,您可以导出失败文件并重传。
开启读权限
您需要开启源端读权限。
百度智能云BOS准备
创建目标存储空间(Bucket)
创建目标存储空间,用于存放迁移的数据。详情请参见创建存储空间。
迁移实施
登录数据流转平台
1.登录数据流转平台CloudFlow
2.登录数据流转平台CloudFlow
进入控制台后,单击【新建迁移任务】,进入任务配置页面,进行迁移参数的设置。
任务设置
您需要对迁移任务的名称和迁移启动时间进行设置。
配置项 | 配置描述 |
---|---|
迁移任务名称 |
|
开始迁移时间 |
|
源端设置
您需要迁移源端信息进行设置。
配置项 | 配置描述 |
---|---|
数据源端 |
|
选择 URL 列表文件 |
|
目的端设置
您需要迁移目的端信息进行设置。
配置项 | 配置描述 |
---|---|
目的端 AccessKey |
|
目的端 SecretKey |
|
目的端 Bucket 名称 |
|
保存路径 |
|
保留源路径 |
|
存储类型 |
|
同名保留策略 |
|
ACL权限设置 |
|
性能设置
您需要根据迁移需求选择合适的性能设置,CloudFLow 配置每秒文件数和迁移速度限制。如果整个迁移过程时间较长,可以利用限制迁移文件数和调整迁移速度,在低谷时加速迁移以确保业务稳定,而在高峰时减缓或暂停以控制成本。
配置项 | 配置描述 |
---|---|
性能配置 |
|
URL列表文件格式要求
URL 列表文件仅需包含以下信息:
- Object 在源目录的位置,以 URL 方式定义;
每一行代表一个 Object URL,如下图所示:
查看迁移状态和进度
在数据流转平台 CloudFlow 控制台,您可以查看所有迁移任务的状态和进度。
迁移状态
- 待迁移:若用户指定时间发起数据迁移,任务状态为待迁移;
- 任务完成有失败文件:任务完成,但部分文件迁移成功,部分失败。您可以在列表中查看迁移成功和失败的数量,并导出失败文件列表;
- 任务成功:任务完成,且文件全部迁移成功;
- 任务暂停:中途主动暂停迁移任务;
- 任务失败:计划迁移的文件全部迁移失败,0个文件迁移成功,您需要排查迁移失败的原因。
说明: 由于迁移任务时间可能较长,列表中迁移成功和失败的文件数量将会每 30 秒更新一次。若数字暂停,请耐心等待。
相关操作
- 查看详情:点击后查看任务配置详情和任务传输详情;
- 导出失败文件列表:点击后可以下载当前的迁移失败文件;
- 删除任务:任务完成后讲不需要的任务删除。任务删除后不影响已经迁移的文件;
- 暂停任务:当任务处于"迁移中"或者"待迁移"状态时将迁移任务暂停,适合迁移配置错误或不希望继续迁移的场景,以便及时阻止任务。点击暂停任务后,该按钮变为"恢复任务",点击后可断点重传。