文件下载(二进制)
更新时间:2026-06-15
简介
LoadFileBytes
算子参数
输入
| 输入 | 含义 |
|---|---|
| file_urls | 文件url |
输出
| 输出 | 含义 |
|---|---|
| result | 算子输出 |
参数
无
调用示例
Python
1from __future__ import annotations
2
3import os
4
5import daft
6from daft import col
7
8from daft.aihc.common.udf import aihc_udf
9from daft.aihc.functions.file.download import LoadFileBytes
10
11if __name__ == "__main__":
12 if os.getenv("DAFT_RUNNER", "native") == "ray":
13 import ray
14 ray.init(dashboard_host="0.0.0.0", ignore_reinit_error=True)
15 daft.set_runner_ray()
16 daft.set_execution_config(actor_udf_ready_timeout=6000, min_cpu_per_task=0)
17
18 # TODO: 根据实际场景准备样本数据
19 samples = {"file_urls": [...]}
20 ds = daft.from_pydict(samples)
21 ds = ds.with_column(
22 "result",
23 aihc_udf(
24 LoadFileBytes,
25 num_cpus=1,
26 concurrency=4,
27 batch_size=8,
28 )(col("file_urls")),
29 )
30 ds.show()
评价此篇文章
