MD5哈希值计算
更新时间:2026-04-23
简介
MD5哈希值计算器
功能描述
- 针对每条文本数据生成对应的MD5哈希值
- 输出固定长度(32位小写十六进制)指纹
- 支持批量处理
算子参数
输入
| 输入列名 | 说明 |
|---|---|
| text | 待处理的文本列,要求元素类型为字符串 |
输出
| 输出 | 含义 | 示例 |
|---|---|---|
| md5_hash | 计算后的哈希值 |
调用示例
Plain Text
1from __future__ import annotations
2
3import os
4import daft
5from daft import col
6
7from daft.aihc.common.udf import aihc_udf
8from daft.aihc.functions.text.md5_calculator import Md5Calculator
9
10if __name__ == "__main__":
11 if os.getenv("DAFT_RUNNER", "native") == "ray":
12 import ray
13 ray.init(dashboard_host="0.0.0.0", ignore_reinit_error=True)
14 daft.set_runner_ray()
15 daft.set_execution_config(actor_udf_ready_timeout=6000, min_cpu_per_task=0)
16
17 samples = {
18 "text": [
19 'Hello, World!',
20 "Hello, World !",
21 'Hello,World!',
22 ]
23 }
24
25 ds = daft.from_pydict(samples)
26 ds = ds.with_column(
27 "md5_hash",
28 aihc_udf(Md5Calculator)(col("text")),
29 )
30
31 ds.show()
评价此篇文章
