音频元数据提取

更新时间：2026-05-18

音频元数据提取

简介

音频元数据提取算子，基于 ffprobe 从音频文件中提取时长、格式、码率、编码器、采样率、声道数等元信息。

功能描述

使用 ffprobe 解析音频文件的 Format 和 Stream 信息
提取音频时长、格式名称、总码率
提取音频编码器、采样率、声道数
支持本地路径和 BOS 对象存储路径（通过预签名 URL 直接 probe，无需下载）
失败时返回 None，不影响整批数据处理

算子参数

输入

输入	含义
input_col	音频文件路径数组，支持本地路径、BOS（bos://）、S3（s3://）路径

输出

输出字段	类型	含义
duration	float64	音频时长（秒）
format_name	string	音频格式名称（如 mp3、wav、flac）
bit_rate	int64	总码率（bps）
audio_codec	string	音频编码器（如 mp3、aac、pcm_s16le）
audio_sample_rate	int32	采样率（Hz）
audio_channels	int32	声道数

参数

参数名称	类型	默认值	描述
timeout	int 或 None	None	ffprobe 执行超时时间（秒），None 表示不限制

调用示例

Plain Text

1from __future__ import annotations
2
3import os
4
5import daft
6from daft import col
7
8from daft.aihc.common.udf import aihc_udf
9from daft.aihc.functions.audio.audio_metadata_extract import AudioMetadataExtract
10
11if __name__ == "__main__":
12    if os.getenv("DAFT_RUNNER", "native") == "ray":
13        import ray
14        ray.init(dashboard_host="0.0.0.0", ignore_reinit_error=True)
15        daft.set_runner_ray()
16    daft.set_execution_config(actor_udf_ready_timeout=6000, min_cpu_per_task=0)
17
18    samples = {
19        "audio_path": [
20            "/tmp/test_audio1.mp3",
21            "/tmp/test_audio2.wav",
22        ]
23    }
24    ds = daft.from_pydict(samples)
25    ds = ds.with_column(
26        "metadata",
27        aihc_udf(
28            AudioMetadataExtract,
29            construct_args={"timeout": 30},
30            num_cpus=1,
31            concurrency=4,
32            batch_size=16,
33        )(col("audio_path")),
34    )
35    ds.show()
36    # 访问具体字段
37    ds = ds.with_column("duration", col("metadata").struct.get("duration"))
38    ds = ds.with_column("audio_codec", col("metadata").struct.get("audio_codec"))
39    ds.show()

评价此篇文章

有帮助没帮助

音频片段切分-时长

音频滤镜处理

百度智能云

百度百舸 · AI计算平台

百度百舸 · AI计算平台

音频元数据提取

简介

功能描述

算子参数

输入

输出

参数

调用示例