简介:Pandas 是 Python 中用于数据处理和分析的强大库,其时间序列功能可以帮助我们轻松处理日期和时间数据。本文将介绍如何使用 Pandas 进行时间转化和计算。
Pandas 的日期和时间处理是其核心功能之一,这使得数据分析师可以更高效地处理时间序列数据。以下是 Pandas 时间转化和计算的一些基本操作:
import pandas as pd
to_datetime 函数来创建日期和时间序列。以下是一个示例:这将输出:2023-07-19 00:00:00。
date_string = '2023-07-19'date = pd.to_datetime(date_string)print(date)
这将输出两个日期之间的时间差(例如几天)。
current_date = pd.to_datetime(pd.Timestamp.now())date = pd.to_datetime('2023-07-19')delta = current_date - dateprint(delta)
这将创建一个包含从2023年1月1日到2023年12月31日的日期的时间序列索引的 DataFrame。
dates = pd.date_range(start='2023-01-01', end='2023-12-31')df = pd.DataFrame(index=dates)print(df)
这将输出当前时间与中午12点之间的分钟数差。
current_time = pd.to_datetime(pd.Timestamp.now())noon = pd.to_datetime('12:00:00')delta = (noon - current_time).dt.total_seconds() / 60 # 转换为分钟数print(delta)
这将输出格式化后的日期字符串。
formatted_date = date.strftime('%d/%m/%Y') # 将日期格式化为 '19/07/2023' 的形式print(formatted_date)
cumsum 和 cumprod。这些函数可以用于计算时间序列数据中连续时间段的总和或累积产品。例如,计算每天销售量的累积总和:这将输出每天销售量的累积总和序列。
sales = pd.Series([100, 150, 200, 250], index=pd.date_range(start='2023-07-19', periods=4)) # 创建一个销售序列,日期从2023年7月19日到2023年7月22日,每天一个数据点cumulative_sales = sales.cumsum() # 计算累积总和print(cumulative_sales)