59.时间序列数据汇总

李光朱课程 2024-05-19 03:47:37
案例导入

如下表,将第1列作为索引列,引擎为”openpyxl”。请汇总每一天的测量值。添加代码注释。

时间

测量值

2022-03-18 00:00:00

5

2022-03-18 01:00:00

9

2022-03-18 02:00:00

6

2022-03-18 03:00:00

9

2022-03-18 04:00:00

8

2022-03-18 05:00:00

10

2022-03-18 06:00:00

4

2022-03-18 07:00:00

3

2022-03-18 08:00:00

6

2022-03-18 09:00:00

3

2022-03-18 10:00:00

1

2022-03-18 11:00:00

6

2022-03-18 12:00:00

7

2022-03-18 13:00:00

4

2022-03-18 14:00:00

1

2022-03-18 15:00:00

7

2022-03-18 16:00:00

4

2022-03-18 17:00:00

10

2022-03-18 18:00:00

8

2022-03-18 19:00:00

6

2022-03-18 20:00:00

6

2022-03-18 21:00:00

1

2022-03-18 22:00:00

5

2022-03-18 23:00:00

4

2022-03-19 00:00:00

5

2022-03-19 01:00:00

5

2022-03-19 02:00:00

4

2022-03-19 03:00:00

1

2022-03-19 04:00:00

8

2022-03-19 05:00:00

6

2022-03-19 06:00:00

1

2022-03-19 07:00:00

2

2022-03-19 08:00:00

8

2022-03-19 09:00:00

4

2022-03-19 10:00:00

9

2022-03-19 11:00:00

1

2022-03-19 12:00:00

8

2022-03-19 13:00:00

2

2022-03-19 14:00:00

5

2022-03-19 15:00:00

2

2022-03-19 16:00:00

6

2022-03-19 17:00:00

9

2022-03-19 18:00:00

6

2022-03-19 19:00:00

2

2022-03-19 20:00:00

1

2022-03-19 21:00:00

8

2022-03-19 22:00:00

1

2022-03-19 23:00:00

2

2022-03-20 00:00:00

6

2022-03-20 01:00:00

6

2022-03-20 02:00:00

10

2022-03-20 03:00:00

9

2022-03-20 04:00:00

6

2022-03-20 05:00:00

7

2022-03-20 06:00:00

8

2022-03-20 07:00:00

10

2022-03-20 08:00:00

1

2022-03-20 09:00:00

3

2022-03-20 10:00:00

1

2022-03-20 11:00:00

3

2022-03-20 12:00:00

2

2022-03-20 13:00:00

10

2022-03-20 14:00:00

9

2022-03-20 15:00:00

5

2022-03-20 16:00:00

2

2022-03-20 17:00:00

4

2022-03-20 18:00:00

10

2022-03-20 19:00:00

7

2022-03-20 20:00:00

6

2022-03-20 21:00:00

10

2022-03-20 22:00:00

4

2022-03-20 23:00:00

7

2022-03-21 00:00:00

7

2022-03-21 01:00:00

9

2022-03-21 02:00:00

8

2022-03-21 03:00:00

6

2022-03-21 04:00:00

2

2022-03-21 05:00:00

6

2022-03-21 06:00:00

10

2022-03-21 07:00:00

3

2022-03-21 08:00:00

2

2022-03-21 09:00:00

1

2022-03-21 10:00:00

7

2022-03-21 11:00:00

2

2022-03-21 12:00:00

9

2022-03-21 13:00:00

1

2022-03-21 14:00:00

7

2022-03-21 15:00:00

2

2022-03-21 16:00:00

2

2022-03-21 17:00:00

10

2022-03-21 18:00:00

5

2022-03-21 19:00:00

5

2022-03-21 20:00:00

4

2022-03-21 21:00:00

6

2022-03-21 22:00:00

4

2022-03-21 23:00:00

1

2022-03-22 00:00:00

5

2022-03-22 01:00:00

10

2022-03-22 02:00:00

6

2022-03-22 03:00:00

9

文心一言提示词

打开百度“文心一言”,输入提示词:“你是pandas专家。文件路径为:D:/Samples/时间序列.xlsx。用pandas导入Excel文件中第1个工作表中的数据,将第1列作为索引列,引擎为”openpyxl”。请汇总每一天的测量值。添加代码注释。”

显示结果如下:

首先,你需要确保你已经安装了pandas库以及openpyxl引擎(用于读取.xlsx文件)。如果尚未安装,你可以使用pip来安装它们:

pip install pandas openpyxl

接下来,你可以使用下面的Python代码来完成你的需求:

import pandas as pd# 文件路径file_path = 'D:/Samples/时间序列.xlsx'# 读取Excel文件中第1个工作表的数据,第1列作为索引列,使用'openpyxl'作为引擎# parse_dates参数用于指定哪一列或多列应该被解析为日期,这里假设日期在第一行且列名为'Date'# 如果你的日期列没有特定的列名,而是直接作为第一列(即索引列),则不需要指定parse_datesdf = pd.read_excel(file_path, sheet_name=0, index_col=0, engine='openpyxl')# 假设'Value'是你要汇总的测量值的列名# 如果你的列名不同,请替换为实际的列名# 使用resample方法按天汇总数据,这里使用'sum'作为聚合函数# 如果你的数据已经是按天排序的,可以省略base参数# 如果你的索引不是日期时间类型,你需要先将其转换为日期时间类型df.index = pd.to_datetime(df.index) # 确保索引是日期时间类型daily_summary = df['Value'].resample('D').sum() # 假设你的测量值在'Value'列中# 输出每天的测量值汇总print(daily_summary)# 如果需要将结果保存回Excel文件,可以使用下面的代码output_path = 'D:/Samples/时间序列_每日汇总.xlsx'daily_summary.to_excel(output_path)

注意:

在上面的代码中,我假设你的日期列是索引列,并且你的测量值在名为'Value'的列中。你需要根据你的实际Excel文件结构来修改这些参数。如果你的日期列不是索引列,而是普通的数据列,你需要先将其设置为索引列,或者在使用resample方法时指定on参数为日期列的列名。如果你的日期列没有特定的列名(例如,它直接作为第一列,并且你想将其作为索引),那么index_col=0已经足够了,你不需要额外指定parse_dates。resample('D')会按照天数重新采样数据。这要求你的索引是日期时间类型。如果不是,你需要先将其转换为日期时间类型,如上面的代码所示。我使用了sum作为聚合函数来汇总测量值。如果你的需求是求平均值、最大值、最小值等,你可以相应地更改聚合函数。Python运行结果

图1.Python运行结果

文心一言给的代码示例中的‘value’需要根据实际情况改为‘测量值’。

0 阅读:18

李光朱课程

简介:感谢大家的关注