一、 dataframe 加时间索引
方法见下图:
![]()
2020-9-10 11:40:35 上传
下载附件 (66.23 KB)
【注意】
这里增加的索引是一个列表,没有字段名称,用index= ‘列表名’即可二、 时间索引的选择
索引最大的作用就是:选择行的依据,在数据量较大时,索引可以方便我们快速取数据。
还记得之前笔记中选择行的方法有两种:一是,’表名’[行切片];一是 ’表名’.loc[索引号]; 注意iloc不单独选择行,比如:’表名’.iloc[行号x ],结果是第x列。
那么索引做行选择的用法有哪些呢?1、普通选择
![]()
2020-9-10 11:40:35 上传
下载附件 (48.42 KB)
可以看出,甚至可以使用索引的部分信息查出符合条件的多条记录。2、切片选择
![]()
2020-9-10 11:40:35 上传
下载附件 (60.79 KB)
注意:loc[ ]函数是包含下边界时间的。3、truncate()函数
Truncate()函数是减去某一部分的意思,常用参数有before和after。这里的可以使用(before = 索引或部分索引),表示不要包含个时点之前的,而这个时点的数据还是要保留的。
![]()
2020-9-10 11:40:36 上传
下载附件 (35.96 KB)
三、 时间索引分组
按时间索引可以方便地对数据进行分组,可以按年、月、日,也可以按周进行分组,方法如下图:
![]()
2020-9-10 11:40:36 上传
下载附件 (39.38 KB)
![]()
2020-9-10 11:40:36 上传
下载附件 (40.58 KB)四、 总结
本节重点:3种使用“索引 + 表名.loc[] ”选择行的方法,注意truncate()函数使用时要对索引排序。
另外,使用时间索引进行分组,注意表名.index.week的用法。
|