对比Excel,学习pandas数据透视表

日常学python

共 2087字,需浏览 5分钟

 ·

2021-06-12 17:13

Excel中做数据透视表


① 选中整个数据源;

12199da9cc2cc94215bc7cc6d0eeaa5c.webp


② 依次点击“插入”—“数据透视表”

2f1586cf1e403c025faabc7506a08a16.webp


③ 选择在Excel中的哪个位置,插入数据透视表

2c3cd76405d3726a08a7358bfca6f6cc.webp


④ 然后根据实际需求,从不同维度展示结果

7c6beb7b7c954470437088a7b9c2c096.webp


⑤ 结果如下

ba2ee221736a9e60d77ddc5127cc5b8f.webp


pandas用pivot_table()做数据透视表


1)语法格式

pd.pivot_table(data,index=None,columns=None,
values=None,aggfunc='mean',
margins=False,margins_name='All',
dropna=True,fill_value=None)

2)对比excel,说明上述参数的具体含义

d6e6bb4b1a72d883a9dd3a0c8de5e698.webp


参数说明:

  • data 相当于Excel中的"选中数据源";

  • index 相当于上述"数据透视表字段"中的行;

  • columns 相当于上述"数据透视表字段"中的列;

  • values 相当于上述"数据透视表字段"中的值;

  • aggfunc 相当于上述"结果"中的计算类型;

  • margins 相当于上述"结果"中的总计;

  • margins_name 相当于修改"总计"名,为其它名称;

下面几个参数,用的较少,记住干嘛的,等以后需要就百度。

  • dropna 表示是否删除缺失值,如果为True时,则把一整行全作为缺失值删除;

  • fill_value 表示将缺失值,用某个指定值填充。

案例说明


1)求出不同品牌下,每个月份的销售数量之和


① 在Excel中的操作结果如下

ac6d37cabc6eeaaacaf1809a9c56bb88.webp


② 在pandas中的操作如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index="品牌",columns="月份",
values="销售数量",aggfunc=np.sum)
display(df1)

结果如下:

73f7d31f558a60b5d23a7f2c0ad0c9cb.webp


2)求出不同品牌下,每个地区、每个月份的销售数量之和


① 在Excel中的操作结果如下

5693344919c3e70ea7c2430c082896a2.webp


② 在pandas中的操作如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index="品牌",columns=["销售区域","月份"],
values="销售数量",aggfunc=np.sum)
display(df1)

结果如下:

988777fe88fe731da26a0a3026488cc4.webp


3)求出不同品牌不同地区下,每个月份的销售数量之和


① 在Excel中的操作结果如下

26357a3abd2dd599aa555f646d59b78f.webp


② 在pandas中的操作如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=["品牌","销售区域"],columns="月份",
values="销售数量",aggfunc=np.sum)
display(df1)

结果如下:

52a1c40bb1d3ee7f366302c8de351d39.webp


4)求出不同品牌下的“销售数量之和”与“货号计数”


① 在Excel中的操作结果如下

3664926d7189060a8eaae6da65ab29e5.webp


② 在pandas中的操作如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index="品牌",columns="月份",
values=["销售数量","货号"],
aggfunc={"销售数量":"sum","货号":"count"},
margins=True,margins_name="总计")
display(df1)

结果如下:

ced1984ec070cf8233a8f6bd23f7d309.webp



b97a84389a8d8284aa3643a39aeb0134.webp往期文章
这款免费插件,让Excel轻松制作酷炫图表Python优化机制:常量折叠神器 jupyter,终于来了!


浏览 35
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报