盘点一个Pandas聚类求和问题

IT共享之家

共 1536字,需浏览 4分钟

 ·

2022-06-29 17:22

点击上方“Python共享之家”,进行关注

回复“资源”即可获赠Python学习资料

近泪无干土,低空有断云。

大家好,我是皮皮。

一、前言

前几天在Python最强王者交流群【Chloe】问了一道Pandas处理的问题,如下图所示。

原始数据如下:

df = pd.DataFrame({
'ord_no':[70001,70009,70002,70004,70007,70005,70008,70010,70003,70012,70011,70013],
'purch_amt':[150.5,270.65,65.26,110.5,948.5,2400.6,5760,1983.43,2480.4,250.45, 75.29,3045.6],
'ord_date': ['2012-10-05','2012-09-10','2012-10-05','2012-08-17','2012-09-10','2012-07-27','2012-09-10','2012-10-10','2012-10-10','2012-06-27','2012-08-17','2012-04-25'],
'customer_id':[3001,3001,3005,3001,3005,3001,3005,3001,3005,3001,3005,3005],
'salesman_id': [5002,5005,5001,5003,5002,5001,5001,5006,5003,5002,5007,5001]})
df.groupby(['customer_id','salesman_id']).sum()

怎么才能按照这个分组排purch_amt的序? 预期的结果如下图所示:

二、实现过程

这个是聚类求和的问题,这里【月神】给出一个可行的代码,大家后面遇到了,可以对应的修改下,事半功倍,代码如下所示:

dg = df.groupby(['customer_id''salesman_id'], as_index=False)['purch_amt'].sum()

dg.sort_values(['customer_id''purch_amt''salesman_id'], ascending=[True, False, True]).set_index(['customer_id''salesman_id'])

运行之后,结果就是想要的了。

完美的解决了粉丝的问题!

三、总结

大家好,我是皮皮。这篇文章主要盘点了一道使用Pandas处理数据的问题,文中针对该问题给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【Chloe】提问,感谢【月神】给出的思路和代码解析,感谢【dcpeng】、【冯诚】等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

------------------- End -------------------

往期精彩文章推荐:

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【

万水千山总是情,点个【在看】行不行

浏览 39
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报