Pandas的26个统计汇总函数实战案例。-轻识

今天为大家讲述Pandas统计汇总函数中的26个函数。

注明： 由于实际问题中，表格数据每一行代表一个样本，每一列代表一个字段，一般情况下对行操作的意义不大，主要是对每个不同列进行操作。因此，下面我们仅讲述对列的操作。

为了讲述这些函数，我们先构造一些数据源，方便我们用于操作。

import numpy as np
import pandas as pd

data = [[1, 2, np.nan], [2, np.nan, 3], [7, 8, 9], [3, 4, 5]]
date_range = pd.date_range(start="20180701", periods=4)
df1 = pd.DataFrame(data=data, index=date_range,
                   columns=['a', 'b', 'c'])
df1

df2 = pd.DataFrame({'Q':['LI','ZHANG','ZHANG','LI','WANG'], 
                   'A' : [1,1,1,2,2], 
                   'B' : [1,-1,0,1,2], 
                   'C' : [3,4,5,6,7]})
df2

df3 = pd.DataFrame({"id":[f"00{i}" for i in range(1,8)],
                   "score":[2,3,4,5,6,7,8]})
df3

df4 = pd.DataFrame({"姓名":["张三","李四","王五","赵六","沈七"],
                    "语文":[85,85,85,95,90],
                    "数学":[90,65,75,80,55],
                    "外语":[55,50,40,55,40]})
df4