"使用Pandas统计元素出现次数" 修訂間的差異

於 2023年2月11日 (六) 17:39 的最新修訂

1.在Pyhton中可以使用Pandas统计元素在某列出现的次数。
  import pandas as pd
  import numpy as np
  df = pd.DataFrame({'姓名':['张三','李四','王五','赵六','刘七'],'性别':['男','女','男','男','女'],'年龄':[25,17,30,20,17],'兴趣':['篮球','跑步','排球','游泳','足球']})

2.使用print(df['性别'].count())即可输出“性别”的统计次数。

3.使用print(df['性别'].nunique())即可输出“性别”的不重复个数。

4.使用print(df['性别'].unique())即可输出“性别”的不重复值。

5.使用print(df['性别'].value_counts())即可输出“性别”为“男”的个数为3，“性别”为“女”的个数为2。

6.使用print(df.loc[df['性别'] == '男'.value_counts())即可单独输出“性别”为“男”的所有值。

7.使用print(list(df.性别).count('男'))即可单独输出“性别”为“男”的个数为3。

8.使用print((df == 1).sum())即可将DataFrame中所有值为1的数据个数统计。
  import pandas as pd
  import numpy as np
  df = pd.DataFrame({'第一列':['a',1,'1','one','two'],'第二列':['a','one',1,2,'one'],'第三列':['a',2,1,'one','b']})
  print(df)
  print('数字1的总次数:\n',(df==1).sum())
  print('单词one的出现次数:\n',(df=='one').sum())
  print('字母a的出现总次数：\n',(df=='a').sum())