"使用Pandas统计元素出现次数" 修訂間的差異
(撤销51.142.170.252(讨论)的版本8685) |
|||
(未顯示由 2 位使用者於中間所作的 28 次修訂) | |||
行 3: | 行 3: | ||
import numpy as np | import numpy as np | ||
df = pd.DataFrame({'姓名':['张三','李四','王五','赵六','刘七'],'性别':['男','女','男','男','女'],'年龄':[25,17,30,20,17],'兴趣':['篮球','跑步','排球','游泳','足球']}) | df = pd.DataFrame({'姓名':['张三','李四','王五','赵六','刘七'],'性别':['男','女','男','男','女'],'年龄':[25,17,30,20,17],'兴趣':['篮球','跑步','排球','游泳','足球']}) | ||
+ | |||
[[File:PythonPandasStat1.png]] | [[File:PythonPandasStat1.png]] | ||
− | 2.使用print(df['性别']. | + | 2.使用print(df['性别'].count())即可 输 出“性别”的统计次数。 |
+ | |||
[[File:PythonPandasStat2.png]] | [[File:PythonPandasStat2.png]] | ||
− | 3.使用print(df['性别'].nunique())即可 | + | 3.使用print(df['性别'].nunique())即可 输 出“性别”的不重复 个 数。 |
+ | |||
[[File:PythonPandasStat3.png]] | [[File:PythonPandasStat3.png]] | ||
+ | |||
+ | 4.使用print(df['性别'].unique())即可输出“性别”的不重复值。 | ||
+ | |||
+ | [[File:PythonPandasStat4.png]] | ||
+ | |||
+ | 5.使用print(df['性别'].value_counts())即可输出“性别”为“男”的个数为3,“性别”为“女”的个数为2。 | ||
+ | |||
+ | [[File:PythonPandasStat5.png]] | ||
+ | |||
+ | 6.使用print(df.loc[df['性别'] == '男'.value_counts())即可单独输出“性别”为“男”的所有值。 | ||
+ | |||
+ | [[File:PythonPandasStat6.png]] | ||
+ | |||
+ | 7.使用print(list(df.性别).count('男'))即可单独输出“性别”为“男”的个数为3。 | ||
+ | |||
+ | [[File:PythonPandasStat7.png]] | ||
+ | |||
+ | 8.使用print((df == 1).sum())即可将DataFrame中所有值为1的数据个数统计。 | ||
+ | import pandas as pd | ||
+ | import numpy as np | ||
+ | df = pd.DataFrame({'第一列':['a',1,'1','one','two'],'第二列':['a','one',1,2,'one'],'第三列':['a',2,1,'one','b']}) | ||
+ | print(df) | ||
+ | print('数字1的总次数:\n',(df==1).sum()) | ||
+ | print('单词one的出现次数:\n',(df=='one').sum()) | ||
+ | print('字母a的出现总次数:\n',(df=='a').sum()) | ||
+ | |||
+ | [[File:PythonPandasStat8.png]] |
於 2023年2月11日 (六) 17:39 的最新修訂
1.在Pyhton中可以使用Pandas统计元素在某列出现的次数。 import pandas as pd import numpy as np df = pd.DataFrame({'姓名':['张三','李四','王五','赵六','刘七'],'性别':['男','女','男','男','女'],'年龄':[25,17,30,20,17],'兴趣':['篮球','跑步','排球','游泳','足球']})
2.使用print(df['性别'].count())即可输出“性别”的统计次数。
3.使用print(df['性别'].nunique())即可输出“性别”的不重复个数。
4.使用print(df['性别'].unique())即可输出“性别”的不重复值。
5.使用print(df['性别'].value_counts())即可输出“性别”为“男”的个数为3,“性别”为“女”的个数为2。
6.使用print(df.loc[df['性别'] == '男'.value_counts())即可单独输出“性别”为“男”的所有值。
7.使用print(list(df.性别).count('男'))即可单独输出“性别”为“男”的个数为3。
8.使用print((df == 1).sum())即可将DataFrame中所有值为1的数据个数统计。 import pandas as pd import numpy as np df = pd.DataFrame({'第一列':['a',1,'1','one','two'],'第二列':['a','one',1,2,'one'],'第三列':['a',2,1,'one','b']}) print(df) print('数字1的总次数:\n',(df==1).sum()) print('单词one的出现次数:\n',(df=='one').sum()) print('字母a的出现总次数:\n',(df=='a').sum())