Python是进行数据分析的一种出色语言, 主要是因为以数据为中心的python软件包具有奇妙的生态系统。Pandas 是这些软件包之一, 使导入和分析数据更加容易。
Pandas 系列是带有轴标签的一维ndarray。标签不必是唯一的, 但必须是可哈希的类型。该对象同时支持基于整数和基于标签的索引, 并提供了许多用于执行涉及索引的操作的方法。
Pandas Series.value_counts()函数返回一个包含唯一值计数的Series。生成的对象将按降序排列, 以便第一个元素是最频繁出现的元素。默认情况下不包括NA值。
语法:Series.value_counts(normalize = False, sort = True, ascending = False, bins = None, dropna = True)参数:normalize:如果为True, 则返回的对象将包含唯一值的相对频率。 sort:按值排序。升序:以升序排列。 bins:而不是对值进行计数, 而是将它们分组为半开容器, 这对于pd.cut来说很方便, 仅适用于数字数据。 dropna:不包括NaN计数。返回:计数:系列
示例1:采用Series.value_counts()函数以查找给定Series对象中每个元素的唯一值计数。
# importing pandas as pd
import pandas as pd
# Creating the Series
sr = pd.Series([ 'New York' , 'Chicago' , 'Toronto' , 'Lisbon' , 'Rio' , 'Chicago' , 'Lisbon' ])
# Print the series
print (sr)
输出:
现在我们将使用Series.value_counts()函数来查找给定Series对象中每个唯一值的值计数。
# find the value counts
sr.value_counts()
输出:
正如我们在输出中看到的, Series.value_counts()函数已返回给定Series对象中每个唯一值的值计数。
示例2:采用Series.value_counts()函数以查找给定Series对象中每个元素的唯一值计数。
# importing pandas as pd
import pandas as pd
# Creating the Series
sr = pd.Series([ 100 , 214 , 325 , 88 , None , 325 , None , 325 , 100 ])
# Print the series
print (sr)
输出:
现在我们将使用Series.value_counts()函数来查找给定Series对象中每个唯一值的值计数。
# find the value counts
sr.value_counts()
输出:
正如我们在输出中看到的,
Series.value_counts()
函数已返回给定Series对象中每个唯一值的值计数。
首先, 你的面试准备可通过以下方式增强你的数据结构概念:Python DS课程。
来源:
https://www.srcmini02.com/70229.html