Python是进行数据分析的一种出色语言, 主要是因为以数据为中心的Python软件包具有奇妙的生态系统。大熊猫是这些软件包之一, 使导入和分析数据更加容易。
熊猫系列可以执行一些重要的数学运算, 以简化使用Python的数据分析并节省大量时间。
要获取使用的数据集, 请单击这里.
s=read_csv("stock.csv", squeeze=True)
#reading csv file and making seires
函数 | 采用 |
---|---|
s.sum() | 返回序列中所有值的总和 |
s.mean() | 返回序列中所有值的平均值。等于s.sum()/ s.count() |
s.std() | 返回所有值的标准偏差 |
s.min()或s.max() | 返回序列的最小值和最大值 |
s.idxmin()或s.idxmax() | 返回序列的最小值或最大值的索引 |
s.median() | 返回所有值的中位数 |
s.mode() | 返回系列的模式 |
s.value_counts() | 返回具有每个值的频率的序列 |
s.describe() | 根据所传递数据的dtype返回带有平均值, 众数等信息的序列 |
代码1:
# import pandas for reading csv file
import pandas as pd
#reading csv file
s = pd.read_csv( "stock.csv" , squeeze = True )
#using count function
print (s.count())
#using sum function
print (s. sum ())
#using mean function
print (s.mean())
#calculatin average
print (s. sum () /s.count())
#using std function
print (s.std())
#using min function
print (s. min ())
#using max function
print (s. max ())
#using count function
print (s.median())
#using mode function
print (s.mode())
输出如下:
3012
1006942.0
334.3100929614874
334.3100929614874
173.18720477113115
49.95
782.22
283.315
0 291.21
代码2:
# import pandas for reading csv file
import pandas as pd
#reading csv file
s = pd.read_csv( "stock.csv" , squeeze = True )
#using describe function
print (s.describe())
#using count function
print (s.idxmax())
#using idxmin function
print (s.idxmin())
#count of elements having value 3
print (s.value_counts().head( 3 ))
输出如下:
dtype: float64
count 3012.000000
mean 334.310093
std 173.187205
min 49.950000
25% 218.045000
50% 283.315000
75% 443.000000
max 782.220000
Name: Stock Price, dtype: float64
3011
11
291.21 5
288.47 3
194.80 3
Name: Stock Price, dtype: int64
意外的输出和限制:
.sum()、. mean()、. mode()、. median()和其他此类数学运算不适用于字符串或数字值以外的任何其他数据类型。
字符串系列上的.sum()会提供意外的输出, 并通过串联每个字符串返回一个字符串。
首先, 你的面试准备可通过以下方式增强你的数据结构概念:Python DS课程。
来源:
https://www.srcmini02.com/70301.html