Python Pandas数据操作介绍

在Pandas中, DataFrame有不同的有用数据操作, 如下所示:

行和列选择

我们可以通过传递行和列的名称来选择DataFrame的任何行和列。当你从DataFrame中选择它时, 它将变为一维并被视为Series。

筛选资料

我们可以通过在DataFrame中提供一些布尔表达式来过滤数据。

注意:如果我们要将布尔结果传递给DataFrame, 则它将显示所有结果。

空值

当没有数据提供给项目时, 可能会出现Null值。各个列可能不包含通常表示为NaN的值。在Pandas中, 有几个有用的功能可用于检测, 删除和替换数据框中的空值。这些功能如下:

isnull():isnull()的主要任务是在任何行具有空值的情况下返回真值。

notnull():与isull()函数相反, 它为非空值返回真值。

dropna():此方法分析并删除空值的行/列。

fillna():它允许用户将NaN值替换为其他一些值。

replace():这是一个非常丰富的函数, 可以替换字符串, 正则表达式, 系列, 字典等。

interpolate():这是一个非常强大的函数, 可填充DataFrame或系列中的空值。

字符串运算

Pandas提供了一组字符串函数, 可对字符串数据进行操作, 并忽略缺少的/ NaN值。使用.str可以执行不同的字符串操作。选项。这些功能如下:

lower():它将系列或索引的任何字符串转换为小写字母。

upper():它将系列或索引的任何字符串转换为大写字母。

strip():此函数有助于从Series / index中的每个字符串中剥离包含新行的空格。

split(”):这是一个使用给定模式分割字符串的函数。

cat(sep =”):使用给定的分隔符连接系列/索引元素。

contains(pattern):如果元素中存在子字符串, 则返回True, 否则返回False。

replace(a, b):将值a替换为值b。

repeat(value):将每个元素重复指定的次数。

count(pattern):它返回每个元素中图案外观的计数。

startswith(pattern):如果系列中的所有元素均以模式开头, 则返回True。

endswith(pattern):如果系列中的所有元素都以模式结尾, 则返回True。

find(pattern):用于返回模式的首次出现。

findall(pattern):返回所有出现的模式的列表。

swapcase:用于交换大小写的大小写。

islower():如果”系列/索引”字符串中的所有字符均为小写, 则返回True。否则, 它返回False。

isupper():如果”系列/索引”字符串中的所有字符均为大写, 则返回True。否则, 它返回False。

isnumeric():如果”系列/索引”字符串中的所有字符均为数字, 则返回True。否则, 它返回False。

计数值

此操作用于使用’value_counts()’选项对出现的总数进行计数。

情节

Pandas使用matplotlib库绘制图形。 .plot()方法允许你绘制数据图。

.plot()函数针对每一列绘制索引。

你也可以将参数传递给plot()函数以绘制特定的列。


来源:

https://www.srcmini02.com/31004.html

微信公众号
手机浏览(小程序)
0
分享到:
没有账号? 忘记密码?