在Pandas中, DataFrame有不同的有用数据操作, 如下所示:
行和列选择
我们可以通过传递行和列的名称来选择DataFrame的任何行和列。当你从DataFrame中选择它时, 它将变为一维并被视为Series。
筛选资料
我们可以通过在DataFrame中提供一些布尔表达式来过滤数据。
注意:如果我们要将布尔结果传递给DataFrame, 则它将显示所有结果。
空值
当没有数据提供给项目时, 可能会出现Null值。各个列可能不包含通常表示为NaN的值。在Pandas中, 有几个有用的功能可用于检测, 删除和替换数据框中的空值。这些功能如下:
isnull():isnull()的主要任务是在任何行具有空值的情况下返回真值。
notnull():与isull()函数相反, 它为非空值返回真值。
dropna():此方法分析并删除空值的行/列。
fillna():它允许用户将NaN值替换为其他一些值。
replace():这是一个非常丰富的函数, 可以替换字符串, 正则表达式, 系列, 字典等。
interpolate():这是一个非常强大的函数, 可填充DataFrame或系列中的空值。
字符串运算
Pandas提供了一组字符串函数, 可对字符串数据进行操作, 并忽略缺少的/ NaN值。使用.str可以执行不同的字符串操作。选项。这些功能如下:
lower():它将系列或索引的任何字符串转换为小写字母。
upper():它将系列或索引的任何字符串转换为大写字母。
strip():此函数有助于从Series / index中的每个字符串中剥离包含新行的空格。
split(”):这是一个使用给定模式分割字符串的函数。
cat(sep =”):使用给定的分隔符连接系列/索引元素。
contains(pattern):如果元素中存在子字符串, 则返回True, 否则返回False。
replace(a, b):将值a替换为值b。
repeat(value):将每个元素重复指定的次数。
count(pattern):它返回每个元素中图案外观的计数。
startswith(pattern):如果系列中的所有元素均以模式开头, 则返回True。
endswith(pattern):如果系列中的所有元素都以模式结尾, 则返回True。
find(pattern):用于返回模式的首次出现。
findall(pattern):返回所有出现的模式的列表。
swapcase:用于交换大小写的大小写。
islower():如果”系列/索引”字符串中的所有字符均为小写, 则返回True。否则, 它返回False。
isupper():如果”系列/索引”字符串中的所有字符均为大写, 则返回True。否则, 它返回False。
isnumeric():如果”系列/索引”字符串中的所有字符均为数字, 则返回True。否则, 它返回False。
计数值
此操作用于使用’value_counts()’选项对出现的总数进行计数。
情节
Pandas使用matplotlib库绘制图形。 .plot()方法允许你绘制数据图。
.plot()函数针对每一列绘制索引。
你也可以将参数传递给plot()函数以绘制特定的列。
来源:
https://www.srcmini02.com/31004.html