如何在Pandas Python中找到数据框中特定列的标准偏差?
标准差说明数据集中的值如何分布。他们还告诉数据集中的值与数据集中各列的算术平均值相差多远。
有时,可能需要获取本质上为数字的特定列的标准偏差。这是std()
可以使用该功能的地方。可以将需要计算均值的列索引到数据框,并可以使用点运算符对此调用均值函数。
也可以传递列的索引以找到标准偏差。
让我们看一个相同的演示-
示例
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])} print("数据框为:") my_df = pd.DataFrame(my_data)print(my_df)print("The standard deviation of column 'Age' is :") print(my_df['Age'].std()) print("The standard deviation of column 'value' is :") print(my_df['value'].std())
输出结果
数据框为: Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The standard deviation of column 'Age' is : 31.499206339207976 The standard deviation of column 'value' is : 35.747101700697364
说明
导入所需的库,并为其指定别名,以方便使用。
创建由键和值组成的系列字典,其中值实际上是系列数据结构。
该字典随后作为参数传递给存在于“pandas”库中的“Dataframe”函数
数据框被打印在控制台上。
我们正在研究计算其中包含数值的特定列的标准偏差。
通过使用点运算符指定列的名称,在数据帧上调用“std”函数。
数字列的标准偏差打印在控制台上。