Python – 重塑 Pandas DataFrame 中的数据
我们可以通过对特定列进行分类来轻松重塑数据。在这里,我们将以数字形式对“结果”列进行分类,即通过和失败值。
导入所需的库-
import pandas as pd
创建一个具有2列的DataFrame-
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
}
)使用该map()函数重塑数据,只需将“通过”设置为1,将“失败”设置为0-
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })示例
以下是代码-
import pandas as pd
#创建数据帧
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
}
)
print"DataFrame ...\n",dataFrame
#重塑为数字
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
print"\nReshaped DataFrame ...\n",dataFrame输出结果这将产生以下输出
DataFrame ... Result Student 0 Pass Jack 1 Fail Robin 2 Fail Ted 3 Pass Scarlett 4 Pass Kat Reshaped DataFrame ... Result Student 0 1 Jack 1 0 Robin 2 0 Ted 3 1 Scarlett 4 1 Kat