Python – 重塑 Pandas DataFrame 中的数据
我们可以通过对特定列进行分类来轻松重塑数据。在这里,我们将以数字形式对“结果”列进行分类,即通过和失败值。
导入所需的库-
import pandas as pd
创建一个具有2列的DataFrame-
dataFrame = pd.DataFrame( { "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass'] } )
使用该map()函数重塑数据,只需将“通过”设置为1,将“失败”设置为0-
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
示例
以下是代码-
import pandas as pd #创建数据帧 dataFrame = pd.DataFrame( { "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass'] } ) print"DataFrame ...\n",dataFrame #重塑为数字 dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, }) print"\nReshaped DataFrame ...\n",dataFrame输出结果
这将产生以下输出
DataFrame ... Result Student 0 Pass Jack 1 Fail Robin 2 Fail Ted 3 Pass Scarlett 4 Pass Kat Reshaped DataFrame ... Result Student 0 1 Jack 1 0 Robin 2 0 Ted 3 1 Scarlett 4 1 Kat