编写Python代码,将给定的序列转换为虚拟变量,并删除所有存在的NaN值
假设您有一个序列,转换为虚拟变量的结果为,
Female Male 0 0 1 1 1 0 2 0 1 3 1 0 4 0 1 5 0 0 6 1 0 7 1 0
为了解决这个问题,我们将遵循以下步骤-
解决方案
创建一个包含“男性”和“女性”元素的列表,并将其分配给“系列”。
在系列内部应用get_dummies函数,并将dummy_na值设置为False。它的定义如下
pd.get_dummies(series, dummy_na=False)
例子
让我们检查以下代码以获得更好的理解-
import pandas as pd import numpy as np gender = ['Male','Female','Male','Female','Male',np.nan,'Female','Female',] series = pd.Series(gender) print("Series is:\n",series) print("Dummy code is:\n", pd.get_dummies(series, dummy_na=False))
输出
Series is: 0 Male 1 Female 2 Male 3 Female 4 Male 5 NaN 6 Female 7 Female dtype: object Dummy code is: Female Male 0 0 1 1 1 0 2 0 1 3 1 0 4 0 1 5 0 0 6 1 0 7 1 0