如何使用字典列表创建pandas DataFrame?
DataFrame是一种二维pandas数据结构,用于表示行列格式的表格数据。
我们可以使用Python字典列表创建一个PandasDataFrame对象。如果我们使用字典作为DataFrame函数的数据,那么我们不需要明确指定列名。
在下面的示例中,我们将使用字典列表创建一个DataFrame。
示例
# Creating list of dictionaries li = [{'i': 10, 'j': 20, 'k': 30},{'i': 8, 'j': 40, 'k': 60},{'i': 6, 'j': 60, 'k': 90}] # creating dataframe df = pd.DataFrame(l, index=[100,101,102]) #display the output print(df)
解释
Listli有一个字典列表,这里每个字典的键表示为列标签,字典的值表示为data(values)DataFrame。如果要更改默认行标签,则可以使用上面示例中的索引参数。
输出结果
i j k 100 10 20 30 101 8 40 60 102 6 60 90
DataFrame对象'df'的输出如上块所示,列标签由字典键自动获取,行标签使用索引参数定义。
示例
# Creating list of dictionaries li = [{'A':10, 'B':89, 'C':43},{'A': 88, 'J': 50, 'B': 7},{'A':9, 'B':8, 'C':12}] # creating dataframe df = pd.DataFrame(li) #display the output print(df)
解释
在以下示例中,字典列表中的键不相同,因此我们将丢失数据作为结果DataFrame对象中的一个元素。
输出结果
A B C J 0 10 89 43.0 NaN 1 88 7 NaN 50.0 2 9 8 12.0 NaN
我们可以在上面的DataFrame对象中看到NaN值。因为在列J的字典列表中没有定义数据。