Pandas 中的数据表如何表示?
为了在Pandas中表示数据表,我们在Pandas中有一个类似表的对象,它是DataFrame。DataFrame是Pandas中的二维数据结构,这些数据结构可以以列和行的方式存储任何类型的数据。
示例
df = pd.DataFrame({"Name": [ "Harris","William","Elizabeth",],"Age": [22, 35, 58],"Sex": ["male", "male", "female"],}) print(df)
解释
这里我们使用DataFrame对象在pandas中手动创建了一个数据表,数据是一个列表字典。在创建表格数据时,我们只提到了列标签,但还提到了任何行标签(索引值)。但是您可以在下面的输出块中看到标签值。
输出结果
Name Age Gender 0 Harris 22 male 1 William 35 male 2 Elizabeth 58 female
在输出数据表中,共有3列标记有Name、Age和Gender名称,还有3行标记有0、1、2索引值。这些索引值是自动创建的值,列名由显式定义use(keysnamesinourdictionaryascolumnnames)。
我们可以看到PandasDataFrame创建的数据表看起来与电子表格和SQL表非常相似。
DataFrame中的每一列都是一个pandasSeries对象。它只有一列和多行带有索引标签。
示例
print(df.Name)
解释
我们可以使用df.name列语法从我们的DataFrame(df)中获取单个列名。由此产生的熊猫系列对象可以在下面看到。
输出结果
0 Harris 1 William 2 Elizabeth Name: Name, dtype: object
来自表格数据(df)名称列的3行数据。本系列的数据类型是objectdtype。
这样,pandas将使用pandasDataFrame对象表示表格数据。