微客导航 » 文章资讯 » Python pandas 包中的数据结构是什么？

Python pandas 包中的数据结构是什么？

2024-05-21 15:05:05 364

数据结构是一种收集数据、组织和存储格式的方式，使我们能够以有效的方式访问和修改数据。它是数据类型的集合。它为您提供了组织items(values)记忆的最佳方式。

pythonpandas包以有效的方式处理数据，因为它有两个强大的数据结构，名为Series和DataFrames。

Series只不过是一个一维带标签的数组，它可以容纳任何数据类型。它可以存储整数值、字符串、浮点数等。Series中的每个值都分配给alabel(assignedtoanindex)，标签可以是整数值，也可以是名称表示。

示例

import pandas as pd
data = pd.Series([1,2,3,4,5])
print(data)

PandasSeries数据结构是通过使用具有5个元素的简单Python列表定义的。通过使用import关键字，我们导入了pandas包，然后我们使用pandas创建了系列。系列功能。

输出结果

0   1
1   2
2   3
3   4
4   5
dtype: int64

系列的输出在上面的块中表示，我们可以观察到熊猫系列是一个一维对象，它存储同构数据，系列中的每个值都由一个标签表示。对于我们上面的示例标签值是0,1,2,3,4。

pandas中的另一个数据结构是DataFrame，它是一个二维标记的数据结构，用于以行和列格式表示。每列中存在的数据可能具有不同的数据类型。DataFrame的整体结构看起来类似于电子表格或SQL表。与Series一样，DataFrame行也用标签表示。

import pandas as pd
df = pd.DataFrame([[2,3,4,5],[6,7,8,9]], columns=['a','b','c','d'])
print(df)

在上面的示例中，我们使用列表列表创建了一个简单的PandasDataFrame，这里的列标签手动定义为a、b、c、d。

输出结果

    a   b   c   d
0   2   3   4   5
1   6   7   8   9

pandasDataFrame的输出可以在上面的输出块中看到，DataFrame是用2行4列创建的，0,1和a,b,c,d是各自的行和列标签。

在pandas0.20.0版本之前，有一个3-Dimensional数据结构可用，该数据结构称为panel。在较新版本的Pandas中，这些面板的3维数据表示为MultiIndexDataFrame。