如何使用 Python Pandas 库将 JSON 文件读入 DataFrame?
JSON代表JavaScriptObjectNotation,它以键/值对的形式存储文本数据,这可以是人类可读的数据格式。这些JSON文件通常用于在网络上交换数据。JSON对象用大括号({})表示。JSON的每个键/值对都由逗号分隔。
JSON数据看起来与Python字典非常相似,但JSON是一种数据格式,而字典是一种数据结构。要将JSON文件读入PandasDataFrame,我们在Pandas库中有read_json方法。下面的示例概述了我们如何将JSON文件读入PandasDataFrame。
示例
将本地JSON文件读入PandasDataFrame
#导入熊猫包 import pandas as pd #读取JSON文件 df = pd.read_json('E:\iris.json') #显示样本输出 df.sample(5)
解释
在上面的代码中,我们使用pd.read_json方法将本地JSON文件读入df变量,我们将JSON文件位置作为字符串传递给该方法。此方法会自动将JSON文件中的数据转换为DataFrame。最初,我们将pandas包作为pd导入。最后,在最后一行中,我们将DataFrame中的5个样本行显示为输出。
输出结果
sepalLength sepalWidth petalLength petalWidth species 149 5.9 3.0 5.1 1.8 virginica 90 5.5 2.6 4.4 1.2 versicolor 56 6.3 3.3 4.7 1.6 versicolor 38 4.4 3.0 1.3 0.2 setosa 85 6.0 3.4 4.5 1.6 versicolor
将鸢尾花JSON数据集/文件作为read_json方法的输入,该数据集有5列和150行数据。在这个输出块中,我们只显示了使用该方法的5行数据的样本。该方法从DataFrame随机返回数据。df.sample()
以同样的方式,我们可以通过在文件路径的位置提及远程URL来读取远程JSON数据。
示例
import pandas as pd data = pd.read_json( 'http://universities.hipolabs.com/search?country=United+Kingdom') print(data)
解释
在这个例子中,我们采用了一个公共HTTPAPI,它以JSON格式保存数据。这里也使用read_json方法来读取这个远程URLJSON数据。
输出结果
此输出包含来自read_json方法的4行JSON数据示例,这是来自公共URL的数据,它有171行和6列。