如何使用TensorFlow导入Auto MPG数据集(基本回归)以预测燃油效率的数据?
Tensorflow是Google提供的一种机器学习框架。它是一个开放源代码框架,可与Python结合使用,以实现算法,深度学习应用程序等等。它用于研究和生产目的。
可以使用下面的代码行在Windows上安装'tensorflow'软件包-
pip install tensorflow
Tensor是TensorFlow中使用的数据结构。它有助于连接流程图中的边缘。该流程图称为“数据流程图”。张量不过是多维数组或列表。
回归问题背后的目的是预测连续或离散变量的输出,例如价格,概率,是否下雨等等。
我们使用的数据集称为“自动MPG”数据集。它包含了1970年代和1980年代汽车的燃油效率。它包括诸如重量,马力,位移等属性。因此,我们需要预测特定车辆的燃油效率。
我们正在使用Google合作实验室来运行以下代码。GoogleColab或Colaboratory可以帮助通过浏览器运行Python代码,并且需要零配置和对GPU(图形处理单元)的免费访问。合作已建立在JupyterNotebook的基础上。
以下是使用自动MPG数据集预测燃油效率的代码-
示例
import matplotlib.pyplot as plt import numpy as np import pandas as pd import seaborn as sns np.set_printoptions(precision=3, suppress=True) import tensorflow as tf from tensorflow import keras from tensorflow.keras import layers from tensorflow.keras.layers.experimental import preprocessing print("The version of tensorflow is ") print(tf.__version__) url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data' column_names = ['MPG', 'Cylinders', 'Displacement', 'Horsepower', 'Weight', 'Acceleration', 'Model Year', 'Origin'] print("The data is being loaded") print("The column names have been defined") raw_dataset = pd.read_csv(url, names=column_names, na_values='?', comment='\t', sep=' ', skipinitialspace=True) dataset = raw_dataset.copy() print("A sample of the dataset") dataset.head(2)
代码信用-https://www.tensorflow.org/tutorials/keras/regression
输出结果
The version of tensorflow is 2.4.0 The data is being loaded The column names have been defined A sample of the dataset
解释
所需的软件包已导入并使用别名。
数据已加载,并为其定义了列名称。
数据集样本显示在控制台上。