如何使用使用 scikit-learn 流水线工具进行精简的过程将输入数据数组转换为新的数据数组?
Scikit-learn,通常称为sklearn,是Python中的一个库,用于实现机器学习算法。它是一个开源库,因此可以免费使用。
它功能强大且健壮,因为它提供了多种工具来执行统计建模。这包括分类、回归、聚类、降维,以及在Python中强大且稳定的接口的帮助下进行的更多操作。
这个库建立在Numpy、SciPy和Matplotlib库之上。
它可以使用“pip”命令安装,如下所示-
pip install scikit−learn
该库专注于数据建模。
可以使用“Pipeline”函数来实现精简操作,该函数可以将特定维度的数组转换为不同维度的数组。
以下是一个例子-
示例
fromsklearn.preprocessingimport PolynomialFeatures fromsklearn.linear_modelimport LinearRegression fromsklearn.pipelineimport Pipeline import numpy as np print("Creating object of the tool pipeline") Stream_model = Pipeline([('poly', PolynomialFeatures(degree=3)), ('linear', LinearRegression(fit_intercept=False))]) x = np.arange(6) print("The size of the original ndarray is") print(x.shape) y = 4 − 2 * x + x ** 2 - x ** 3.5 Stream_model = Stream_model.fit(x[:, np.newaxis], y) print("Input polynomial coefficients are") print(Stream_model.named_steps['linear'].coef_)输出结果
Creating object of the tool pipeline The size of the original ndarray is (6,) Input polynomial coefficients are [ 4.31339202 −7.82933051 7.96372751 −3.39570215]
解释
导入所需的包,并为它们指定别名以方便使用。
'Pipeline'函数用于创建整个过程的管道。
数据点“x”和“y”的值是使用NumPy库生成的。
'LinearRegression'函数被调用。
生成的数据的详细信息显示在控制台上。
使用“管道”功能创建的模型适合数据。
数据的线性系数显示在控制台上。