微客导航 » 文章资讯 » 如何使用使用 scikit-learn 流水线工具进行精简的过程将输入数据数组转换为新的数据数组？

如何使用使用 scikit-learn 流水线工具进行精简的过程将输入数据数组转换为新的数据数组？

2023-06-21 12:12:03 251

Scikit-learn，通常称为sklearn，是Python中的一个库，用于实现机器学习算法。它是一个开源库，因此可以免费使用。

它功能强大且健壮，因为它提供了多种工具来执行统计建模。这包括分类、回归、聚类、降维，以及在Python中强大且稳定的接口的帮助下进行的更多操作。

这个库建立在Numpy、SciPy和Matplotlib库之上。

它可以使用“pip”命令安装，如下所示-

pip install scikit−learn

该库专注于数据建模。

可以使用“Pipeline”函数来实现精简操作，该函数可以将特定维度的数组转换为不同维度的数组。

以下是一个例子-

示例

fromsklearn.preprocessingimport PolynomialFeatures
fromsklearn.linear_modelimport LinearRegression
fromsklearn.pipelineimport Pipeline
import numpy as np
print("Creating object of the tool pipeline")
Stream_model = Pipeline([('poly', PolynomialFeatures(degree=3)), ('linear', LinearRegression(fit_intercept=False))])
x = np.arange(6)
print("The size of the original ndarray is")
print(x.shape)
y = 4 − 2 * x + x ** 2 - x ** 3.5
Stream_model = Stream_model.fit(x[:, np.newaxis], y)
print("Input polynomial coefficients are")
print(Stream_model.named_steps['linear'].coef_)

输出结果

Creating object of the tool pipeline
The size of the original ndarray is
(6,)
Input polynomial coefficients are
[ 4.31339202 −7.82933051 7.96372751 −3.39570215]

解释

导入所需的包，并为它们指定别名以方便使用。

'Pipeline'函数用于创建整个过程的管道。

数据点“x”和“y”的值是使用NumPy库生成的。

'LinearRegression'函数被调用。

生成的数据的详细信息显示在控制台上。

使用“管道”功能创建的模型适合数据。

数据的线性系数显示在控制台上。

返回顶部
3162201930
czq8825@qq.com

如何使用使用 scikit-learn 流水线工具进行精简的过程将输入数据数组转换为新的数据数组？

示例

解释

热门推荐

随机推荐