什么是 scipy.cluster.vq.kmeans2() 方法?
scipy.cluster.vq.kmeans2(data,k,iter=10,thresh=1e-05,minit='random',missing='warn',check_finite=True)-kmeans2()方法对一组观察向量进行分类通过执行k-means算法分成k个簇。为了检查收敛性,kmeans2()方法不使用阈值。它有额外的参数来决定质心的初始化方法,处理空集群,并验证输入度量是否只包含有限的数字。
下面给出了其参数的详细解释-
参数
数据-ndarray
它是N维中M个观察值的'M'×'N'数组。
k-int或ndarray
此参数表示要形成的簇数和要生成的质心。它被解释为在下面给出的两个条件的情况下使用的初始集群-
当minit初始化字符串是'matrix'时。
或者如果给出了ndarray。
thresh-浮动,可选
该参数代表阈值。如果自上次迭代以来的失真变化小于或等于该阈值,则算法将默认终止。
minit-str,可选
该参数表示初始化方法。下面给出了一些可用的方法-
random-它从具有均值和方差的高斯生成k个质心。根据数据估计均值和方差。
点-此方法选择k个观察值,即从初始质心的数据中随机行。
++-这种方法,也称为小心播种,选择k个观察值,即kmeans++方法的行。
矩阵-矩阵方法解释初始质心的k参数(作为'k'乘'M'数组)。
缺少-str,可选
该参数表示处理空簇的方法。以下是可用的方法-
警告-这种方法,顾名思义,给出警告,然后继续。
raise-此方法将引发错误(ClusterError)并终止算法。
check_finite-布尔值,可选
此参数用于检查输入矩阵是否仅包含有限数字。禁用此参数可能会给您带来性能提升,但如果观察确实包含无穷大,它也可能导致一些问题,例如崩溃或非终止。此参数的默认值为True。
退货
质心-ndarray
它通过N个质心数组返回ak。
标签-ndarray
这是质心的索引。