scikit_learn (sklearn)库中NearestNeighbors（最近邻）函数的各参数说明

NearestNeighbors(n_neighbors=5, radius=1.0, algorithm=‘auto‘, leaf_size=30, metric=‘minkowski‘, p=2, metric_params=None, n_jobs=None）

Parameters(参数):

n_neighbors（n邻域）:所要选用的最近邻的数目，相当于knn算法（k近邻算法）中的 k,(default = 5)，在设置此参数时输入的需为整形（int）。

radius（半径）:要使用的参数空间范围，在设置此参数时输入的需为浮点数（float）。

algorithm{‘auto’, ‘ball_tree’, ‘kd_tree’, ‘brute’}：即用于选取计算最近邻的算法：这里主要包括

　　　 ‘auto’ ：根据样本数据自动刷选合适的算法。

‘ball_tree’：构建“球树”算法模型。

‘kd_tree’ ：‘’kd树‘’算法。

‘brute’ ：使用蛮力搜索，即或相当于Knn算法，需遍历所有样本数据与目标数据的距离，进而按升序排序从而选取最近的K个值，采用投票得出结果。

（注意：拟合稀疏输入将覆盖此参数的设置，使用蛮力。）

leaf_size：叶的大小，针对算法为球树或KD树而言。这个设置会影响构造和查询的速度，以及存储树所需的内存。最优值取决于问题的性质。

metric：用于树的距离度量。默认度量是Minkowski，p=2等价于标准的欧几里德度量。有关可用度量的列表，可以查阅距离度量类的文档。如果度量是“预先计算的”，则假定X是距离矩阵，在拟合期间必须是平方。

p：Minkowski度量参数的参数来自sklearn.emeics.pairwise.pairwise_距离。当p=1时，这等价于使用曼哈顿距离(L1)，欧几里得距离(L2)等价于p=2时，对于任意的p，则使用Minkowski_距离(L_P)。

metric_params：度量函数的附加关键字参数，设置应为dict（字典）形式。

n_jobs：要为邻居搜索的并行作业的数量。None指1，除非在 joblib.parallel_backend背景。-1意味着使用所有处理器，若要了解相关的知识应该具体查找一下。

原文地址：https://www.cnblogs.com/qfwmy/p/12103682.html

时间： 2024-11-01 21:10:06

Python初探——sklearn库中数据预处理函数fit_transform()和transform()的区别