KNN算法优缺点总结，以及机器学习流程的总结

KNN算法优缺点总结，以及机器学习流程的总结

article/2025/9/7 3:54:02

KNN算法作为一个最简单，也是一个很实用的机器学习的算法，日常的使用中也能处理很多问题，这里做一下总结记录

优点

1、KNN可以处理分类问题，同时天然可以处理多分类问题，比如鸢尾花的分类

2、简单，易懂，同时也很强大，对于手写数字的识别，鸢尾花这一类问题来说，准确率很高

3、KNN还可以处理回归问题，也就是预测

缺点

1、效率低，因为每一次分类或者回归，都要把训练数据和测试数据都算一遍，如果数据量很大的话，需要的算力会很惊人，但是在机器学习中，大数据处理又是很常见的一件事

2、对训练数据依赖度特别大，虽然所有机器学习的算法对数据的依赖度很高，但是KNN尤其严重，因为如果我们的训练数据集中，有一两个数据是错误的，刚刚好又在我们需要分类的数值的旁边，这样就会直接导致预测的数据的不准确，对训练数据的容错性太差

3、维数灾难，KNN对于多维度的数据处理也不是很好，如下图

因为距离会越来越大，那么就会越来越“不像”，而对于KNN这种高度依赖距离的算法来说，这个也会影响准确率的

机器学习具体实践的整个流程

形象一点的流程图

http://chatgpt.dhexx.cn/article/Y4wgUoJl.shtml

相关文章

（理论+代码）KNN算法

（理论+代码）KNN算法

KNN： 一种非参数、惰性学习方法，导致预测时速度慢当训练样本集较大时，会导致其计算开销高样本不平衡时，对稀有类别的预测准确率低KNN模型的可解释性不强文章目录 KNN（思想：物以类聚）一、距离度…

阅读更多...

Knn算法实例（代码来自机器学习实战，我加了详细的注释，仅供学习）

Knn算法实例（代码来自机器学习实战，我加了详细的注释，仅供学习）

knn算法代码 Knn算法—识别手写数字（机器学习实战） 一、Knn算法原理？ 1.通俗的说就是：对于给定的输入向量在训练集中找到与该输入实例最近的k个实例，统计这k个实例中每个实例（按照标签分类）所…

阅读更多...

KNN数据库检索(简读)：A Fast Partial Video Copy Detection Using KNN and Global Feature Database

KNN数据库检索(简读)：A Fast Partial Video Copy Detection Using KNN and Global Feature Database

与之前的大部分部分视频拷贝检测（PVCD）算法不同，该算法会逐个扫描参考视频，我们将PVCD视为视频搜索/检索问题。本文提出了一种快速的部分视频拷贝检测框架。在这个框架中，参考视频的所有帧CNN-feature都组织在…

阅读更多...

KNN的优化算法2：KD-tree

KNN的优化算法2：KD-tree

传统KNN缺点：数据量特别大时，需要计算参考点和每个样本点的距离，计算量非常大，所以提出一种优化算法-----kd-tree. 为了提高kNN搜索的效率，可以考虑使用特殊的结构存储训练数据，以减小计算距离的次数。 kd…

阅读更多...

KNN算法及其MATLAB代码

KNN算法及其MATLAB代码

一、KNN算法原理 1.算法概述 k近邻(k-Nearest Neighbor，简称kNN)学习是一种常用的监督学习方法，其工作机制非常简单：给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后基于这k个"邻居&qu…

阅读更多...

kNN算法解析及应用【内附详细代码和数据集】

kNN算法解析及应用【内附详细代码和数据集】

首先，我们需要了解什么是“kNN” kNN英文全称k Nearest Neighbor，即k近邻算法。用途：分类问题kNN的工作原理：事先有一个有标签的样本数据集，然后输入没有标签的新数据后，将新数据的每个特征和样本集里的数…

阅读更多...

KNN算法介绍及代码实现

KNN算法介绍及代码实现

k-近邻法简介 k近邻法(k-nearest neighbor, k-NN)是1967年由Cover T和Hart P提出的一种基本分类与回归方法。它的工作原理是：存在一个样本数据集合，也称作为训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一个数…

阅读更多...

机器学习——KNN及代码实现

机器学习——KNN及代码实现

KNN KNN即k-nearest neighbor(k近邻法)，多应用于分类问题。 k近邻法的输入为实例的特征向量，对应于特征空间中的点。输出为实例的类别。 K近邻法原理给定一个训练数据集，对新的输入数据，在训练数据集中找到与该实例最邻近的k个…

阅读更多...

KNN算法及其改进

KNN算法及其改进

KNN算法优缺点优点 (1) 精度高 (2) 对异常值不敏感：某个异常值对整个结果不造成影响； (3) 无数据输入假定：无数据的独立性等假设；缺点 (1) 计算复杂度高：因为要计算的点需要与所有点计算距离，所以复杂度很…

阅读更多...

机器学习算法-KNN代码实现

机器学习算法-KNN代码实现

机器学习算法-KNN代码实现一、KNN算法初步理解二、代码实现1.数据集处理2.创建model3.可视化总结一、KNN算法初步理解统计学习方法书上的解释：给定一个训练数据集，对于新的输入实例，在训练数据集中找到与该实例最邻近的k个实例&#xff…

阅读更多...

【数据挖掘基础】——KNN算法+sklearn代码实现(6)

【数据挖掘基础】——KNN算法+sklearn代码实现(6)

🤵‍♂️ 个人主页：@Lingxw_w的个人主页 ✍🏻作者简介：计算机科学与技术研究生在读 🐋 希望大家多多支持，我们一起进步！😄 如果文章对你有帮助的话，欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 目录介绍算法的例子 KNN算法原理

阅读更多...

KNN的优化算法1：距离加权

KNN的优化算法1：距离加权

参考文章：https://www.cnblogs.com/bigmonkey/p/7387943.html 对参考文章中最后一部分说的有问题的地方进行了修改。权值加权：为每个点的距离增加一个权重，使得距离近的点可以得到更大的权重，在此描述如何加权。反函数该方法最…

阅读更多...

机器学习之深入理解K-means、与KNN算法区别及其代码实现

机器学习之深入理解K-means、与KNN算法区别及其代码实现

K-means方法是一种非监督学习的算法，它解决的是聚类问题。 1、算法简介：K-means方法是聚类中的经典算法，数据挖掘十大经典算法之一；算法接受参数k,然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足聚类中的对象…

阅读更多...

KNN算法代码实现

KNN算法代码实现

原理： KNN 算法也叫K近邻算法。假设给定一个训练数据集，其中的实例类别已定。它是通过找到一个数据集中与目标数据最近的K个邻居，然后通过多数表决等方式来预测目标数据的分类结果进行预测。三要素： 距离度量、K值、分类决策规…

阅读更多...

KNN中的优化算法KD-tree

KNN中的优化算法KD-tree

我们知道KNN是基于距离的一个简单分类算法，熟悉KNN的都知道，我们要不断计算两个样本点之间的距离，但是，试想一下，如果数据量特别大的时候，我们要每个都计算一下，那样计算量是非常大的&#xff0…

阅读更多...

KNN算法代码

KNN算法代码

一、K近邻算法 KNN是一种监督学习类别的算法，全称（K-NearestNeighbor）直译为K个最近的邻居，是一种聚类算法。该算法认为我们在判断一个物体的类别可以根据与他非常相似的K个物体的类别（这K个物体的类别是已知的&#x…

阅读更多...

KNN数据缺失值填充（附源码和数据）不调用包

KNN数据缺失值填充（附源码和数据）不调用包

KNN估计数据缺失值填充—KNN估计一、基本思想二、步骤1.导入数据2.查看空缺值3.取出要分析的数据4.计算平均值5.计算标准差6.规范化7.计算欧几里得距离8.最优解9.画图总结数据缺失值填充—KNN估计运行环境 python3.6 jupyter notebook 一、基本思想先将数据标准化&…

阅读更多...

数据挖掘——KNN算法的实现

数据挖掘——KNN算法的实现

👨‍💻作者简介：练习时长两年半的java博主 📖个人主页：君临๑ 🎁 ps：点赞是免费的，却可以让写博客的作者开心好几天😎 文章目录一、k-最近邻分类算法介绍二、k-NN的特…

阅读更多...

KNN算法调优

KNN算法调优

1.所用方法: 交叉验证与网格搜索交叉验证(为了让被评估的模型更加精确可信): 所有训练集数据分成N等分，几等分就是几折交叉验证网格搜索:调参数 K-近邻:超参数K 2.API: sklearn.model_selection.GridSearchCV： CV即cross validation…

阅读更多...

计算机编程—必备基础知识点

计算机编程—必备基础知识点

目录： 1. 编程语言1.1 编程1.2 计算机语言1.3 编程语言1.4 翻译器1.5 编程语言和标记语言区别 2. 计算机基础2.1 计算机组成2.2 数据存储2.3 数据存储单位2.4 程序运行 1. 编程语言 1.1 编程编程：就是让计算机为解决某个问题而使用某种程序设计语言编…

阅读更多...

推荐文章