机器学习应用

article/2025/10/14 17:00:10

监督学习和非监督学习

监督学习: 有标签的,回归和分类,场景:用户流失预测
非监督学习:无标签,聚类和降维,场景:用户细分

数据不平衡

类别不平衡。数据在某些维度上多,在有些维度上少。如流失用户比例多于非流失用户。
数据倾斜
分类问题:
给定一个分类问题,通常各类别中的训练数据并不完全均匀,尤其是在金融、医疗、交通等领域,数据高等倾斜,类间严重失衡的情况,那些样本数量与占据了样本容量绝大部分的主要种类比较,差距悬殊的少数样本恰恰是最重要的,在欺诈识别、欺诈识别、疾病检测、事故监控等方面具有广泛应用价值,多数类则可能会支配代价函数并阻止模型从倾斜数据中正确学习。
解决方法:
可以先尝试选择与权重相关的分类算法重塑类间权数以支持机器学习过程
方法效果不佳的情况下,改从数据角度来找答案,从数据入手采取一些措施解决数据不平衡问题的思路其实很简单,无非就是使用数据采样算法转换训练数据以平衡类别分布,使各类别样本在数量上相等,按照采样结果分类,可分为欠采样和过采样,按照采样进行的方式,可分为原型选择和原型生成

随机欠采样(Random Under Sampler,RUS)从多数派中随机删除一些,随
机过采样(Random Over Sampler,ROS)从少数派中随机复制一些,ClusterCentroids基于K-Means聚类算法合成一些多数类样本,SMOTE基于KNeighbors分类器生成一些少数类样本。
在这里插入图片描述
在这里插入图片描述

  1. SMOTE(Synthetic Minority Over-sampling Technique)过采样小样本(扩充小类,产生新数据)
    即该算法构造的数据是新样本,原数据集中不存在的。该基于距离度量选择小类别下两个或者更多的相似样本,然后选择其中一个样本,并随机选择一定数量的邻居样本对选择的那个样本的一个属性增加噪声,每次处理一个属性。这样就构造了更多的新生数据。(优点是相当于合理地对小样本的分类平面进行的一定程度的外扩;也相当于对小类错分进行加权惩罚(解释见3))

特征工程

输入空间 映射 特征空间
特征方法


http://chatgpt.dhexx.cn/article/v0TJcBhj.shtml

相关文章

【机器学习】为什么机器学习难于应用

摘要: 本文主要讲述了如何管理机器学习应用方面的棘手问题 应用机器学习是有挑战性的。 在机器学习领域,你必须要在没有正确答案的问题上做出很多决定!例如: 用什么框架? 用什么数据作为输入,要输出什么数…

机器学习在社会科学中的应用

本文把目前机器学习技术在社会科学研究中的应用分成三类:第一,数据生成(Data Generating Process):机器学习可以帮助学者获得以前很难或无法获得的数据;第二,预测(Prediction&#x…

【Machine Learning】20.应用机器学习的一些建议

20.应用机器学习的一些建议 1.导入包2. 评估学习算法(以线性回归为例)2.1 分离数据集可视化数据集 2.2 误差计算2.3 比较模型在训练集和测试集上的表现 3.Bias and Variance3.1 可视化数据集3.2 找到optimal degree最佳次数3.3 Tuning Regularization调整…

机器学习之应用举例

#Photo OCR Photo Optical Character Recognition(照片光学字符识别),注重的问题是如何让计算机读出图片中的文字信息。 1、给定某种图片,它将图像扫描一遍,然后找出照片中的文字信息; 2、重点关注这些文…

机器学习的应用–大数据

说完机器学习的方法,下面要谈一谈机器学习的应用了。无疑,在2010年以前,机器学习的应用在某些特定领域发挥了巨大的作用,如车牌识别,网络攻击防范,手写字符识别等等。但是,从2010年以后&#xf…

什么是机器学习?有哪些算法和分类?又有哪些应用?看完你就懂了

导读:本文从大数据的概念讲起,主要介绍机器学习的基础概念,以及机器学习的发展过程,用一个形象的例子讲解大数据生态中的机器学习,并按照传统机器学习(包括分类、聚类、回归、关联规则、协同过滤、数据降维…

1.2 机器学习的应用

机器学习无处不在。 问:为什么机器学习已经成为人工智能的一个子领域? 答:通过编程能够让机器做一些事情,比如:如何找到从A到B的最短距离,现实生活对应着GPS导航。但是,有时候编程也存在难点&…

什么是机器学习?应用场景以及未来趋势

机器学习 (ML) 被定义为人工智能 (AI) 的一门学科,它使机器能够自动从数据和过去的经验中学习,以识别模式并在最少的人工干预下做出预测。本文介绍了机器学习的基础知识、其类型以及最重要的五个应用程序。它还分享了 2022 年机器学习的十大趋势。 目录…

学机器学习有什么用?机器学习可以应用哪些领域?

机器学习的目前在各个领域都非常实用,可以带来很多好处,包括以下几点: 学机器学习有什么用? 自动化:机器学习可以帮助自动处理大量数据和任务,减少人工处理的工作量。 预测性能:机器学习模型可…

机器学习有哪些应用场景?机器学习有什么用?

机器学习是一种广泛应用于各个领域的技术,以下列举几个机器学习的应用场景: 机器学习有哪些应用场景?机器学习有什么用? 金融领域:机器学习可以应用于信用评估、风险管理、欺诈检测等方面,帮助银行和保险公…

机器学习实战 | Python机器学习算法应用实践

作者:韩信子ShowMeAI 教程地址:https://www.showmeai.tech/tutorials/41 本文地址:https://www.showmeai.tech/article-detail/201 声明:版权所有,转载请联系平台与作者并注明出处 收藏ShowMeAI查看更多精彩内容 引言 …

机器学习的应用方面,主要有哪些?

1、图像处理\识别(人脸识别、图片分类) 2、自然语言处理 3、网络安全(垃圾邮件检测、恶意程序\流量检测) 4、自动驾驶 5、机器人 6、医疗拟合预测 7、神经网络 8、金融高频交易 9、互联网数据挖掘/关联推荐 人工智能、大…

机器学习在各个领域的实际应用

机器学习在各个领域的实际应用 经常会被问到,现在机器学习、人工智能这么火,那么它到底有什么实际应用呢,在本文中,分享了一个来自Github的项目,这个项目整理了包括机器学习等数据科学技术在工业界的开源项目&#xff…

机器学习的应用——关于正确应用机器学习

引言 前阵子看到一篇文章,学习了一段时间的机器学习算法后,再回头看机器学习问题,发现要想利用机器学习去很好的求解一个问题,其实并不是一件容易办到的事情,尤其是能够对整个模型的解释方面,要想能够对模型…

机器学习在生活中的九大有趣应用

No1:虚拟个人助理 Siri、小冰、度秘是现在虚拟个人助理的典型例子。顾名思义,当你通过语音询问时,他们便会找寻相应的信息,比如你问“我今天的日程安排是什么?”“从德国到伦敦的航班是什么?”等类似的问题…

机器学习可以应用在哪些场景?机器学习有什么用?

我们在说机器学习分类的时候,简单介绍了一下不同机器学习方法,主要是解决是什么问题,在本节中具体介绍一些常用的应用场景,主要说明这些应用到底怎么用,不对其中的算法以及原理做深入的介绍。 机器学习的应用 1. 分类…

安装Linux操作系统(Centos)

安装Linux操作系统(Centos) 文章目录 安装Linux操作系统(Centos)一、创建虚拟机1.1.新建虚拟机1.2.选择虚拟机硬件兼容性1.3.选择虚拟空白磁盘1.3.选择Linux对应的Centos版本1.4.虚拟机命名和存放位置1.5.设置处理器配置1.6.设置机器内存1.7.网络类型选择1.8.I/O控制器类型1.9.…

Linux操作系统CentOS7安装

最近在学习Linux,今天记录下如何安装CentOS7操作系统。 1. 下载虚拟机软件 虚拟机选择的是VMware Workstation软件,可以访问这个链接下载:https://coding.net/u/aminglinux/p/resource/git/blob/master/README.md 2. 安装虚拟机 按照提示&…

CentOS Linux操作系统

对于windows来说,每一个分区有一个盘符,每一个盘符实际上不是一个硬盘,而是一个分区partition; 对于Linux来说,使用统一的目录树结构 /, /home/cherry, /root, /bin, /mnt, /usr, /etc. 一、Linux命令行 cd/pwd/ls 当前目录操作…

Linux 安装Centos7操作系统

安装前准备(vmware配置) 1. 在自己的vmware中选择文件-新建虚拟机 或者 点击创建新的虚拟机 2. 新建虚拟机向导中选择典型 3.稍后创建操作系统 4. 更改操作系统和和版本 5. 更改虚拟机名称和位置 6.选择磁盘大小和将磁盘拆分多个文件(防止一…