Java机器学习库(Java ML)(一、分类)

article/2025/9/22 17:37:40

本文章翻译至Java ML技术文档classification.pdf,代码部分是参考该文档使用IDEA编写,同时加入了运行结果。

分类

本文介绍与分类相关的功能。

该文章假设您已熟悉Java ML的基础知识,如入门教程中所述(http://java-ml.sourceforge.net)。数据集下载地址:https://download.csdn.net/download/dbzzcz/12274719

分类基础知识

本文介绍了设置分类器、训练算法和评估其性能的基础知识。首先我们需要初始化一个分类器,然后我们可以用一些数据来训练它,最后我们可以用它来对新的样本进行分类。创建一个分类器

下面的示例从iris数据集中加载数据,然后我们构造一个K-nearest分类器并用数据来训练它。

注:分类器的构建方法可能会修改作为参数的数据集。

评估分类器的性能

现在我们已经构造并训练了一个分类器,我们可以使用它来分类新的实例,在这个例子中,我们将重新加载iris数据集,并使用训练好的分类器来预测每个实例的类标签.

这个例子将遍历iris数据集中的所有样本,并试图通过对其5-nearest的多数投票来预测其分类。在本例中,这将导致145个正确的预测和5个错误的预测。

注:这不是验证该模型是否正确的方法。至于正确的验证方法,请查阅交叉验证法。

在数据集上评估分类器

本文向您展示如何在数据集上测试分类器的性能。这里将介绍两个类。EvaluateDataset,它允许您在数据集上测试分类器。还将引入PerformanceMeasure,此类用于存储有关分类器性能的信息。

此示例加载iris数据集,构造5-nearest分类器并再次加载iris数据。

testDataset方法使用经过训练的分类器来预测所提供数据集中所有样本的标签。分类器的性能作为映射返回,映射包含每个类的性能度量。性能度量是围绕着真阳性、真阴性、假阳性和假阴性的值的包装。该类还提供了许多方便的方法来计算许多聚合度量,如准确性、f-score、召回率、精确度、敏感性、特异性等。

分类交叉验证

在本文中,我们将讨论如何使用Java-ML执行交叉验证。

在本文中,我们假设您知道如何从文件加载数据、如何创建aclassifier以及如何使用PerformanceMeasure。Java ML中的交叉验证可以使用CrossValidation类完成。下面的代码展示了如何使用这个类。

本例首先加载iris数据集,然后构造一个K-nearest分类器,该分类器使用5-nearest对样本进行分类,在下一步中,我们使用所构造的分类器创建一个交叉验证,最后指示交叉验证在加载的数据上运行。默认情况下,将执行10倍的交叉验证,每个类的结果将返回到映射类标签到其相应PerformanceMeasure的映射中。

以相同folds执行多次

上面的示例对数据集执行三轮交叉验证。前两个使用的folds与用于创建folds的随机生成器使用相同的种子初始化的folds完全相同。第三个则运行在不同的折叠,因为它使用不同的种子。

在本例中,我们使用了相同的分类器,可以将分类器与不同的分类器交换,并在完全相同的折叠上测试不同的分类器。

Weka分类

通过使用Weka Classification桥,可以从Java ML中访问来自Weka的分类算法,并使用与本机算法相同的方法。这个类可以包装在Weka分类器上,使它们对基于Java ML的程序透明可用。

在下面的例子中,我们首先加载iris数据集。接下来,我们使用默认设置从Weka创建一个支持SMO的vectormachine。然后,我们将SMO包裹在WekaClassifierbridge中。最后,我们对分类器进行交叉验证并写出结果。

参考网站:http://java-ml.sourceforge.net/content/classification


http://chatgpt.dhexx.cn/article/DjbPRZYV.shtml

相关文章

目前流行的、强大的基于Java的机器学习开发库精选

图片来源: Mindfire Solutions 现如今,拥有深度学习和机器学习领域的技术是科技界的趋势之一,并且企业则希望雇佣一些拥有良好的机器学习知识背景的程序开发工程师。本文将介绍一些目前流行的、强大的基于Java的机器学习库,希望给大家带来帮助…

JAVA 人工神经网络实现,机器学习,人工智能

人工智能(AI) 、机器学习(ML)、深度学习(DL)、神经网络(CNN) IT技术圈的人怼这些词汇大家都一定耳熟能详了,可能圈外的也不陌生,但是作为一个作为一个“攻城…

机器学习java_如何开始使用Java机器学习

机器学习java 什么是开始使用Java机器学习的最佳工具? 他们已经存在了一段时间,但如今看来,每个人都在谈论人工智能和机器学习。 对于科学家和研究人员而言,它已经不再是秘密,几乎可以在任何新兴技术中实现。 在下面…

谁说搞Java的不能玩机器学习?

简介 机器学习在全球范围内越来越受欢迎和使用。 它已经彻底改变了某些应用程序的构建方式,并且可能会继续成为我们日常生活中一个巨大的(并且正在增加的)部分。没有什么包装且机器学习并不简单。 它对许多人来说似乎非常复杂并常常令人生畏…

基于 Java 机器学习自学笔记 (第51-53天:kNN)

注意:本篇为50天后的Java自学笔记扩充,内容不再是基础数据结构内容而是机器学习中的各种经典算法。这部分博客更侧重与笔记以方便自己的理解,自我知识的输出明显减少,若有错误欢迎指正! 目录 一、关于数据集及其导入…

基于 Java 机器学习自学笔记 (第66至68天:主动学习之ALEC)

注意:本篇为50天后的Java自学笔记扩充,内容不再是基础数据结构内容而是机器学习中的各种经典算法。这部分博客更侧重于笔记以方便自己的理解,自我知识的输出明显减少,若有错误欢迎指正! 目录 前言 一、关于学习的分类…

超全!基于Java的机器学习项目、环境、库...

https://yq.aliyun.com/articles/278837?utm_sourcetuicool&utm_mediumreferral 摘要: 你是一名希望开始或者正在学习机器学习的Java程序员吗? 利用机器学习编写程序是最佳的学习方式。你可以从头开始编写算法,但是利用现有的开源库&am…

结合Java和机器学习技术,如何驾驭大数据提升业务效率和竞争力?

随着大数据的不断增长和发展,越来越多的企业和组织开始关注如何利用大数据来提高业务效率和竞争力。在大数据分析领域,Java和机器学习技术是两个非常重要的方向。本文将介绍这两个技术的基本概念、应用场景和发展趋势,并重点探讨如何结合Java…

25个JAVA 机器学习工具包

本列表总结了25个Java机器学习工具&库: 1. Weka集成了数据挖掘工作的机器学习算法。这些算法可以直接应用于一个数据集上或者你可以自己编写代码来调用。Weka包括一系列的工具,如数据预处理、分类、回归、聚类、关联规则以及可视化。 2.Massive Onli…

7个最好的Java机器学习开发库

IT派 - {技术青年圈} 持续关注互联网、区块链、人工智能领域 摘要: 本文将介绍一些目前流行的、强大的基于Java的机器学习库。 图片来源: Mindfire Solutions 摘要:现如今,拥有深度学习和机器学习领域的技术是科技界的趋势之一,并…

基于 Java 机器学习自学笔记 (第71-73天:BP神经网络)

注意:本篇为50天后的Java自学笔记扩充,内容不再是基础数据结构内容而是机器学习中的各种经典算法。这部分博客更侧重于笔记以方便自己的理解,自我知识的输出明显减少,若有错误欢迎指正! 前言 本文是我计划描述BP神经网…

如何开始Java机器学习

什么是开始使用Java机器学习的最佳工具? 他们已经存在了一段时间,但如今看来,每个人都在谈论人工智能和机器学习。 对于科学家和研究人员而言,它已不再是秘密,几乎可以在任何新兴技术中实现。 在下面的文章中&#x…

如何开始使用 Java 机器学习

开始Java机器学习的最好工具是什么? 这个问题已经有一段时间了,但最近这些日子几乎每个人都在谈论人工智能和机器学习。这已经不再是一个保留给科学家和研究者的秘密,而是几乎实现于每一项新兴技术中。 在下面的章节中,我们会做一…

6大最常用的Java机器学习库一览

导读:机器学习是目前盛行于世的技术之一,这几年一时风头无两。虽然在机器学习中,Python是人工智能从业者使用最多的编程语言,但是,Java 在项目开发中仍然发挥着不可替代的作用,而且许多流行的机器学习框架本…

基于 Java 机器学习自学笔记 (第60天:过去十日的总结)

注意:本篇为50天后的Java自学笔记扩充,内容不再是基础数据结构内容而是机器学习中的各种经典算法。这部分博客更侧重于笔记以方便自己的理解,自我知识的输出明显减少,若有错误欢迎指正! 目录 1.尝试作为知识的输出者 …

机器学习入门-用Java实现简单感知机

一、通俗理解机器学习 1、机器学习是人工智能的一种,如图所示,它是人工智能的一个子方向。 2、机器学习有点像人类的学习过程。 1. 人类学习通过经验(事件),归纳出规律。 2. 机器学习通过数据,训练出模型。 3、机器学习不是基于编…

机器学习算法 java_Java开发人员的机器学习,第1部分:机器学习算法

机器学习算法 java 无人驾驶汽车,面部检测软件和语音控制扬声器均基于机器学习技术和框架构建,而这些仅仅是第一波。 在接下来的十年中,新一代产品将改变我们的世界,为软件开发以及我们创建和使用的应用程序和产品启动新的方法。 …

【Java应用】使用Java实现机器学习算法:聚类、分类、预测

一、引言 1、机器学习算法概述 机器学习是一种人工智能技术,旨在通过使用数据和统计分析来让计算机系统自动改进性能。机器学习算法可分为三大类:聚类、分类和预测。聚类算法用于将数据集分成不同的群组;分类算法用于将数据分为不同的类别&…

KL15和KL30

一、KL15节点方式 这是最直接和简单的方法,将所有CAN总线上的ECU电源都接在KL15上面。(KL15是当点火开关在ON上才接通蓄电池电源) 缺点,无法适应所有的ECU: 1.可以断电关闭,比如座椅控制。 2.有些ECU在汽车到OFF档时…

KL15和KL30节点网络管理概念

一、KL15节点方式 这是最直接和简单的方法,将所有CAN总线上的ECU电源都接在KL15上面。(KL15是当点火开关在ON上才接通蓄电池电源) 缺点,无法适应所有的ECU: 1.可以断电关闭,比如座椅控制。 2.有些ECU在汽车到OFF档时…