聚类分析实验报告作业

article/2025/4/23 2:03:22
课程《生物数据处理》  老师:邓阳君老师
        要求:请采用 k 均值 k 中心点、层次聚类或者模糊聚类等对 iris 数据 进行聚类分析,
并评价其效果。实验报告应包括算法理论知识、算法代码、仿真实验结果及其分析等内
容,请于 5 31 日前提交实验报告。

一、算法理论知识

        聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,聚类就是一种发现这种内在结构的技术,聚类技术经常被称为无监督学习。
k 均值聚类是最著名的划分聚类算法,由于简洁和效率使得他成为所有聚类算法中最广泛使用的。给定一个数据点集合和需要的聚类数目 k,k 由用户指定,k 均值算法根 据某个距离函数反复把数据分入 k 个聚类中。

(1K 均值聚类算法

       K-means 算法也称为 K_ 均值算法,用于聚类算法。聚类是一种无监督学习,他将相
似的对象归于一个簇中,簇中心通过簇中所有点的均值来计算。聚类算法与分类算法的
主要区别就是分类的目标类别已知,而聚类的目标类别未知。
簇:所有数据点的点集合,簇中的对象是相似的
质心:簇中所有点的中心(由簇中所有点的均值求得)
SSE:Sum of Sqared Error 平方误差和,SSE 越小表示越接近质心

(2)算法原理

        误差平方和 SSE 用来衡量 K-means 算法的好坏

 

         C 为聚类中心,X 为簇中数据点

         由推导可以看出,当质心为簇中数据均值时,SSE 最小

(3)K-Means 算法步骤

        1. 从数据中选择 k 个对象作为初始聚类中心;
        2. 计算每个聚类对象到聚类中心的距离来划分;
        3. 再次计算每个聚类中心
        4. 计算标准测度函数,直到达到最大迭代次数,则停止,否则,继续操作。
        5. 确定最优的聚类中心

(4)性质

      k 均值聚类是使用最大期望算法(Expectation-Maximization algorithm)求解的 高斯混合模型(Gaussian Mixture Model, GMM)在正态分布的协方差为单位矩阵,且 隐变量的后验分布为一组狄拉克δ函数时所得到的特例。

二、算法代码

三、仿真实验结果及其分析

                                          图 1     从图中可知,较好的K值为2或3

                                                              图 2     k=2时

                                                            图 3     k=3时

      学习总是没有止境的,就如同K值拐点的选择一样,人生也并不是唯一确定的,人生不同之处在于,数据有最佳选择,但是人生永远没有最好的选择,我们能做的就是把选择的路走到最好。共勉~在学习的路上,新手上路总会磕磕碰碰,但是我们要迎难而上,就像学走路时的你,不就是跌跌撞撞学会的走路吗?人生是个圆,有的人走了一辈子也没有走出命运画出的圆圈,他就是不知道,圆上的每一个点都有一条腾飞的切线。希望自己能认真努力的把握机会,就算没有机会,也要创造机会,达到自己的奋斗目标。


http://chatgpt.dhexx.cn/article/0kLJtRHS.shtml

相关文章

聚类分析在SPSS上的实现与结果分析——基于SPSS实验报告

实验目的 通过本次实验学习聚类分析在SPSS软件中的具体操作方法,包括系统聚类法和K-means聚类这两种方法,同时根据实验目的自己判断方法的适用情况选取最优方法完成聚类分析达到聚类的目的,并做出综合的评价。 实验步骤及过程: …

01 数字图像基本操作——图像采样、量化、算术运算、点运算实验结果及分析

04 数字图像技术——图像特征提取之实验结果与分析 03 数字图像技术——频域滤波实验结果与分析 02 数字图像技术——颜色空间转换与颜色空间分割实验结果与分析 01 数字图像基本操作——图像采样、量化、算术运算、点运算实验结果及分析 一、实验目的和要求 1.掌握Anaconda中搭…

数据分析——AB实验

( 一 ) AB实验概念 AB实验通俗讲就是在线上可以切出一部分用户(降低风险),完全随机的分成两组或多组(确保人群一致),一组保持现有的方案叫对照组,另外一组使用改进的方案…

D型触发器仿真结果分析

1. 1bitD型触发器verilog 程序 2.RTL等效电路图 3.仿真结果 当CLK上升沿的时候,q值变化,就是此时此刻d的数值(高低电平),当上升沿发生在高电平区间,q值就是高电平;当上升沿发生在低电平区间&am…

python实验总结与分析_Python实验报告二

安徽工程大学Python程序设计 班级:物流192 姓名:唐家豪 学号:3190505234 成绩: 日期:2020/3/5 指导老师:修宇 【实验名称】:顺序结构程序设计 【实验目的】 (1)掌握数据的输入输出的方法; (2)熟悉顺序结构程序中语句的执行过程; (3)掌握顺序结构程序…

疲劳测试分析软件,直接使用材料疲劳试验数据进行疲劳分析

疲劳计算需要三个输入:有限元应力/应变的计算结果,材料的疲劳数据,一般是S-N曲线或者E-N曲线。第三个是载荷谱。材料的疲劳数据,通常都是在MSC Fatigue软件自带的材料数据库中找个相同或相近的材料,材料库没有的材料&a…

一阶电路暂态响应的结果分析。_阻尼比测试方法及谐响应分析

谐响应分析中,阻尼比的确定是关键问题,工程中阻尼比经常是估计值,导致分析结果跟实际不符。阻尼对模态频率的影响很小,阻尼的主要作用是压低共振处的幅值,如果阻尼取为0的话,共振处的峰值会相当大,理论上是无穷大。目前阻尼问题研究的不是很透彻,并没有很多的理论支持,…

一阶电路暂态响应的结果分析。_电路之暂态分析

电路之 暂态分析 为什么会出现暂态? 学习了前面直流电路和交流电路的内容,我们似乎觉得这已经覆盖了电路可能存在的各种情况。陌生如电容、电感这种元件,只要将它们插在直流电路里,便是一个断路,一个短路,无比简单。可事实真的如此吗?当直流电路中只有电阻时,我们可以认…

python实验总结与分析_Python实验报告七

安徽工程大学 Python程序设计 实验报告 班级 物流191 姓名倪绍磊学号3190505131 成绩 日期 2020.5.28 指导老师修宇 【实验名称】实验七 组合数据类型 【实验目的】 熟悉通过序列索引迭代执行循环;掌握元组、列表与字典的系列操作函数及相关方法 【实验条件】 PC机或者…

ospf 实验详细分析

Ospf实验 R1-3为区域0,R3到R4为区域1,其中R3的环回也在区域0 R1,2也有环回,R1-3 R3为DR设备,没有BDR R4环回地址已固定,其他所有网段使用192.168.1.0/24进行合理分配 R4环回不能宣告,全网可…

slam结果分析

ubuntu18使用evo工具: 可参考的链接 官方描述 1、安装 1)依赖项 sudo apt-get install tcl-dev tk-dev python3-tk2)pip安装 sudo pip install evo --upgrade --no-binary evo2、使用(主要指kitti) 根据地面真实数据…

判别分析在SPSS上的实现与结果分析——基于SPSS实验报告

实验目的 通过本次实验学习判别分析在SPSS软件中的具体操作方法,依据变量的各个特征来对变量进行分组,与聚类分析不同的是判别分析对于类别是已知的。 实验步骤及过程: 首先对14组数据做聚类分析,通过快速聚类法分为3类作为判别…

YOLOv5训练结果分析

本文的目的是帮助理解每次训练后,在runs/train文件夹下出现的一系列文件,并探索如何评估准确率以及模型的好坏。 一.混淆矩阵—confusion_matrix.png 毕设跑的train有混淆矩阵,但是有点扯,需要跑一下鸟类的验证一下(待验证) 1.概…

【科研分享】Matplotlib 绘制热力图(heatmap)进行实验结果分析

Matplotlib 绘制热力图(heatmap)进行实验结果分析 写论文的时候又碰到了新的需求,为了呈现实验结果,这次需要做一个分析两个超参的图,搜了半天发现还是热力图最合适,但是在各处看了很多篇文章发现讲的要么不…

实验结果分析

为了说明本文所提出基于深度学习的SIR模型方法的性能,我们比较了闭集合(Close-set Dataset)数据和开集合(Open-set Dataset)数据两种情景下的已确诊Covid19病例的数量的预测值。模型的闭集合数据内拟合是模型估计潜在参数的有效性的重要指标,而开集合数据…

主成分分析在SPSS上的实现与结果分析——基于SPSS实验报告

实验目的 通过本次实验学习主成分分析在SPSS软件中的具体操作方法,更深入了解主成分分析法的基本思想,通过SPSS的实现将理论运用于实践当中,增强我们的动手能力并且会运用主成分分析的方法来处理数据实现我们的需求。 实验步骤及过程&#x…

03 数字图像技术——频域滤波实验结果与分析——python

04 数字图像技术——图像特征提取之实验结果与分析 03 数字图像技术——频域滤波实验结果与分析 02 数字图像技术——颜色空间转换与颜色空间分割实验结果与分析 01 数字图像基本操作——图像采样、量化、算术运算、点运算实验结果及分析 一、实验目的 1.了解图像…

将两张图片合并成一个PDF,不收费

如何来实现将两张图片合并成一个PDF? 我试过WPS金山、Adobe、万兴等等PDF软件,他们NND都是要收费! 咱也不是钱多到大水飘过来的,这里给出最简单的方式,用Windows自带的打印功能,就能实现! 最重要的是&…

pdf转高清图片

很多人在java中遇到ppt/pdf转图片的时候,有些插图图片转不了或者是转出来的图片不清晰,也都是使用的官方jar包。有些是需要引用到icepdf插件的,这里不细说了,直接放一段稍微简单一点的代码供参考: package test;impor…

锐化pdf文件(图片形式)

目录 前言 正文 1、使用PDF Shaper Pro拆分pdf 2、使用ComicEnhancerPro处理拆分好的图片 3、使用PDF Shaper Pro合并图片为pdf 前言 最近复习考研数学,然后买书真的是死贵死贵,第一次把网上找到的pdf打印出来后发现非常的不清晰,然后开…