【数据分析与数据挖掘】四、多因子与复合分析(上)

article/2025/9/17 23:44:56

这一章内容:属性与属性之间常见的联系。

理论铺垫:

  1. 假设检验与方差检验;
  2. 相关系数:皮尔逊、斯皮尔曼;
  3. 回归:线性回归;
  4. PCA与奇异值分解;

1.假设检验

概念做出一个假设,根据数据已知的分布性质,来推断该假设成立的概率有多大。

过程

step1建立原假设H0,H0的反命题为H1,也叫备择假设。一般情况下,原假设的分布是符合该分布的,而备择假设是不符合该分布的。

step2:选择检验统计量:根据数据的均值方差等性质构造的一个转换函数,构造的目的是便于判断数据是否符合某种分布。例如用某些数据减去均值,再除以标准差,这样判断转换后的统计量是否符合标准正态分布,既可以判断数据的分布是否是标准正太分布的概率了。

step3:根据显著性水平(一般为0.05),确定拒绝域。

接受假设的失真程度的最大限度,显示度水平和相似度的加和为1。例如,确定了某数据的分布有95%的可能性属于某 一个分布,那么它的显著性水平就是5%。

显著性水平一般是人为定的一个值,这个值定的越低,那么说明数据分布符合某种分布的契合程度要求就越高,一般取 0.05,也就是说,要求数据有95%的可能与某分布一致。

一旦确定了显著性水平,就可以画出与这个分布相似度比较高的区域,这叫接受域。接受域以外的区域,就是拒绝域,如果检验统计量落入了拒绝域,那么H0就可以认为是假的,也就是可以被拒绝的假设。

step4:计算p值或者样本统计值,作出判断。

判断的思路有两种,一是计算数据的分布区间,看这个区间是不是包含了我们要比较的特征。二是计算p值,直接和显著性水平进行比较。p值指的是结果更差的概率,如果p值落入了拒绝域,那么说明这个假设是不成立的。

例子:

2.卡方检验

公式:

例如:

卡方值和P值对应表:

从表中可以看出,P值取0.05的话,卡方值应该不大于3.841,而上面的卡方值是129.3,明显大于3.841,所以可以拒绝原假设,即化妆与性别没有很大关系可以被拒绝掉。

卡方检验常用来检验两个因素之间有没有比较强的联系。

3.方差检验

例如:

p值小于0.05,拒绝原假设,说明三种电池的均值是有差异的。

4.相关系数

正相关,负相关,不相关

常用的相关系数有两种:Pearson相关系数,Spearman相关系数

(1)Pearson相关系数

(2)Spearman相关系数

Spearman相关系数和具体的数值关系不大,和数值的排序有关系,所以用于相对比较的情况下比较适合

 


http://chatgpt.dhexx.cn/article/pLcPuRWB.shtml

相关文章

2020淘宝双11超级星秀猫怎么踢人 最强星秀猫怎么退出队伍

2020年的天猫双十一的喵币活动是叫—超级星秀猫,还是一个养猫的活动,不过是可以组队的,有的朋友是想把临时的人踢出队伍或者是自己离开队伍,但是不知道怎么操作,下面就来为大家详细的介绍一下。 1、踢人:今…

单点登录 ( 踢人模式 )

这是最终效果图 实现用户账号在别处登陆,踢出上个已经登陆的账号 单点登陆基本原理: 项目Demo结构 项目 demo 源码 https://github.com/610627597/TestDemo

Spring Security OAuth2 实现多人登录互踢下线

背景说明 一个账号只能一处登录,类似的业务需求在现有后管类系统是非常常见的。但在原有的 spring security oauth2 令牌方法流程(所谓的登录)无法满足类似的需求。 我们先来看 TokenEndpoint 的方法流程 客户端 带参访问 /oauth/token 接…

csgo服务器取消自动踢人,CSGO踢出玩家Kick相关控制台指令

本文将介绍CSGO一些关于踢人/KICK控制台指令,如果你自建服务器或本地建房的话,可能会用得上。 mp_autokick 如果你不想让好友因为队友伤害或挂机/AFK被服务器自动踢出,那么需要输入: mp_autokick 0 这样,服务器中的玩家…

单一用户登录,即当前用户登录后要踢出前一个登录,即做出踢人效果,如何实现?

单一用户登录,即当前用户登录后要踢出前一个登录,即做出踢人效果,如何实现? 一般情况下,用户登录,有两种方式:cookie方式,session方式。一般情况下,session方式是使用最…

【开发经验】客户端互踢实现思路

文章目录 场景如下实现思路 踢用户实现思路、用户单个客户端登录。冻结用户实现 场景如下 每个用户只能登录一个客户端,如微信、支付宝等app,只能在一个手机登录,如果再别的手机登录,则会踢掉之前的那个。冻结账户,账…

登录超时提示+踢人下线实现(spring security)

前言 最近,说有可能要上只允许一个地方登录,还要配合信息推送,今天有空,就起个头,把登录超时、登录踢人下线一起做了。信息推送的,后面再说,留好口子就行。 一、背景 这里是spring security&am…

【LEDE】树莓派上玩LEDE终极指南-86-OpenWrt增加踢人功能

查看文章 欢迎您! 返回首页 最后修改于:2018-03-27 20:03:12 修改 导出 原理 ubus call hostapd.wlan1 del_client "{addr:AC:0D:1B:D0:60:29, reason:5, deauth:false, ban_time:0}" 步骤 修改/usr/lib/lua/luci/view/admin_status/index.ht…

Python搭建QQ机器人,监控QQ发言与进群退群,自动@新成员并屏蔽脏话踢人

目录 前言 原理 准备 go-cqhttp插件安装 nonebot框架的安装 插件的拓展 效果 警告 前言 emmmm,大家好,我叫善念。有点懒 好久没有给大家更新教程了。今天给大家带来的项目比较有趣,而且非常简单,简称 有手即可!…

用户唯一登录,最新登录挤掉以前的登录,实现踢人.

最近在做一个功能,要求是这样的:相同的账号,例如admin账号,在A电脑登录成功,然后admin账号在B电脑登录,系统发现admin账号出现了重复登录,A电脑上登录的admin账号就会被退出登录。 流程图&…

企业微信群管理员可以踢人吗?企业微信群怎么自动踢人?

我们使用企业微信运营客户时,总会有人在企业微信群里面发广告、链接,非常影响其他客户的体验,有没有什么方法将这些人踢出群聊呢? 企业微信群怎么自动踢人? 在企业微信推出群防骚扰功能之前,群管理员最无奈…

spring boot + shiro 实现登陆 踢出用户功能 (挤人) 以及UnknownSessionException异常问题 记住我功能

简介:踢出用户功能:就是限制一个账号登陆人数。 本文限定一个账号一个用户登陆,并且是挤掉前一个用户 目录 首先 pom 然后Shiro配置Bean ShiroConfigBean 然后配置 ShiroRealm(百度翻译: Realm 领域) 然…

java怎么实现踢掉在线用户_Java多人在线聊天室(3)— 踢人下线功能

作为一个聊天室,肯定会有很多人在里面聊天,那么要是有人里面捣乱怎么办?直接踢人不解释。 我们在创建数据库的时候就有这样的考虑,所以我们的账户有两种,一种是管理员,一种是普通用户。 打开的数据库&#…

Shiro实现session限制登录数量踢人下线

Shiro实现session限制登录数量踢人下线 前言实现■ 架构准备ShiroConfig ■ redis内的存储分布■ 代码修改修改 JedisSessionDAO修改 SystemAuthorizingRealm新增 ApiLogoutFilter再次修改 JedisSessionDAO 最后 前言 近年无状态登录兴起,但sessionId方式仍是主流方…

SAP SM04踢人操作(摘录)

管理员在SAP系统中,使用事物码SM04对当前登录在线用户(User)进行管理,可查看服务器全部客户端(Client)的用户的在线状态,并可以结束指定用户的会话状态,也就是强制踢出用户。 双击查…

出生率新低!1978-2020中国人口出生率、死亡率及自然增长率变迁

根据国家统计局近日发布的《中国统计年鉴2021》,2020中国人口出生率为8.52‰,再创历史新低。同时,2020中国人口自然增长率仅为1.45‰,勉强维持正增长,同样是历史新低。 下面的视频记录了1978-2020中国人口出生率、死亡…

百度迁徙大数据整理[2020+2019同期]

统筹推进疫情防控和经济社会发展工作是常态化疫情防控阶段促进中国经济恢复的必然选择。基于百度地图迁徙大数据,采用双重差分模型探究不同阶段的疫情防控措施对中国人口流动的影响。结果表明,早期的疫情超常规防控措施有效控制了人口流动,导…

【SQLPlanet】基于迁徙率等指标浅析拍拍贷逾期数据(未完待续)

1、背景介绍 拍拍贷是一家金融科技公司,2007年成立于上海,并在2017年11月10日成功于美国纽交所上市。根据官方消息,截至2018年9月30日,拍拍贷累计成交额已突破1300亿,15-29天及30-59天的逾期率分别为0.83%和1.21%&…

百度迁徙 迁入人口和迁徙规模爬虫

最近做COVID-19相关的课程项目,需要用到省级间人口迁移的数据。笔者参考改进了https://blog.csdn.net/qq_44315987/article/details/104118498 的城市间流动的代码,从百度迁徙爬取了数据,并将数据保存在同一张表内。 迁入人口 # coding:utf…