生存分析(2)

article/2025/10/27 0:24:56

接上篇文章生存分析(1),本文将进一步介绍生存分析中有关生存率的具体算法及其应用

Kaplan-Meier法(K-M法、乘积极限法)

Kaplan-Meier法由Kaplan和Meier于1958年提出,直接用概率乘法定理估计生存率,故称乘积极限法(product-limit method),是一种非参数法
这里写图片描述

1.计算方法

a. 将样本生存时间T从小到大排列成如表第1栏。若遇到非删失值和删失值相同时,非截删失排在前面。
b. 列出与T相应的死亡人数d,如表第2栏
c. 列出期初病例数n,如表第3栏,即生存期为某时间时尚存活的病例数
d. 计算活过各时点的生存率P(T>t),计算公式为

P(T>t)=p=ndn

2.标准误计算

均数的标准误
为了表示均数的抽样误差大小如何,用的一种指标称为均数的标准误。我们以样本均数为变量,求出它们的标准差即可表示其变异程度,所以将样本均数这“标准差”定名为均数的标准误,简称标准误,以区别于通常所说的标准差。标准差表示个体值的散布情形,而标准误则说明样本均数的参差情况,两者不能混淆。
(具体可参考这里的介绍)

对于K-M法,标准误的计算方法有两种:
<1> Sp(T>t)=P(T>t)d(nd)n

<1> Sp(T>t)=P(T>t)1P(t>t)nd

例数较多时,两法计算结果相同,但例数逐渐减少,法1的结果偏小,法二的结果偏大。

3.生存率的可信区间

利用正态近似原理,估计总体生存率的可信区间,如95%置信度

=P(T>t)±1.96Sp(T>t)

上表中存活时间大于30天,生存率的95%可信区间为
P(T>30)±1.96×0.1107=(0.4646,0.8486)

4.单因素分析(log-rank test)

对数秩检验(log-rank test)
属于非参数检验,用于比较两组或多组生存曲线或生存时间是否相同
检验统计量为卡方 χ2
自由度=组数-1

χ2=(AT)2T

其中A为观察死亡数,T为理论死亡数。当有T<5时,用下式进行校正
χ2=(|AT|0.5)2T

计算完卡方值,查表得到P值,可得到推断结论
具体而言,首先将数据按如下形式组织:

这里写图片描述

将A、B两组的生存天数混在一起从小到大排序放在第二列,第一列是对应的组别,其他按表中给的填入
如此便可以得到A、B两组各自的合计理论死亡数,和实际死亡数(注意删失数据不参与计算),分别带入公式计算卡方即可

K-M方法提供三种假设检验分别是
Log-rank检验、Breslow检验和Tarone Ware检验
三者都是构造卡方检验量,具体比较如下:
这里写图片描述
更为具体的内容可参考这儿


当数据量较小(n<=50)且不含删失数据时,可以选择Wilcoxon 秩和检验,检验效果更好。

Wilcoxon 秩和检验
核心思想:如果两个样本来自相同的整体,那么秩将大约均匀的分布在两个样本中(秩:将样本从小到大排序,排名即为秩)。否则,则有一个样本获得较小的秩和,另一个获得较大的秩和。

计算:
设两个独立样本为:第一个样本x的样本容量为n1,第二个样本y的样本容量为n2,在容量为n1+n2的混合样本(样本x、y之和)中,x样本的秩和为 Wx ,y样本的秩和为 Wy ,且有

Wx+Wy=1+2++n=n(n+1)2

我们定义
W1=Wxn1(n1+1)2=xx
W2=Wyn2(n2+1)2=yy

可以知道样本x在混合之后的秩和最小也是原秩和,即
min(Wx)=n1(n1+1)2
对样本y同理,即
min(Wy)=n2(n2+1)2

根据 Wx Wy 的关系可知,最大秩和为
max(Wx)=n(n+1)2n2(n2+1)2
max(Wy)=n(n+1)2n1(n1+1)2

因此 W1 W2 的取值范围均为:
[0,n(n+1)2n1(n1+1)2n2(n2+1)2]=[0,n1n2]

接下来我们进行假设检验。

假设: x,y样本来自相同总体
当原假设为真时,所有的 xi yi 相当于从同一总体中抽得的独立随机样本, xi yi 构成可分辨的排列情况,可看成一排n个球随机地指定 n1 个为x球另 n2 个为y球,共有 Cn1n 种可能,而且它们是等可能的。基于这样分析,在原假设为真的条件下不难求出 W1 W2 的概率分布,显然它们的分布还是相同的,这个分布称为样本大小为 n1 n2 的Mann-Whitney-Wilcoxon分布

一个比较实际的方法是,对于每个样本数大于等于8的大样本来说,我们可以采用标准正态分布Z来近似检验。
因为 W1 的中心点为 n1n22 ,所以 Wx 的中心点为

μ=n1n22+n1(n1+1)2=n1(n1+n2+1)2

W_x的方差 σ2 从数学上可推导出
σ2=n1n2(n1+n2+1)12

如果样本中存在结,将影响公式中的方差(结:即相同的数据,此时秩会被平分)
按结值调整方差的公式为:

σ2=n1n2(n1+n2+1)12n1n2((τ3jτj)12(n1+n2)(n1+n21)

其中 τj 为第 j 个结的个数。结值的存在将使原方差变小,这是一个显然正确的事实。标准化后Wx
z=Wxμ±0.5σ=Wxn1(n1+n2+1)2±0.5n1n2(n1+n2+1)12n1n2(τ3jτ)12(n1+n2)(n1+n21)N(0,1)

其中0.5是为了对离散变量进行连续性修正,对于 Wxμ>0 减0.5修正,反之加0.5修正。

算例
x组:11 15 10 18 11 20 24 22 25
y组:13 14 10 8 16 9 17 21
将二者统一如下:

这里写图片描述

可以看出 n1=9 n2 =8, Wx =96.5, Wy =56.5.
H0:两个样本的分布是相同的。标准分布z值的计算结果为:

z=96.59(9+8+1)20.59×8(9+8+1)129×8(82+82)12(9+8)(9+91)=1.44515

如果设定显著水平 α=0.05 ,我们知道标准正态分布在0.05显著水平时,上临界值为1.645,下下临界值为-1.645,由1.445<1.645,所以不能拒绝原假设。
当然你也可以用第二个样本的秩和 Wy 来计算标准正态分布,此时要注意公式中的 n1 n2 发生对换。

寿命表法(life table,LT)

生存资料按如下格式准备
这里写图片描述

1.计算方法

第一列为人为时间分组
第二至第四列按列名填入
第五栏校正人数,按公式 N=LW2
期内生存概率即条件生存概率,死亡概率同理计算,但是分母改为校准人数N
生存率同样使用乘法定理计算即可

2.标准误计算

标准误按如下公式计算

Sp(T>n)=p(T>n)qpN

3.生存率可信区间

同K-M法

K-M法与寿命表法比较

1.格式与精确度
K-M法使用患者实际寿命作为分布区间,相对更精确
寿命表法采用人为规定时间段作为分布区间,范围扩大精确度有所下降

2.适用范围
K-M法更适合于样本量较少的数据
寿命表法更适合于样本量较大的数据
(不过,考虑到现在计算能力的强大,一般程度的数据量并不会对计算速度有太大影响)

3.关注点不同
K-M法关注每一个时点的生存率,重视对生存率规律的细致把握,可以利用K-M的结果去研究影响生存率变化(如曲线的突变点)的影响因素。
寿命表法则更重视对生存规律的总体把握(如各年生存率的情况)。

至此,有关生存分析的非参数研究方法K-M与寿命表法就介绍完了。接下来的一篇文章,将介绍含参数的研究方法—Cox比例风险回归模型


http://chatgpt.dhexx.cn/article/5UkvbIQJ.shtml

相关文章

生物统计分析之生存分析

简介 生存分析(Survival analysis)是指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断&#xff0c;研究生存时间和结局与众多影响因素间关系及其程度大小的方法&#xff0c;也称生存率分析或存活率分析。临床医学数据生存分析是将临床医学中事件的现象与结果&am…

生存分析研究

生存分析 生存分析基础知识生存分析生存数据生存函数1.描述性 生存分析方法生存分析统计方法非参数方法半参数方法参数方法 生存分析机器学习模型 生存分析研究的内容1.描述生存过程2.比较生存过程3.分析危险因素4.建立数学模型 研究思路1.数据2.模型设计3.实验部分&#xff08…

生存分析

1 KM法计算生存率——非参数模型2 log-rank秩检验比较不同组的生存率2.1 输入数据2.2 建立假设2.3 log-rank秩精确性检验2.4 可视化 1 KM法计算生存率——非参数模型 乘积极限法适用于离散数据&#xff0c;它用于建立时刻 t t t 上的生存函数&#xff0c;根据 t t t 时刻之前…

8.常用统计分析方法——生存分析

目录 生存分析基本概念 生存率估计 1. 乘积极限法 2. 寿命表法 3. 生存曲线 生存曲线比较 COX比例风险回归模型 1. 建立COX回归模型 2. 比例风险假定的检验 3. 生存预测 生存分析基本概念 logistic回归中因变量是终点事件发生与否&#xff0c;而生存分析则关注的是终…

生存分析(1)

一、基本概念和名词解释 1.生存分析&#xff08;survival analysis&#xff09; 是研究生存现象和响应时间数据及其统计规律的一门学科。 是将事件的结果&#xff08;终点事件&#xff09;和出现这一结果所经历的时间结合起来分析的一种统计分析方法。 生存分析与其他多因素…

什么是生存分析(survival analysis)?

什么是生存分析(survival analysis)? 用来研究生存时间的分布规律以及生存时间和相关因索之间关系的一种统计分析方法 基本概念 失效事件(Failure Event):常被简称为事件,研究者规定的终点结局,医学研究中可以是患者死亡,也可以是疾病的发生、某种治疗的反应、疾病的…

生存分析原理简明教程 单因素生存分析 Kaplan-Meier、LogRank 只能针对单一的变量进行 多因素cox回归分析

一、生存分析 狭义上来说&#xff0c;生存分析用来分析病人的生存和死亡情况。广义上讲的是事件是否发生。在这里就用是否死亡来代替。一般来说&#xff0c;生存的数据一般有两个变量&#xff0c;一个事件是否发生&#xff0c;病人是否死亡&#xff0c;死亡为1&#xff0c;未死…

IRIS 2021 技术文档 First Look 25 -- 数据库加密

本文档向您介绍 InterSystems IRIS数据平台如何处理数据库加密&#xff0c;这是所有企业安全战略的重要组成部分。 本文档介绍了数据库加密的情况&#xff0c;并引导您完成一些与创建加密数据库有关的初始任务。一旦您完成了本指南&#xff0c;您将创建一个密钥文件&#xff0c…

开始使用了

开始了 今天开始用,请大家指教 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。 新的改变 我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown…

Oracle LiveLabs实验:DB Security - Key Vault

概述 此实验关于Oracle Key Vault。 此实验申请地址在这里&#xff0c;时间为55分钟。 实验帮助在这里。 实验生成需要15分钟左右&#xff0c;最终会生成2个虚机&#xff0c;以下为我的专属配置&#xff1a; 129.146.74.138 DBSEC-LAB &#xff08;数据库主机&#xff09;…

idea 启动项目找不到程序包,提示程序包不存在

我是一个父子工程项目,项目在编译,build,rebuild的时候都没用报错,但用idea启动的时候就报错 error:找不到该程序包.或者类… 在网上找了很多方法都没有解决:reimport maven ,rebuild 都不行 .maven实际是完整的,本地也有这个jar包. 现在我在网上找了几种解决方法: 1.是因为id…

docker-compose vmwkmip

vSphere 6.5 中引入了许多 vSphere 安全增强功能,包括备受期待的虚拟机加密功能。为了能够使用新的虚拟机加密功能,您需要先设置一个 密钥管理互操作性协议 (KMIP)服务器(如果您还没有)并将其与您的 vCenter Server 相关联。有很多 3rd 方供应商提供与新的 VM 加密功能互操…

运维实战:Xtrabackup备份与还原

目录 运维实战&#xff1a;percona-xtrabackup备份与还原 一、工作原理 二、版本区别 三、Xtrabckup特点及限制 3.1 特点 3.2 限制 四、xtrabckup安装&#xff08;mariadb5.5 xtrabckup 2.4&#xff09; 4.1 rpm安装xtrabackup 4.2 xtrabackup的rpm包含哪些内容 4.2…

FileNotFoundException: jdcbc.properties (系统找不到指定的文件) 该问题的解决方法

一般遇到这种问题都是我们将properties文件创建在模块下面了, 这时候,由于默认访问路径在项目下面, 所以此时我们应该加上当前模块的路径, 即可解决这个问题

pykmip测试

开源路径:https://github.com/OpenKMIP 创建key并加解密 import ssl from kmip.pie.client import ProxyKmipClient, enums from kmip.pie import objectsclient ProxyKmipClient(hostname127.0.0.1,port5696,cert/home/nxy/PyKMIP/bin/client_cert.pem,key/home/nxy/PyKMIP…

开始使用KMIP4J

开始使用KMIP4J 密钥管理互操作协议&#xff08;KMIP&#xff09;的开源实现 KMIP定义了密钥生命周期管理系统&#xff08;KLMS&#xff09;和其客户之间的沟通。一些公司已经使用专有的KMIP实现&#xff0c;这些KMIP实现使用不同的编程语言&#xff0c;但是到现在为止&#xf…

KMIP4J数据处理流程

Kmip1.0测试环境介绍&#xff1a;http://blog.csdn.net/lihuayong/article/details/25098093 1 测试环境整体结构 系统的结构是基于客户端-服务器体系结构&#xff08;见下图&#xff09;。红色水平虚线显示了KMIP1.0库和测试环境的边界。实现的测试环境由一个客户端和服务器端…

KMIP1.0环境搭建

开发环境&#xff1a;MyEclipse 10 JDK&#xff1a;jdk1.7 Tomcat&#xff1a;apache-tomcat-7.0.6 数据库&#xff1a;H2嵌入式数据库 下载java 实现的KIMP1.0版本的源码包和相关的jar包文件。 下载地址&#xff1a;http://sourceforge.net/projects/kmip4j/files/KMIP4J-V1.0…

kmip4j_KMIP4J入门

kmip4j 有关管理数据安全性和合规性的电子书 组织难以确定多个合规性任务的优先级,并创建数据安全策略来满足这些要求并保护其最敏感的数据。 您可以下载eBook, 管理合规性并保护企业数据 ,以了解在企业数据保护策略中有效管理合规性要求和保护数据的六个基本步骤。 “加密…

KMIP协议/TTLV格式解码

文章目录 KMIP协议官方文档手动解析TTLV格式请求响应 自动解析解析请求和响应 KMIP协议官方文档 KMIP协议官方文档&#xff1a;http://docs.oasis-open.org/kmip/spec/ 打开是这样的&#xff0c;在我写这篇文章的时候 KMIP更新到了1.4版本 以下KIMIP1.0协议为例&#xff1a; …