生存分析(1)

article/2025/10/27 0:26:19

一、基本概念和名词解释

1.生存分析(survival analysis)

是研究生存现象和响应时间数据及其统计规律的一门学科。
是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。
生存分析与其他多因素分析最大的区别,就是生存分析考虑了观测结果出现的时间长短。

2.生存时间(survival time, failure time)

终点事件起始事件之间的时间间隔。
终点事件:研究者所关系的特定结局
起始事件:反应研究对象生存过程的起始特征的事件。

终点事件与起始事件是相对而言的,都是由特定的研究目的所决定的,是整个研究过程的标尺,需要在设计时明确规定,并在研究期间严格遵守,不能随意改变。

生存时间举例

起始事件终点事件
服药—–>痊愈
手术切除—–>死亡
染毒—–>死亡
化疗—–>缓解
缓解—–>复发

3.生存时间的类型(survival time, failure time)

(1) 完全(complete)数据
从起点至死亡(死于所研究疾病)所经历的时间
(2) 删失(censored)数据
指在观察或试验中,由于人力或其他原因未能观察到所感兴趣的事件发生,因而得到的数据。

可见删失数据得到的时间是并不准确的

删失原因:失访、死于其它疾病、观察结束时病人尚存活

删失分类:

  • 左删失(left censored)
    只知道实际生存时间比观察到的要短

  • 右删失(right censored)
    只知道实际生存时间比观察到的要长

  • 区间删失(interval censored)
    只知道实际生存时间在某个区间范围内

生存时间度量单位可以是年、月、日、小时等,常用符号t表示,右删失数据右上角标记“+”,其他删失数据标记“?”。

这里写图片描述

注意:删失数据不等于截尾数据

截尾数据(Truncation)
只有“左截尾”和“右截尾”两种。

  • 左截尾:数据都大于某个值
  • 右截尾:数据都小于某个值

截尾数据的产生,往往是因为实验设计的要求使得数据天然具有上界或者下界。

如一个实验研究退休职工的生存情况,那么显然这些数据都是左截尾的,因为所有个体的年龄都大于退休年龄(如t≥60)

截尾与删失的区别

  • 产生原因不同
    删失数据的产生往往是随机的,不可事先预知的,如失访等
    截尾数据在实验设计时往往就可以提前预知

  • “左右”意义不同
    左截尾是数据大于某个值,左删失是数据小于某个值
    右截尾是数据小于某个值,右删失是数据大于某个值

  • 描述级别不同
    删失数据体现的是个体数据的特点,如某个患者的数据是删失的
    截尾数据体现的实验中样本整体的特点,如上面说的都大于60岁

二、统计概念和名词解释

申明:生存时间的分布一般不呈现正态分布

1.条件生存概率(conditional probability of survival)

表示某时段开始存活的个体,到该时段结束时仍存活的可能性。

年条件生存概率表示年初尚存人口存活满一年的可能性。

p=

2.生存率(survival rate, survival function)

观察对象经历t个单位时间段后仍存活的可能性,如

=

如期初观察例数为100,术后1、2、3年死亡总数分别为10、20、30,无截尾数据,试求各年条件生存概率及逐年生存率。

这里写图片描述

可以看出,条件概率是单个时间段的结果,而生存率实质上是条件概率的累积结果。例如,3年生存率是第一年、第二年、第三年都存活的可能性。
=

可见生存率的计算根据原理分为:
直接法:直接按概率定义计算
概率乘法定理:用各年条件生存概率相乘

3.描述函数(conditional probability of survival)

生存函数S(t):
观察对象的生存时间T大于某时刻t的概率称为生存函数(survival function)。

S(t)=t

死亡函数S(t):
观察对象的生存时间T不大于某时刻t的概率称为死亡函数(failure function)。

F(t)=1S(t)

死亡密度函数f(t):
观察对象在某时刻t的瞬时死亡率为死亡密度函数(failure density)

h(t)=[t,Δt]Δt=ΔΔt=F(t)

风险函数h(t):
生存到时刻t的观察对象在时刻t的瞬时死亡率称为风险函数(hazard function)
可以理解为一种条件死亡密度

S(t)=f(t)S(t)=[t,Δt]tΔt

4.生存曲线(survival curve)

以观察(随访)时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线图。
生存率是一条下降的曲线,分析时应注意曲线的高度和下降的坡度。平缓的生存曲线表示高生存率或较长生存期,陡峭的生存曲线表示低生存率或较短生存期。

某医师收集20例脑瘤患者甲、乙两疗法治疗的生存时间(周)如下:
甲疗法组 1 3 3 7 10 15 15 23 30
乙疗法组 5 7+ 13 13 23 30 30+ 38 42 42 45+

其生存曲线如下:
这里写图片描述

生存率的具体算法和曲线的画法,在生存分析(2)中将详细介绍

5.中位生存期(median survival time)

又称半数生存期,表示恰有50%的个体尚存活的时间。
中位生存期越长,表示疾病的预后越好,中位生存期越短,预后越差。
估计中位生存期常用图解法或线性内插法。

注:
预后:指预测疾病的可能病程和结局
线性内插法:根据一组已知的自变量及其对应的函数值,利用等比关系求解未知函数值的方法。

三、生存资料统计学处理

(一)设计

目的:

  • 专业目的:根据专业领域所需而定
  • 统计学目的:
    1) 估计:根据样本生存资料估计总体生存率及其它有关指标(如中位生存期等),如根据脑瘤患者治疗后的生存时间资料,估计不同时间的生存率、生存曲线以及中位生存期等。

    2)比较:对不同处理组生存率进行比较,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。

    3)影响因素分析:目的是为了探索和了解影响生存时间长短的因素,或平衡某些因素影响后,研究某个或某些因素对生存率的影响。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。

    4)预测:具有不同因素水平的个体生存预测,如根据脑瘤病人的年龄、性别、病程、肿瘤分期、治疗方案等预测该病人t年(月)生存率。

方法:

  • 前瞻性队列研究:
    前瞻性队列研究是队列研究的基本形式。研究对象的分组是根据研究对象现时的暴露状况而定的,此时研究的结果还没有出现,需要前瞻性观察一段时间才能得到。
  • 回顾性队列研究
    回顾性队列研究的研究对象是根据其在过去某时点的特征或暴露情况而入选并分组的,然后从已有的记录中追溯从那时开始到其后某一时点或直到研究当时为止这一期间内,每一成员的死亡或发病情况。

回顾性队列研究实际做的是在现在调查过去的既成事实,这时暴露与疾病或死亡均已成事实,而前瞻性队列研究的随访则是查寻在过程中新出现的病例或死亡及其死因。

(二)收集资料

1.确定起始事件、终点事件、随访终止日期、生存时间、截尾。

2.确定可能的影响因素、水平以及量化方法。如:
这里写图片描述

3.设计调查表:
一览表:因素较少时
单一表:因素较多时

调查表中应包括

  • 可能的影响因素
  • 观察起点和终点(年、月、日)
  • 生存时间
  • 生存结局

样本含量:非截尾例数至少是可能影响因素的10

(三)整理资料

认真检查、和对原始数据,包括影响因素、生存时间和生存结局
尽量避免缺失值
建立数据库

生存资料基本要求

  • 样本由随机抽样方法获得,要有一定的数量
  • 死亡例数不能太少
  • 结尾比例不能太大
  • 生存时间尽可能准确。因为常用的生存分析方法都在生存时间排序的基础上做统计处理,即便是小小的舍入误差,也可能改变生存时间顺序而影响结果
  • 缺项应尽量补齐

(四)分析资料

估计: Kaplan-Meier法,寿命表法
比较: log-rank检验,Wilcoxon 秩和检验
影响因素分析: Cox比例风险回归模型
预测: Cox回归模型预测生存率

至此,和生存分析相关的基本知识就介绍完了,之后将详细介绍生存分析中各种算法及其使用。


http://chatgpt.dhexx.cn/article/dWiFb8sl.shtml

相关文章

什么是生存分析(survival analysis)?

什么是生存分析(survival analysis)? 用来研究生存时间的分布规律以及生存时间和相关因索之间关系的一种统计分析方法 基本概念 失效事件(Failure Event):常被简称为事件,研究者规定的终点结局,医学研究中可以是患者死亡,也可以是疾病的发生、某种治疗的反应、疾病的…

生存分析原理简明教程 单因素生存分析 Kaplan-Meier、LogRank 只能针对单一的变量进行 多因素cox回归分析

一、生存分析 狭义上来说,生存分析用来分析病人的生存和死亡情况。广义上讲的是事件是否发生。在这里就用是否死亡来代替。一般来说,生存的数据一般有两个变量,一个事件是否发生,病人是否死亡,死亡为1,未死…

IRIS 2021 技术文档 First Look 25 -- 数据库加密

本文档向您介绍 InterSystems IRIS数据平台如何处理数据库加密,这是所有企业安全战略的重要组成部分。 本文档介绍了数据库加密的情况,并引导您完成一些与创建加密数据库有关的初始任务。一旦您完成了本指南,您将创建一个密钥文件&#xff0c…

开始使用了

开始了 今天开始用,请大家指教 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。 新的改变 我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown…

Oracle LiveLabs实验:DB Security - Key Vault

概述 此实验关于Oracle Key Vault。 此实验申请地址在这里,时间为55分钟。 实验帮助在这里。 实验生成需要15分钟左右,最终会生成2个虚机,以下为我的专属配置: 129.146.74.138 DBSEC-LAB (数据库主机)…

idea 启动项目找不到程序包,提示程序包不存在

我是一个父子工程项目,项目在编译,build,rebuild的时候都没用报错,但用idea启动的时候就报错 error:找不到该程序包.或者类… 在网上找了很多方法都没有解决:reimport maven ,rebuild 都不行 .maven实际是完整的,本地也有这个jar包. 现在我在网上找了几种解决方法: 1.是因为id…

docker-compose vmwkmip

vSphere 6.5 中引入了许多 vSphere 安全增强功能,包括备受期待的虚拟机加密功能。为了能够使用新的虚拟机加密功能,您需要先设置一个 密钥管理互操作性协议 (KMIP)服务器(如果您还没有)并将其与您的 vCenter Server 相关联。有很多 3rd 方供应商提供与新的 VM 加密功能互操…

运维实战:Xtrabackup备份与还原

目录 运维实战:percona-xtrabackup备份与还原 一、工作原理 二、版本区别 三、Xtrabckup特点及限制 3.1 特点 3.2 限制 四、xtrabckup安装(mariadb5.5 xtrabckup 2.4) 4.1 rpm安装xtrabackup 4.2 xtrabackup的rpm包含哪些内容 4.2…

FileNotFoundException: jdcbc.properties (系统找不到指定的文件) 该问题的解决方法

一般遇到这种问题都是我们将properties文件创建在模块下面了, 这时候,由于默认访问路径在项目下面, 所以此时我们应该加上当前模块的路径, 即可解决这个问题

pykmip测试

开源路径:https://github.com/OpenKMIP 创建key并加解密 import ssl from kmip.pie.client import ProxyKmipClient, enums from kmip.pie import objectsclient ProxyKmipClient(hostname127.0.0.1,port5696,cert/home/nxy/PyKMIP/bin/client_cert.pem,key/home/nxy/PyKMIP…

开始使用KMIP4J

开始使用KMIP4J 密钥管理互操作协议(KMIP)的开源实现 KMIP定义了密钥生命周期管理系统(KLMS)和其客户之间的沟通。一些公司已经使用专有的KMIP实现,这些KMIP实现使用不同的编程语言,但是到现在为止&#xf…

KMIP4J数据处理流程

Kmip1.0测试环境介绍:http://blog.csdn.net/lihuayong/article/details/25098093 1 测试环境整体结构 系统的结构是基于客户端-服务器体系结构(见下图)。红色水平虚线显示了KMIP1.0库和测试环境的边界。实现的测试环境由一个客户端和服务器端…

KMIP1.0环境搭建

开发环境:MyEclipse 10 JDK:jdk1.7 Tomcat:apache-tomcat-7.0.6 数据库:H2嵌入式数据库 下载java 实现的KIMP1.0版本的源码包和相关的jar包文件。 下载地址:http://sourceforge.net/projects/kmip4j/files/KMIP4J-V1.0…

kmip4j_KMIP4J入门

kmip4j 有关管理数据安全性和合规性的电子书 组织难以确定多个合规性任务的优先级,并创建数据安全策略来满足这些要求并保护其最敏感的数据。 您可以下载eBook, 管理合规性并保护企业数据 ,以了解在企业数据保护策略中有效管理合规性要求和保护数据的六个基本步骤。 “加密…

KMIP协议/TTLV格式解码

文章目录 KMIP协议官方文档手动解析TTLV格式请求响应 自动解析解析请求和响应 KMIP协议官方文档 KMIP协议官方文档:http://docs.oasis-open.org/kmip/spec/ 打开是这样的,在我写这篇文章的时候 KMIP更新到了1.4版本 以下KIMIP1.0协议为例: …

导入pfx证书

本文分享从Micrsoft Manange Console(简写为 MMC)中导入PFX证书的内容,您可以按住“Windows R”,从Run对话框中输入mmc,打开MMC界面。 一:添加管理单元(snap-in) 从File主菜单中选…

关于pfx证书和cer证书

Pfx证书,同时包含了公钥信息和私钥信息(用私钥加密进行签名证明是本人签名,用公钥解密对签名进行进行验证,证明签名的合法性) PFX也称为PKCS#12(Public Key Cryptography Standards #12,公钥密码技术标准#…

OpenSSL 生成pfx

OpenSSL 生成pfx Window需要安装OpenSSL(需要下载),Linux自带OpenSSL工具(无需安装) Window下载地址: 1. 官网 2. 上传了一份到csdn Window 命令 # 生成私钥 "D:\Program Files\OpenSSL-Win64\bi…

pfx 证书 转 jks 证书

今天在tomcat 配置 https pfx 证书时 总是配置失败 很是 头疼 &#xff0c;配置参数如下&#xff1a; <Connector port"443" protocol"org.apache.coyote.http11.Http11Protocol" SSLEnabled"true"maxThreads"150" scheme"ht…

通过openssl生成pfx证书

通过centos7上自带的openssl工具来生成。首先创建一个pfxcert目录。然后进入此目录。 1.生成.key文件&#xff08;内含被加密后的私钥&#xff09;&#xff0c;要求输入一个自定义的密码 [rootlocalhost cert]# openssl genrsa -des3 -out server.key 2048 Generating RSA priv…