MIMIC-IV数据库介绍与使用说明

article/2025/8/23 5:44:39

MIMIC-IV

  • 一些基本逻辑
  • 各模块和table介绍
    • Tables
      • Core
      • Hosp
      • ICU
      • ED
      • CXR
      • Note
  • 官网及数据库下载网址
  • 2022.6.12 更新

在word中更加详细的列出了各table中table所代表的含义以及我在使用中所遇到的问题,可在资源页面进行下载。
在这里插入图片描述

一些基本逻辑

病人定义:
subject_id
每个患者有唯一的subject_id
hadm_id
患者的每一次入院会有一个唯一的hadm_id
transfer_id
患者每一次更换病房会有一个唯一的transfer_id
stay_id
在相同类型病房内进行转移,则会更新一个transfer_id,但会有相同的stay_id,例如用ICU中的一个病房转移到另一个病房,则stay_id不变,transfer_id更新。
所有id的分配都是随机的,与时间先后无关。
date and time
后缀为date的,分辨率最低为天;后缀为timed的字段,分辨率最低为分钟。
charttime and storetime:分别是测量的记录时间与储存时间。通常以charttime为准
d and icd
命名为d_开头,为编码表。d_icd开头,为icd编码表。icd结尾的表,为使用icd编码的记录表。

各模块和table介绍

在word中列出了各table中table所代表的含义以及我在使用中所遇到的问题,可在资源页面进行下载。

Tables

分为六个模块,Core、Hosp、ICU、ED、CXR、Note

Core

Core模块包含患者跟踪数据。这里描述了人口统计、入院信息和住院病房转院情况
admission
患者入院信息,以每次入院为单位记录,每条记录有一个单独的hadm_id
patient
患者信息
transfers
病房转移信息

Hosp

Hosp模块涵盖的信息包括实验室测量,微生物学,药物管理,和收费诊断等

d_icd_diagnoses
包含国际疾病分类(ICD)第9版和第10版的诊断代码。icd_code一定要读取为字符串,因为开头为0是有意义的,若读取为数值会有重复,如01622和1622代表不同疾病。
diagnoses_icd
患者诊断信息表。seq_num代表诊断的优先级,序号越靠前越重要,而低优先级的排序有时并不准确。drgcodes
也是与诊断相关的表,使用Diagnosis Related Group(DRG) code.编码,与diagnose表中的主要诊断相对应。
d_icd_procedures
procedures_icd
患者住院期间的手术信息,包括在ICU期间的信息。
d_labitems
实验室检查定义表
labevents
病人实验室检查的记录
prescriptions
处方数据,药物数据
pharmacy
药房数据表,以pharmacy_id字段与prescriptions表相关联,相当于对prescriptions表中各处方信息的补充。
此外,还有微生物培养、收费、订单等表格

ICU

包含从ICU内使用的临床信息系统收集的信息。记录在案的数据包括静脉给药、呼吸机设置和其他图表项目等。
每个患者每次入院可能有多次icu,每次icu对应一个stay_id
d_items
包含ICU内发生的所有项目的编码,通过itemid字段与ICU模块内的其他表格关联。
ICU stays
入住ICU的时间信息
chartevents
Chartevents包含了一个病人可用的所有图表数据,有些lab数据与labevents表中的数据重复。

ED

急诊信息,包含急诊诊断,病人体征等信息。通过subject_id和hadm_id与其他模块相连接。急诊的患者如有hadm_id,则说明该患者住院治疗。ed患者不一定住院,住院的患者也不一定从急诊入院。
diagnosis table
诊断表为患者提供诊断列表。从急诊科出院后确定诊断。
edstays table
急诊科来访的主要跟踪表。它提供了病人进入急诊科和离开急诊科的时间
medrecon table
在进入急诊室时,工作人员会询问病人目前正在服用什么药物。这个过程被称为药物协调,医疗检查表存储了护理人员的调查结果
pyxis table
提供了通过pyxis系统配制药物的信息。
triage table
包含病人在急诊室第一次分诊时生命体征信息
vitalsign table
急诊室收治的病人常规的生命体征需要1-4小时。这些生命体征保存在生命体征表中
vitalsign_hl7 table
急诊收治的病人可通过遥测技术进行监测。每分钟的生命体征都被传送到医院的中央服务器,这些生命体征都被记录在这里。

CXR

X光胸片文件,源数据是dicom格式,但也提供了jpg格式的下载。包含了胸片及影像学报告。值得注意的是,存在有影像的患者没有住院记录的情况。
cxr-record-list
影像列表
cxr-study-list
影响报告列表
mimic-cxr-2.0.0-chexpert
使用CheXpert labeler(基于影像学报告的非人工标注,斯坦福与麻省理工合作)标注了14个标签,标签如下表
mimic-cxr-2.0.0-split
提供了参考的训练集、验证集、测试集划分

Note

官方还未发布
(NOT PUBLICLY AVAILABLE): 所有文本报告,出院、超声、心电、影像等报告

官网及数据库下载网址

官方介绍见 MIMIC官方网站
MIMIC-IV 数据库下载见 MIMIC-IV发布页
X光胸片dicom格式数据下载见 MMIC-CXR Database
X光胸片JPG格式数据见 MIMIC-CXR-JPG
急诊数据见 MIMIC-IV-ED

2022.6.12 更新

MIMIC-IV于2022.6.12发布V2.0版本,有以下变动
一、主要变化

  1. 移除了core模块,目前admissions, patients 和 transfers 表格存在hosp模块里;
  2. 移除了新生儿数据,后续将与新生儿重症监护室的数据一起在其他项目中单独发布。
  3. 添加了两个新表,ingredientevents和omr

二、ICU模块

  1. icustays
    由于patient表的变化,大约700个stayids(约1%)发生了改变。
  2. chartevents, d_items
    chartevents表中新增加了itemid=220001,以记录来自MetaVision 的1000多个问题 。大多数记录在案的问题与患者的护理计划有关,并在护士轮班期间(早上 7 点或晚上 7 点)记录在案。
  3. ingredientevents
    这是一个与 inputevents关联的新表。在 inputevents表中跟踪的每一次静脉给药都与一组成分相关。这些成分包括含水量、热量信息等。 inputevents表支持营养学相关研究,并通过对所有水成分求和以用于评估fluid input。目前,这些成分已从inputevents表中分离出来,添加至新表ingredientevents中。
  4. inputevents
    仅删除了包含空值的列:cancelreason
  5. procedureevents
    删除了以下仅包含空值的列:
    totalamount, totalamountuom, cancelreason, comments_editedby, comments_canceledby, comments_date, secondaryordercategoryname.

三、Hops模块

  1. admissions
    修复了患者通过急诊入院时缺少 edregtime 和 edouttime 的问题。
  2. patients
    1. dod现在填充了来自州死亡记录的院外死亡。对于入住 ICU 的患者,这一变化已将死亡日期记录从 8,223 条增加到 23,844 条(即,2.0版本中另外有15621名ICU患者的院外死亡记录)。也就是说,2.0版本的mimic iv中有随访数据了!
    2. 2.0版本中患者纳入MIMIC中的机制有所不同。很大程度上优化了合并同一患者多个医疗记录号码的逻辑。由于此更改,大多数表的数据内容都发生了变化。大约有1%的stays受到了影响。
  3. transfers
    修复了hadm_id为NULL的 ED 患者(即只入ED没有入院的患者)的outtime问题。原先存在的问题导致transfers表中所有hadm_id为NULL的患者在院内停留时间是错误的。2.0版本中已经修正了outtime列的这个问题。
  4. labevents, d_labitems
    1. 更改了d_labitems表中的43项itemid。
    2. loinc_code列已被删除。将在官方git代码仓中协作开发,其初始值将来自医院系统。
      ③许多以前在comments字段中有值的实验室指标现在在value字段中也有值。
  5. microbiologyevents
    microbiologyevents表中增加了新的病原体、检验、标本和抗生素。
  6. omr
    omr是一个新添加的表。 此数据的来源是在线医疗记录,其中包含有个人健康状况的多种信息。从 v2.0 开始, omr 表具有以下信息:血压、身高、体重、BMI和估计肾小球滤过率 (eGFR)。这些值可从住院和门诊访问中获得,并且在许多情况下,患者住院前的“基线”值是可用的。
  7. prescriptions
    formulary_drug_cd列已添加回来(以前在MIMIC-III中有)。此列与 emar_detail表中product_code列具有相同的值。

http://chatgpt.dhexx.cn/article/wVi5DlsW.shtml

相关文章

第一章 数据库介绍

第一章 数据库介绍 文章目录 第一章 数据库介绍一、 数据库技术:1、数据(Data)2、数据库(Database,DB)3、数据库管理系统(DBMS)4、数据库系统(Database System,DBS) 二、数据库发展史:1、三个阶段:2、数据库系统优势: …

一、数据库介绍

1.1数据库概述 (1)什么是数据库(DataBase) 简言之,数据库就是储存数据的仓库,其本质为一个文件系统(二进制存储) (2)什么是数据库管理系统(DataBase Management System-DBMS) DBMS是一个软件&#x…

数据库概论 - 数据库的介绍

数据库相关基础概论 大家好,这次给大家带来的是我的新的专栏:数据库,数据库相对来说难度不是那么高,大家只要勤加练习、熟记语法,我相信学好数据库不是什么问题,博主会从0剖析,逐步讲解数据库的…

【数据库】SRA数据库介绍及数据下载

【数据库】SRA数据库介绍及数据下载 生信技术 2021-10-06 11:00 以下文章来源于生信Alpha ,作者BioinfoPenn 生信Alpha. 生物信息、生物统计、Linux系统、shell、R、Python等日常学习记录分享~欢迎交流指正~ 【数据库】SRA数据库介绍及数…

【MySQL】数据库介绍以及MySQL数据库

目录 数据库介绍 数据库概述 数据表 MySql数据库 MySql安装 登录MySQL数据库 ​​​​​​​SQLyog(MySQL图形化开发工具) 数据库介绍 数据库概述 什么是数据库(DB:DataBase) 数据库就是存储数据的仓库,其本质是一个文件系统&…

SQL——Mysql数据库介绍

声明:本栏目所使用的素材都是凯哥学堂VIP学员所写,学员有权匿名,对文章有最终解释权;凯哥学堂旨在促进VIP学员互相学习的基础上公开笔记。 MySQL: 介绍: 什么是数据库?就是一个软件&#xff…

数据库简介

文章目录 数据库简介前言一、数据库的基本概念二、常用数据库三、关系型数据库1.关系型数据库介绍2.关系型数据库小结 四、非关系型数据库1.非关系型数据库诞生的背景2.非关系型数据库小结3.非关系型数据库种类① 键值(Key-Value)存储数据库② 列存储&am…

数据库简介(初步了解数据库)

数据库介绍 1.1 数据库概念 数据库,就是存放数据的仓库 数据库(DataBase,简称DB)是⻓期存储在计算机内部有结构的、大量的、共享的数 据集合。 ⻓期存储:持久存储 有结构: 类型:数据库不…

美妆app如何脱离流量变现难题?

虽然我们看到抹茶美妆、美妆心得和美妆相机所走的路线有所差异,但是他们同属一种美妆app,那就是走内容电商的模式。尽管彼此之间的内容有所倾斜,但他们的目的都是想通过专业的引导来勾起消费者的购买欲望。但这一类美妆app存在几个比较致命的…

APP运营如何实现流量变现,获取更高收益?

在进行APP开发时,许多从业人员有着“等用户量大了,还愁收益问题吗”的心理。然而,当用户数量达到一定规模时,许多APP开发者开始担心流量实现的问题。甚至一些知名的APP也可能因缺乏有力的方法而陷入流量变现效果不理想的困境。下面…

小游戏流量变现瓶颈,新增长点是超级App?

2018年微信在其6.6.1版本中宣布支持小游戏,之后的几年,但凡能掀起各大社交平台上病毒式传播的,几乎都是小游戏。 小游戏玩法简单,传播机制简单,套路简单,连赚钱的本质也简单。就拿近期火爆的《羊了个羊》小…

应对流量损耗:提升APP广告变现效果的关键策略!

​引言: 在APP广告变现的过程中,流量损耗是一个常见的问题,它不可避免地会发生。尽管开发者可以在合理的范围内承受这种损耗,但如果出现大范围的损耗,那就意味着在广告变现过程中出现了一些问题,限制了开发…

App用户运营如何持续流量变现?

在行业现状中,看到的文章要么是流量获取,要么就是跟风内圈裂变和拉新,用户都看疲乏了。 在企业长期未来发展来看,最主要的要做好用户留存,这是至关重要的。产品的增长,不光是要看流量,而是要看…

APP的类型及流量变现策略

目前市面上的App大致分为以下几大类,社交、资讯、工具、短视频、直播、电商和游戏等。 01、社交、资讯类和短视频类APP 这类APP可以统一归为信息流类型,在这些APP上,用户滑动查看一条一条动态、文章、图片、视频等,往往也是用户…

APP流量变现超实用功能之AB测试,驱动媒体收益增长

对流量变现有高收益期望的开发者来说,一定离不开A/B测试。A/B测试能够帮助产品运营选取最佳策略,是验证变现策略最直观、准确的方法之一,所以A/B测试是APP流量变现策略优化过程中超实用的必备功能。 市面上大多数A/B测试功能只支持简单的渠道…

APP变现正确使用流量分组,挖掘更大变现收益

随着移动广告变现不断的深入发展,流量精细化运营的进一步提升,我们会发现不同流量在广告交易过程中的价值和收益也不同,很多开发者都已经意识到这一点,也希望能给自身流量做切分售卖,从而获得更大的变现收益&#xff0…

解析app流量商业化变现,ADCDN助力开发者变现双倍增长

现如今在app获客成本日益增加前提下,以商业价值驱动APP的快速成长和长远发展成为开发者首要任务。而广告变现已是目前app流量商业化变现主趋势,头部媒体已然走在行业前列,无论玩法、行业讯息都有各大厂商KA护航,中小开发者如何更好实现app广告变现,以下几点希望能对中小开…

Android 个人开发者如何接入广告SDK,实现app流量变现

接入广告的APP连接 大家可以下载看看(无需积分) 链接: https://download.csdn.net/download/qq_38355313/88063389 开屏广告示意图: 1.个人开发者如何添加广告SDK? 像大厂的广告SDK,比如穿山甲SDK,点广…

深挖App流量变现价值,“LTV”这个你不得不了解的关键因素

一、​什么是LTV LTV(lifetime value),即用户生命周期价值,LTV代表了用户完整生命周期内给企业创造的价值总额。LTV越高,App流量变现的价值越高,常用于衡量App广告变现收益能力。所以,LTV值是流量变现过程中的一个重要…