要点
问题增加术中连续数据定期收集围手术期后数据与改进的基于机器学习相关死亡率预测心脏搭桥和阀操作吗?
发现9415年这个预后研究病人第一次心脏手术,基于机器学习的预测死亡率使用术前,术中,术后数据与改进的性能无关或基于术后的临床效用模型数据。术后标记与代谢功能障碍和肾功能下降是导致死亡率的主要因素。
意义这些发现表明,有不清楚价值增加连续,高维术中血流动力学和温度数据机器学习模型,使用相对容易获得,有限接受心脏手术的患者术后的数据预测死亡率。
重要性各种各样的围手术期危险因素与术后死亡风险有关。然而,定期收集术中临床参数的相对贡献短期和长期死亡率仍可以理解。
客观的检查多个机器学习模型的性能与数据从不同的围手术期期预测30天,1年和5年死亡率和调查因素导致这些预测。
设计,设定和参与者在这个预后研究中使用前瞻性地收集数据,风险预测模型开发的短期和长期的心脏手术后的死亡率。包括参与者成人患者首次阀操作,冠状动脉旁路移植,或两者的结合1997年和2017年之间在一个中心,荷兰格罗宁根大学医学中心。2017年11月取得了死亡率数据。数据分析发生在2020年2月和2021年8月之间。
曝光心脏手术。
主要结果和措施术后30天死亡率,1年和5年的主要结果。接受者操作特征曲线下的面积(AUROC)被用来评估歧视。的贡献所有术前,术中血流动力学和温度,和术后死亡率调查因素利用夏普利添加剂解释(世鹏科技电子)值。
结果数据从9415年接受心脏手术的患者(平均年龄(差),68(60 - 74)年;包括2554名(27.1%)妇女)。总体死亡率在30天、1年和5年的268例(2.8%),420名患者(4.5%)、612例(6.5%),分别为。模型包括术前、术中及术后数据实现AUROC值为0.82 (95% CI, 0.78 - -0.86), 0.81(95%可信区间,0.77 - -0.85),和0.80 (95% CI, 0.75 - -0.84) 30天,1年和5年死亡率分别。模型只包括术后数据同样执行(30天:0.78 (95% CI, 0.73 - -0.82);1年:0.79 (95% CI, 0.74 - -0.83);5年:0.77 (95% CI, 0.73 - -0.82))。然而,模型基于所有围手术期提供减少临床可用的数据预测,较低的检出率;例如,术后模型确定高危人群,5年死亡率的风险增加2.8倍(4.1 (95% CI, 3.3 - -5.1))和增加为11.3 (95% CI, 6.8 - -18.7)完整的围手术期模型发现的高危人群。术后标记与代谢功能障碍和肾功能下降是导致死亡率的主要因素。
结论和意义本研究发现,连续的术中术后血流动力学和温度数据的数据并不是与改进的基于机器学习识别患者短期和长期的风险增加心脏手术后的死亡率。
术后死亡风险与几个术前,术中,术后因素,与年龄、并发症,术前肾功能下降与风险增加相关的因素。1- - - - - -6目前的术前危险分层方法,如欧洲心脏手术风险评估系统(EuroSCORE) II7和美国社会心胸外科得分,8,9因此使用这些术前变量来预测短期风险。在术后因素,急性肾损伤(AKI)是1的最佳特征因素与风险相关的死亡率在冠状动脉旁路移植(CABG)和阀门操作。1,10然而,定期收集的有用性和更复杂的术中及术后肾功能以外的临床参数来预测短期,特别是长期死亡率仍可以理解。
机器学习(ML)模型可以处理和使用大量的数据收集之前,期间和之后的手术。事实上,越来越多的ML模型使用术前已发表的数据和预测死亡率和心脏手术后并发症更准确地比传统风险评分。11- - - - - -14同样的,我们之前发现,术后定期收集数据与改善长期死亡率的预测相比,传统的统计分析。5,15然而,毫升模型是动态的最有前途的由于他们的能力和生产预测基于整个围手术期处理的数据在不同的阶段(术前,术中,术后),所有这些不同的数据类型和密度。尤其是术中阶段,产生大量的连续数据,如时间序列的血流动力学、温度、心肺分流术(CPB)灌注测量,需要不同的建模比其他围手术期数据。2021年的一项研究16和2019年的一项研究17发现使用介入和术中连续数据或聚合术中数据与改善心脏手术后30天的术后死亡率的预测。然而,目前尚不清楚结合术前,术中,术后相关数据提高了短期和长期死亡率的预测。
在这项研究中,我们开发了一个ML算法结合长期短期记忆(LSTM)神经网络建模12定期收集术中血流动力学和温度变量。此外,我们开发了一个gradient-boosted分类器预测短期和长期死亡率大量前瞻性单中心注册表收集的患者接受心脏手术围手术期的数据。我们分析预测的结果和临床效用相关的术中数据模型预测30天,1年和5年死亡率和研究因素与功能重要性这些预测分析。
格罗宁根大学医学中心的医学伦理委员会授予这个预后研究豁免审查根据荷兰法律,因为研究收集的数据作为标准治疗的一部分,而不需要额外的测量不需要伦理审查委员会的批准。从所有的病人同意之前获得的数据收集。本研究遵循透明报告个人的多变量预测模型预测或诊断(三脚架)预后研究报告指南。
电子心胸麻醉学注册(卡罗拉)由围手术期数据的前瞻性群组从我们的三级中心接受心脏手术的患者在1997年和2017年之间在荷兰格罗宁根大学医学中心。死亡率数据从荷兰获得市级人事档案数据库,包括真实的和可靠的数据的所有公民在荷兰2017年11月获得。
数据由13 944名患者,其中9415名接受了首次CPB-assisted选择性阀操作或CABG或两者的结合。主要结果30天、1年和5年死亡率。次要结果与结果变量的贡献决定利用夏普利添加剂(世鹏科技电子)分析解释。
定期收集病人的术前数据集包括特征和实验室变量记录手术前卡罗拉。除了一个明确界定在EuroSCORE病人包括在过去10到12年,患者包括早些时候(由于使用EuroSCORE二世和我),收集的数据并没有值得注意的变化。术中血流动力学的数据包括连续监测时间序列,温度,心脏每分钟的数据聚合。术后数据由实验室值记录日常参与期间至少一次。
占一个变量模式术前对缺失的数据,我们术前实验室分离变量分为两类(即测量不到24小时或超过24小时手术前)和聚合的意思。多元功能归责是用于术前缺失值,使用自定义阈值为每个变量的定义。18这导致一组20静态术前变量。
对于术中数据,包括12持续的监控变量。对所有变量,可接受阈值定义过滤掉工件,和滚动意味着计算。插值和向后和向前传播用于缺失值。鉴于登记每个术中变量在不同的时间点开始,我们定义了3个不同的术中时期(之前、期间和之后CPB)。鼻咽、直肠和皮肤温度数据都记录只在旁路,和一些变量被认为只有灌注期间但不是因为之前和之后的信号扰动引起的心肺机。患者的手术期间由于注册构件(例如,手术时间> 1440分钟)被排除在外。
最后,术后数据被分为6个时期(前6小时和小时6 - 12,12 - 24,24 - 48,48 - 72和72 - 96年)。如果超过1实验室每时间变量值存在,这些度量值的平均值。分析包括91名术后变量。
递归神经网络预测算法包括LSTM架构。神经网络术前和术中处理数据,然后输出其个人隐状态gradient-boosted算法,结合术后与术前和术中。
递归神经网络是一类神经网络反馈循环,正越来越多地用于时间序列处理在麻醉学,手术和重症监护。17,19- - - - - -21特别是LSTM复发性神经网络最优模型顺序输入由于他们的反馈循环,创建一个内存之前的输入和存储这些处于隐藏状态,使网络学习的长期依赖。22- - - - - -24信息的流动是由输入盖茨,万博manbetx平台首页控制信息从输入;忘了盖茨,确定具体的重量数据反馈回路;盖茨和输出,确定发送给其他单位。梯度增强是一种广泛使用的技术在ML回归和分类损失函数的优化顺序,结合弱学习者(通常是决策树)生成一个添加剂、梯度下降法模型与越来越多的更好的性能。25极端的梯度提升机(XGBoost)是一个可伸缩的决策树算法提高算法越来越重很难预测事件使用k倍交叉验证。我们先前表明,这个算法执行在长期冠状动脉绕道手术死亡率的预测。5,26
进行这种分析,我们建立了管道所示图1。通过术前数据LSTM完全围手术期模型,静态术前功能首先处理主成分分析来降低数据的维数。27这些数据随后与术中数据和通过合并在一起的第一个隐层LSTM。这样做是为了确保静态数据不会污染术中序列。接下来,术中病人的条件的获得表示在不同的时间点,训练LSTM预测隐藏状态在随后LSTM细胞。这些隐藏状态表示结合术后连续数据和XGBoost分类器,通过训练10倍交叉验证,产生最终的预测。这一步中,需要类似于术前数据的主成分分析,由于不同维度之间的高频低频术前和术中、术后的数据。模型只包括术前或术后数据,或组合,只有XGBoost使用。
确定相关因素以及它们如何有助于预测是一个重要的步骤来评估临床有针对性的干预措施。28测试单个因素分析导致死亡或生存预测,世鹏科技电子算法应用于gradient-boosted模型。沙普利值是广泛使用的指标在合作博弈理论中,毫升的上下文中,他们帮助评估任何特定功能的贡献实际和平均预测之间的区别。28,29日特性计算贡献的期望值的变化时模型的输出给定特性观察和当它是未知的。28这些值可以量化和图形表示。在这项研究中,图形表示为红色表示变量的贡献对死亡率,而变量代表用蓝色表示对生存的贡献。
模型hyperparameters调谐使用网格搜索在训练数据的80%。剩下的20%的测试集是用于验证和计算性能结果(eTable 1的补充)。
我们7的性能评估模型生成的研究:从(1)术前那些使用数据,(2)术中,术后(3),(4)术前和术中,(5)术中及术后,(6)术前和术后,(7)术前,术中,术后(即全围手术期)。性能评估使用接收器算子特性曲线下的面积(AUROC),敏感性、特异性、正面和负面预测值也报道。30.模型之间的性能差异进行评估与德龙AUROC差的非参数检验。31日评估的潜在临床意义的预测,我们绘制predictiveness曲线显示死亡率的风险分数的分布在每个后续时间。病人被归类为高或低死亡率的风险根据风险来源于predictiveness分布曲线。32相对风险计算的比例绝对风险两组之间的死亡率。实际观察到的死亡率策划对死亡率的预测概率的测试集探索校准的质量,这是视觉评估。33,34所有指标都报道有95% CIs, 2-tailed测试被认为是具有统计学意义P< . 05。所有进行了分析使用scikit-learn模块版本0.22.1 Python编程语言版本3.9.5 (Python软件基金会)和发生在2020年2月和2021年8月之间。35
在9415例(年龄中值(差),68(60 - 74)年;2554名(27.1%)妇女)包括在分析中,5547名患者接受CABG(58.9%), 2535名患者接受了孤独的瓣膜手术(26.9%),和1333名患者接受了组合阀和冠状动脉手术(14.2%)。整体死亡率在30天、1年和5年的268例(2.8%),420名患者(4.5%)、612例(6.5%),分别为。瓣膜手术的死亡率最高,其次是结合和CABG手术(eFigure 1补充)。的患者基线特征提出了分层的生存状态表1和eTable 2补充。
模型性能报告图2。使用专门术前数据模型实现AUROC值为0.70 (95% CI, 0.61 - -0.71), 0.66(95%可信区间,0.61 - -0.71),和0.69 (95% CI, 0.64 - -0.74) 30天,1年和5年死亡率分别。模型包括术前和术中数据或术中数据表现不佳,AUROC值在3死亡率结果从0.44(95%可信区间,95% CI, 0.37 - -0.49)使用术前和术中数据为1年死亡率为0.58 (95% CI, 0.51 - -0.64) 30天死亡率使用interoperative数据(eTables 3、4和5补充)。其他模型结合术前或术中及术后数据表现的更好,实现AUROC值从0.75 (95% CI, 0.70 - -0.80)使用术前和术后30天死亡率数据,例如,为0.79 (95% CI, 0.74 - -0.84)使用术中及术后1年死亡率数据。AUROC postoperative-only模型值分别为0.78 (95% CI 0.73 - -0.82), 0.79(95%可信区间,0.74 - -0.83),和0.77 (95% CI, 0.73 - -0.82) 30天,1年和5年死亡率分别。完全围手术期的模型只使用术后AUROC值高于模型数据,尽管这些差异没有统计学意义,AUROC值为0.82 (95% CI, 0.78 - -0.86), 0.81(95%可信区间,0.77 - -0.85),和0.80 (95% CI, 0.75 - -0.84) 30天,1年和5年死亡率分别。在视觉评估校准曲线,完全围手术期及术后模型的校准(eFigures 2、3和4补充)。
我们使用predictiveness块和分类评估病人的风险概率的分布(eFigures 5和6补充)。验证组的1883名患者,围手术期模型分类375例(19.9%),268名患者(14.2%)和280例(14.9%)为30天的高风险,1年和5年死亡率分别。对于仅使用术后数据的模型,254名患者(13.5%)、266例(13.1%),和54个病人(2.9%)被列为高风险为30天,1年和5年死亡率分别。这些模型在识别患者表现同样不生存在30天,1年(表2)。5年死亡率,完全围手术期模型比术后取得更好的分层模型,敏感性为50.0%(95%可信区间,41.2% -58.3%)和18.7%(95%可信区间,12.4% -25.4%),增加了31.3%。然而,术后模型错误分类只有1.7%的人在5年(特异性,98.3%(95%可信区间,97.7% - -99.0%))(表2)。所有模型的阴性预测值都大于94%。阳性预测值(ppv) postoperative-only模型的30天死亡率高于围手术期模型(28.0%(95%可信区间,22.6% - -33.6%)和19.7%(95%可信区间,15.6% - -23.8%);增长8.3%)和5年死亡率(46.3%(95%可信区间,32.8% - -60.0%)和23.9%(95%可信区间,18.7% - -29.1%);增加22.4%),后者系统分类更多的个人风险很高(表2)。
患者全围手术期模型归类为高风险的3.5倍(95% CI, 2.9倍4.1倍),4.7倍(95% CI, 3.8倍5.8倍),和4.1倍(95% CI, 3.3倍5.1倍)相对风险增加为30天,1年和5年死亡率分别。对于术后模型,被归类为高风险的4.6倍(95% CI, 3.7倍5.7倍),4.1倍(95% CI, 3.3倍5.1倍),和11.3倍(95%可信区间,7 - 18.7)风险增加为30天,1年和5年死亡率分别。
变量的贡献表现最好的预测模型提出了手术的死亡率的结果和类型图3和eFigures 7、8和9的补充。术中参数由LSTM没有贡献的隐藏状态预测模型。30天,一年,五年,十大特性导致预测主要包括术后变量,尤其是与代谢功能障碍和肾功能下降相关的标记(图3)。高意味着乳酸脱氢酶(LDH)和尿素水平在前4术后天,血小板48小时手术后导致更高的预测nonsurvival 30天(图3逆协会)。对葡萄糖被认为在不同的时间点。长期死亡率预测,高意味着LDH和尿素水平在不同时间点导致nonsurvival预测(图3B和C)。
在这预后研究中,我们评估结果和临床效用与术中数据的添加毫升模型预测短期和长期死亡率接受心脏手术的患者。我们的主要结论是,连续的术中术后数据数据并不与改进的模型性能相关的或多个临床可用的预测。此外,术后标记与代谢功能障碍和肾功能下降的主要贡献者是短期和长期死亡率风险。
毫升模型预测心脏手术后的死亡率仍然不足,大多数研究侧重于短期术后死亡率。这项研究增加了有限但新兴文学和是,据我们所知,第一项研究用毫升同时使用术前预测短期和长期死亡率,术中,术后的数据。研究从2019年到2021年16,17,36使用ML算法预测30天死亡率AUROC值大于0.80和报道,结合术前和术中数据与改善死亡率和阿基预测。当我们表现最好的模型显示类似的歧视,缺乏显著改善的术中数据是意想不到的。一个可能的解释这些结果的本质在于术中连续数据。而现代术中血流动力学和温度监测可以将这些数据可靠地测量并存储,它还有助于它们被麻醉医师严格监管和优化。因此,术中数据事件和干预措施,如输血和血液动力学的药物管理,可以更好地反映实际的接受心脏手术的患者术中血流动力学状态。的确,输血和长时间的术中低血压与另一个相关联,可以预测术后的结果。16,37- - - - - -39相反,一些荟萃分析和随机临床试验40- - - - - -42没有发现组间临床发病率和死亡率的差异与不同的心脏和非心脏手术围手术期血压目标人群,进一步带来质疑死亡率预测建模血流动力学数据的价值。这些发现表明,需要更多的研究来优化术中数据建模时将数据从整个围手术期处理和这些模型的潜在临床效用最大化。
毫升的模型的另一个挑战在优化临床实用程序驻留在平衡真实和假阳性在特定临床设置。在心脏手术人群中,死亡率相对较低,它可能是可取的PPV为高灵敏度和目标模型。这可以帮助确保病人在出院前更大的风险识别,不过度增加临床负担考虑到病人的比例风险是固有的低。虽然我们推测,术中包含的日期会在这一领域与改进,30天的敏感性和ppv的围手术期和postoperative-only模型具有可比性。
与术前因素,术中及术后早期死亡率预测因素没有完善的重要性。在之前的研究中,5我们确定了高术后尿素5年术后死亡率的因素更大贡献。这可能是由于尿素的变化反映multiorgan病理学或线粒体功能障碍引起的缺血再灌注和系统性炎症反应与心脏和手术创伤有关。43,44在这项研究中,高LDH、尿素和肌酐值在第一次术后天有大贡献为30天死亡率和1年的结果。如尿素,LDH与心脏损伤缺氧,加速有氧代谢,和长时间的节律异常,如在灌注心室纤维性颤动。45- - - - - -47检查肌酸酐,2021年回顾潜在类别分析48发现多达12可再生的阿基类基于血清肌酐轨迹在冠状动脉绕道手术患者表型;这些类,4有一个糟糕的结果的风险更高。
我们发现术后的优势因素导致死亡率的主要因素之一,与基线因素,如年龄和术中参数。这些结果支持2012年的一项研究的发现9术后的因素,如dialysis-dependent肾衰竭或胰岛素依赖型糖尿病的发展,都充分更大贡献死亡率预测两年后与术前相比因素。
本研究也有一些局限性。因为这是一项单中心研究,我们的研究结果需要确认由外部验证,理想情况下。她们在一次前瞻性多中心设置。此外,我们应用多元功能归罪为失踪的术前和术后的价值观和使用自定义阈值来减轻术中数据建模结果与缺失的数据。然而,它不能被排除在外,这可能导致一些偏见,特别是对术后时间序列数据。另外,正如前面所讨论的那样,我们限制了术中血流动力学数据,温度,和心脏,不包括介入数据,如输血或使用inotropes或胰岛素。在这项研究中使用的代码是网上,49我们鼓励进一步的复制和验证算法和本研究的发现在其他群,以及添加新的术前和术中数据类型分析。
在这个预后研究中,我们比较所有3毫升的性能模型与数据围手术期期预测30天,心脏手术后1年,5年死亡率,调查这些预测因素。我们发现,包括术前,术中,术后的数据与改善临床效用无关毫升为短期和长期预测模型。术后标记与代谢功能障碍和肾功能降低死亡风险的主要贡献者,虽然需要进一步的研究来探索可能解释这个的生理过程。
发表:2022年9月7日。
发表:2022年10月26日。doi:10.1001 / jamanetworkopen.2022.37970
开放:这是一个开放的分布式根据文章CC-BY许可证。©2022 Castela福特J et al。狗万体育下载地址《美国医学会杂志》网络开放。
通讯作者:何塞Castela的强项,二元同步通信,制药和临床药理学,格罗宁根大学医学中心,格罗宁根大学Hanzeplein 1,阿宝30.001箱,9700 RB格罗宁根,荷兰(j.n.alves.castela.cardoso.forte@umcg.nl)。
作者的贡献:Castela福特先生和Yeshmagambetova女士有完全访问所有的数据的研究,负责数据的完整性和数据分析的准确性。
概念和设计:Castela的强项,范德Grinten Epema亨宁。
数据的采集、分析或解释:Yeshmagambetova Castela的强项,van der Grinten,舍Nijsten,马里安尼,Epema。
起草的手稿:Yeshmagambetova Castela的强项,van der Grinten,韩宁,Epema。
关键的修订手稿的重要知识内容:Scheeren Nijsten,马里安尼,Epema。
统计分析:Yeshmagambetova、范德Grinten Epema。
监督:亨宁·舍Nijsten, Epema。
利益冲突的披露:舍林博士报道接受赠款和Masimo爱德华生命科学公司外的格罗宁根大学提交的工作。博士马里安尼报告收到,爱德华生命科学公司授予Atricure, Getinge,雅培在提交工作。没有其他信息披露报告。
额外的贡献:作者想把这份出版物的记忆马可水坝博士于2021年9月11日去世。我们感谢他的热情和支持在这和之前的研究项目,最终出版。
15。
马Castela福特J,水坝,Bouma HR, Geus F, Epema啊。预测长期死亡率在冠状动脉旁路移植术后第一周数据使用机器学习模型。
Proc马赫学习Res。2017;68:39-58。
谷歌学术搜索
24。
J的蒙古包FA, Schraudolph NN,。施密德胡贝尔表示。学习准确的时机与LSTM复发性网络。
J马赫学习Res。2002;3:115 - 143。
谷歌学术搜索
35。
Pedregosa F,Varoquaux克、Gramfort,蒂里翁米歇尔•V。在Python Scikit-learn:机器学习。
J马赫学习Res。2011;12:2825 - 2830。
谷歌学术搜索
46岁。
明顿J, Sidebotham DA。Hyperlactatemia和心脏手术。
J额外Corpor抛光工艺。2017;49 (1):7 - 15。
PubMed
谷歌学术搜索