要点
问题机器学习算法可以用来治疗脑外伤患者根据其严重程度在运输之前?
发现在这个队列研究的2123名患者头部创伤,基于机器学习预测模型检测创伤性颅内出血的敏感性为74%,特异性为75%,仅使用病人的送往医院之前的信息。万博manbetx平台首页
意义这项研究表明,机器学习算法可以准确分层患者头部创伤严重程度在送往医院之前的设置,可以提高严重创伤性脑损伤患者的预后。
重要性一个适当的系统来进行头部外伤患者送往医院之前的设置和选择最佳的医疗机构对改善患者的预后至关重要。据我们所知,还没有建立分层方式这些患者根据他们的头部创伤严重程度,可以使用由救护人员受伤。
目标开发送往医院之前的分诊系统根据创伤严重程度分层头部外伤患者采用一些机器学习技术和评估这些技术的预测精度。
设计,设定和参与者这单中心回顾性队列研究是由连续检查的电子医疗记录病人运送到日本的东京医疗和牙科大学医院从4月1日,2018年,2021年3月31日。与心跳呼吸骤停患者年龄小于16年到来或大量缺失的数据被排除在外。
主要结果和措施基于机器学习预测模型来检测创伤性颅内出血了。模型的预测精度是评价与接收机操作曲线下的面积(ROC-AUC),精密召回曲线下的面积(PR-AUC)、敏感性,特异性和其他代表的统计数据。
结果共有2123名患者(1527名男性患者(71.9%);平均(SD)的年龄,57.6[19.8]年)与头部外伤都参加这项研究。发现创伤性颅内出血258例(12.2%)。几个机器学习算法中,极端的梯度增加(XGBoost)均值(SD) ROC-AUC最高(0.78 [0.02]),PR-AUC(0.46[0.01])交叉验证研究。在测试集,ROC-AUC为0.80,敏感性为74.0%(95%可信区间,59.7% -85.4%),特异性为74.9%(95%可信区间,70.2% -79.3%)。预测模型使用国家健康和保健研究所(NICE)的指导方针,这是计算与医生协商后,敏感性为72.0%(95%可信区间,57.5% -83.8%)和特异性为73.3%(95%可信区间,68.7% -77.7%)。McNemar检验法检验并没有发现显著差异XGBoost算法和敏感性、特异性好的指南(P=。80 andP=。55,respectively).
结论和意义在这个队列研究,预测模型取得了相对准确的性能检测创伤性颅内出血只使用简单的pretransportation来自病人的信息。万博manbetx平台首页与前瞻性多中心进一步验证数据集是必要的。
创伤性脑损伤(TBI)是神经外科常见的做法。每年全世界大约1000万到6900万人经历创伤性脑损伤,和创伤性脑损伤患者的数量正在增加。1- - - - - -3虽然大约70%到90%的创伤性脑损伤的病例是轻微的和需要既不承认也不神经外科干预,4中度或重度创伤性脑损伤可以成为死亡或严重残疾的主要原因。因为早期有效的治疗在创伤性脑损伤的急性期改善病人的结果,5重要的是要充分根据他们的创伤严重程度分层患者头部创伤。
为此,几种检查方法来识别提出了临床上重要的脑损伤患者,6- - - - - -8和众多的报告支持这些筛查工具的可靠性。9- - - - - -11然而,由于这些筛查工具是为医生的使用,开发他们不能用于分类。创伤性脑损伤患者的院前治疗是重要的,因为它消除了任何延迟治疗,减少病人医院之间运输的需要,并允许医疗系统的简化。然而,据我们所知,没有建立协议分层运输前现场创伤性脑损伤的患者。
近年来,研究临床事件使用机器学习算法一直积极进行预测,和更复杂的和可靠的分类方法已经成为可能。12- - - - - -20.刘等人21开发出一种机器学习分类系统,可以用于检测病人的伤害的严重程度使用基本的临床信息。万博manbetx平台首页因此,我们推测,机器学习方法甚至可能能够生成可靠的预测模型在使用现场收集的信息不足。万博manbetx平台首页
本研究的目的是创造一个患者的院前创伤性颅内出血患者分诊系统,能辨别从那些没有tICH (tICH)。通过使用几个具有代表性的机器学习算法,我们建立了预测模型的tICH头部创伤患者。我们验证了模型的预测性能在测试数据,通过应用这些模型,我们将这些模型与传统的筛选工具。
我们回顾了病人的电子病历运往日本的东京医疗和牙科大学医院为头部外伤从4月1日,2018年,2021年3月31日。基于这一回顾性研究,我们招收了2258名头部外伤患者接受头部电脑断层扫描(CT)。患者年龄小于16年(n = 83)与心肺骤停的紧急服务接触(n = 26)或缺失的数据超过2的特性(n = 26)被排除在外,留下2123例患者纳入分析(图1)。本研究机构审查委员会批准东京医疗和牙科大学批准免除病人同意,因为这是一个回顾性研究和所有数据被鉴定。本研究遵循透明报告个人的多变量预测模型预测或诊断(三脚架)报告指南。
预测结果存在tICH初始头部CT扫描结果,tICH被定义为外伤性蛛网膜下腔出血,急性硬脑膜下血肿,急性硬膜外血肿,脑挫伤或咨询的时间。影像学检查是双重检查放射学家和神经外科医生和放射科医生和紧急医学医生。
我们获得的数据从病人的电子病历在东京医疗和牙科大学医院和选择18岁以下特征作为解释变量,通常在日本收集的救护人员:病人的年龄、性别、收缩压、心率、体温、呼吸速率、意识状态(评估与格拉斯哥昏迷评分的眼睛组件22[E-GCS;eAppendix在补充)和定向障碍)、瞳孔异常(定义为瞳孔大小不等或双边瞳孔放大,光反射损失),高能量头部创伤(头部创伤的危险中定义的机制作为国家健康研究所和护理卓越[好]的指导方针;eAppendix在补充),23头部外伤疤痕,多个创伤(头部创伤和其他对身体创伤),创伤后癫痫发作、意识丧失、呕吐、半身不遂,和临床恶化,被称为“谈话和恶化,”24- - - - - -26这是在这项研究中定义为减少E-GCS 1分或更多在运输之前的网站。
缺失数据的体温和呼吸速率都充满了每个类别的总体平均值。患者缺失的数据除了体温和呼吸速率被排除在外。每个特性的值被规范化逻辑回归和支持向量机。
建立分类模型,我们使用5代表机器学习算法(例如,极端的梯度增加[XGBoost],随机森林,支持向量机(内核和径向基函数线性内核)和逻辑回归)作为预测基于模型的算法。
XGBoost算法是一种有效的实现梯度树增加,这是一个代表合奏基于决策树学习算法。27,28算法,弱学习者训练先后将残余的最后预测。此外,添加一个正则化项损失函数的结果在创建一个强大的学习者没有过度拟合。
随机森林29日,30.也是一个整体是基于决策树的分类器。算法,大量的弱学习者训练使用随机引导数据。每个弱学习者选票的预测结果,和大多数投票类是所有学习者采用的预测结果。
支持向量机是一种监督机器学习算法的二进制分类边界设置为从每个数据样本最大化利润。逻辑回归31日是使用最广泛的分类算法之一。它是用来计算的概率发生的二进制结果使用s形的函数。
构建基于这5个机器学习算法的分类模型,我们使用Python,版本3.6 (Python软件基金会)和几个Python模块(numpy、sklearn matplotlib,熊猫,和xgboost)。总之,我们使用eTable所示的值补充为每个hyperparameter的机器学习算法。其他参数,我们使用默认值。验证的分类模型和优化模型中的参数,我们执行一个5倍交叉验证。
我们用80%的数据训练分类模型通过5倍分层交叉验证。剩下的20%的数据被保留测试结果分类模型的预测能力。交叉验证的过程中,scikit-learn版本0.23.2 (scikit-learn开发人员)被用来实现一个网格搜索来获取最优hyperparameters。hyperparameters被调到最大限度的接收操作特性曲线下的面积(ROC-AUC)。训练的分类器模型计算二级概率(类的概率tICH和类的概率没有tICH)为每一个病人。我们使用了普拉特校准32,33从每个分类器校准类概率模型。
所示表1,我们的数据集是不平衡的相对罕见tICH患者头部受伤。因此,解决相关的问题不平衡的数据集,我们介绍了类权重修改损失函数;也就是说,在董等类似的方式,34我们分配高10倍的体重阳性病例(例tICH)比消极的案件(案件没有tICH)。
评估分类器模型的预测性能,我们计算6代表绩效评估措施,包括敏感性,特异性,阳性预测值(PPV),消极的预测价值,阳性似然比、阴性似然比。ROC-AUC和精密召回曲线下的面积(PR-AUC)也计算。回忆对应的灵敏度和精度PPV对应。公关曲线通常是使用ROC曲线及评估模型的性能,特别是在不平衡数据集。
使用R进行了统计分析,版本4.0.3统计计算(R组)。Mann-Whitney测试是用于分析非正态的分布的变量,和χ2测试选择分类数据的分析。比较每个模型之间的敏感性和特异性,McNemar检验法测试使用。所有P价值观从双向测试和结果被认为具有统计学意义P< . 05。Bonferroni调整多重比较测试的应用。
本研究对象包括2123名患者(1527名男性患者(71.9%);平均(SD)的年龄,57.6(19.8)年;年龄16 - 102岁),其中258(12.2%)被发现tICH。所有的病人被分为训练集(1702例,80.2%的数据)和一个测试组(421例,19.8%的数据)的随机分配被tICH分层。表1显示在每个组每个解释性的分解特性。两组之间没有统计上的显著差异被发现的任何功能。
图2显示的ROC曲线和公关5机器学习算法。在算法中,XGBoost达到最高的意思(SD) AUC的ROC曲线(0.78[0.02])和公关曲线(0.46 [0.01])。因此,我们选择XGBoost作为一个适当的算法开发患者分层的预测模型并进行了进一步分析的预测效度。
分类tICH患者,我们构建了一个基于XGBoost算法的分类器模型与所有18个这个模型特性和命名为“所有元素模型。“这个模型实现了意味着(SD) ROC-AUC 0.78(0.02),平均(SD) PR-AUC 0.46(0.01)的交叉验证(eFigure 1补充)和一个ROC-AUC PR-AUC 0.80和0.51的测试集(图3;eFigure 2补充)。测试设备的校准图所示图3。
量化的协会18特性结果,我们执行一个分析所有元素的特征模型的重要性。如eFigure 3所示补充18个特征中,5个变量(定向障碍、高能头部创伤、头部外伤疤痕,E-GCS,和瞳孔异常)可能与获取准确的预测。
基于这一特性重要性分析的结果和简化分类模型,我们选择了5个最重要的功能(定向障碍、高能头部创伤、头部外伤疤痕,E-GCS,和瞳孔异常)和建造另一个分类模型(命名为“5元素模型”)选择功能。5元素模型显示平均(SD) ROC-AUC 0.74(0.03)的交叉验证研究(eFigure 1补充测试组)和0.74 (图3)。
表2显示了每个模型的代表获得的统计数据比较:所有元素模型,5元素模型和CT扫描的好指导的建议。不错的指导方针的敏感性和特异性分别为72.0%(95%可信区间,57.5% - -83.8%)和73.3%(95%可信区间,68.7% -77.7%),分别和所有元素的模型分别为74.0%(95%可信区间,59.7% - -85.4%)和74.9%(95%可信区间,70.2% -79.3%),分别为。这个模型没有统计上显著的差异和不错的指南使用McNemar检验法测试(P=。80 andP=。55,respectively). The McNemar test was also conducted for the NICE guidelines and the 5-elements model. The sensitivity was 74.0% (95% CI, 59.7%-85.4%), and the specificity was 70.1% (95% CI, 65.1%-74.7%), and there were no statistically significant differences between them (P=。81andP=。22,respectively).
本研究的目的是建立一个基于机器学习分类系统,该系统可以检测tICH头部受伤患者使用收集的信息,可以现场救护人员创伤为每个病人选择最优的医疗机构。万博manbetx平台首页在几个机器学习算法,XGBoost显示一个相对更好的预测性能。XGBoost模型与所有可用的功能是能够预测tICH的敏感性为74.0%,特异性为74.9%,和一个ROC-AUC 0.80。此外,一个功能重要性分析显示,5特性(如定向障碍、E-GCS、高能头部外伤,头部创伤疤痕,和瞳孔异常)可能会被关联到一个精确的预测。另一个模型只使用这五个特性表现出相对准确的预测,敏感性为74.0%,特异性为70.1%,和一个ROC-AUC 0.74。
头部外伤患者的当前流程如下:(1)救护人员判断病人的创伤的严重性,决定到哪里就医;(2)运输后,医师评估CT扫描通过体检的必要性;(3)病人进行CT扫描,可以运输到另一个医院。虽然已经tICH筛选工具(比如好的指南)是有用的在步骤2中,我们的知识没有妥善分流病人在步骤1中建立方法。脑损伤患者的功能结果恶化时交通延迟,5在步骤3中运输时间应该减少构建一个可靠的诊断工具。一般来说,患者的创伤性脑损伤的严重程度分类根据他们的GCS评分。35然而,GCS评分是不可靠的,因为它很容易受到环境问题的影响,如酒精或药物的摄入,它倾向于低估患者的严重创伤性脑损伤,因为质量颅内病变不立即影响患者的颅内状态,特别是老年患者。36后大街等37试图检测颅内压力升高GCS评分的结合,学生反应,和库欣三合会(心动过缓,不规则的呼吸模式,和高血压),但灵敏度和ROC-AUC相对较低(分别为36.8%和0.65)。我们添加了挤压严重,头部创伤疤痕,和神经系统发现,麻痹性痴呆和癫痫等(这很容易可收集的现场救护人员),这些特性来获得一个新的模型。这些额外的功能,结合机器学习技术,使我们能够达到更准确的预测模型与之前的模型相比。
之一,将人工智能技术应用于临床实践的主要优势是,它可以替代部分,如果不完全,供医生评估。38在我们的调查中,我们使用好的指导方针的CT扫描推荐标准的表示医生的评估和比较其筛选性能与我们目前的模型。结果,XGBoost模型实现了预测准确性一样好不错的指导方针(表2)。似乎,敏感性计算在我们的测试集是不如传统的工具,如加拿大CT头规则调查团(CCHR)6和新奥尔良标准(NOC),7据报道,近100%。这一发现可能存在几个可能的原因。调查团第一,CCHR和NOC排除轻微头部外伤患者没有意识丧失,失忆,或混乱,这将导致增加灵敏度。第二,结果将是临床上重要的脑损伤,其中不包括小tICHs。Svensson等在一份报告中,39筛选的结果设置为所有tICHs,敏感性和特异性,分别87.1%和35.7%调查团的CCHR, NOC的97.1%和3.4%,75.7%和58.0%的不错的指导方针。考虑到平衡的敏感性和特异性ROC曲线(图3),我们的机器学习模型的性能被认为是这些筛选工具。所示的测试组的评价结果表2也支持这一假设。在我们的模型中,PPV,不平衡的另一个重要统计数据,也比较不错的指导方针。虽然改善分类精度一直期望在急诊医学领域,40- - - - - -42我们目前预测模型可能会允许紧急救援人员,不是专业医生,诊断以及医生,即使不完整的数据。此外,而传统工具输出只二进制结果和产生一个敏感性,特异性,PPV和价值,我们的模型可以产生不同的敏感性,特异性,PPV和价值观通过改变截断值适应形势需要,这是我们的模型的另一种力量。
有关分析方法,而先前的筛查工具使用逻辑回归,建立了基于线性分离,决策树可以在每个变量设置超过1边界,可以做到对对象进行分类与更多的复杂性。虽然复杂的分类算法倾向于只overfit训练数据,不会在测试数据表现良好,整体学习几个方法,如随机森林和梯度增加,可以提高预测的准确性,防止过度拟合。43,44在我们的研究中,XGBoost作为一种先进的基于树的梯度提升算法,允许我们实现一个可接受的预测性能。我们当前的模型可以在GitHub的网站。45在未来,经过适当的验证与前瞻性群组研究,我们的模型可以转换为web或智能手机应用程序的救护人员计算病人的风险。
我们的研究有一些局限性。第一,因为这是一个单中心研究只包括病人住院,接受CT,我们的数据集可能不代表普通人群的头部创伤患者。此外,我们表明,我们的模型可能低估了高危患者,根据校准阴谋。我们的模型应用于临床实践,我们应该验证预测精度通过一组潜在外部验证和研究最优截断值。
第二,GCS不是用来评估患者的意识状态,因为它不是通常记录在日本紧急医疗系统。相反,日本昏迷评分46被广泛用于获取患者的意识状态。因为日本昏迷评分可以翻译E-GCS和定向障碍,我们的模型采用这两个项目的特性。这些变量可能会比GCS本身不准确,和预测的结果可能是退化。
机器学习算法取得了良好的性能和常规筛查工具检测tICH。尽管常规筛查工具需要医生检查的,我们建议的模型只需要pretransportation患者信息,这可以很容易地获得。万博manbetx平台首页结果表明,我们提出的预测模型可用于构建一个分类系统,可以用来评估患者的最佳机构头部受伤应该是运输。需要进一步的验证与潜在和多中心数据集。
发表:2022年4月24日。
发表:2022年6月10日。doi:10.1001 / jamanetworkopen.2022.16393
开放:这是一个开放的分布式根据文章CC-BY许可证。安倍©2022 D等。狗万体育下载地址《美国医学会杂志》网络开放。
通讯作者:题材Inaji,医学博士,神经外科,东京医疗和牙科大学1-5-45 Yushima, Bunkyo-ku,东京,日本inamnsrg@tmd.ac.jp)。
作者的贡献:Drs安和Inaji完全访问所有的数据研究,负责数据的完整性和数据分析的准确性。
概念和设计:安倍、Inaji Otomo,前原诚司。
数据的采集、分析或解释:安倍、Inaji哈泽,高桥,酒井法子,Ayabe,田中。
起草的手稿:安倍、Inaji酒井法子,前原诚司。
关键的修订手稿的重要知识内容:安倍、Inaji哈泽,高桥、Ayabe田中,Otomo,前原诚司。
统计分析:安倍,哈泽,田中。
行政、技术或材料支持:哈泽,酒井法子。
监督:田中,Otomo,前原诚司。
利益冲突的披露:没有报道。
27。
Tianqi C,Guestrin C。XGBoost:一个可伸缩的树增强系统。B: Krishnapuram,艾德。22 ACM SIGKDD学报》国际会议上知识发现和数据挖掘。计算机协会;2016:785 - 794。
30.
Biau G。随机森林模型的分析。
J机器学习Res。2012;13:1063 - 1095。
谷歌学术搜索
32。
普拉特J。SV机器的概率。:Smola AJ, Bartlett PL, Scholkopf B,舒尔曼D, eds。先进的分类器。麻省理工学院出版社;2000:61 - 74。
33。
Niculescu-Mizil, Caruana R。预测与监督学习良好的概率。:Džeroski, Raedt LD,“, eds。美国22日国际会议上机器学习。计算机协会;2005:625 - 632。
34。
王董X, Rashidian,,等。基于机器学习的阿片类药物过量使用电子健康记录预测。
宗旨为协会Proc。2020;2019:389 - 398。
PubMed
谷歌学术搜索
46岁。
太T, Waga年代翰达岛W,斋藤我,竹内K。新的无序意识水平分级(作者transl)。文章在日本。
没有Shinkei Geka。1974;2 (9):623 - 627。
PubMed
谷歌学术搜索