要点
问题可以机器学习模型在图像分割任务实现临床可接受的精度在放疗计划和降低整体轮廓线的时间吗?
发现这个质量改进研究一套242头部和颈部和519盆腔ct扫描获得的放疗计划在8个不同的临床基地与异类人群和图像采集设置。该技术实现在interexpert变异性水平的准确性;统计协议是观察13 15结构同时减少注释时间平均93%的扫描。
意义广泛采用的研究结果强调机会autosegmentation在放疗工作流模型降低整体轮廓和规划时间。
重要性个性化的放疗计划取决于高质量的界定目标肿瘤和周围器官的风险(浆)。这一过程把额外的时间负担肿瘤学家和介绍了可变性专家和机构。
客观的探索临床可接受autocontouring解决方案,可以集成到现有的工作流程和在不同的域中使用的放射治疗。
设计,设定和参与者这个质量改进研究使用了一个多通道成像数据集包括519盆腔和242头和颈部计算机断层扫描(CT)扫描从8不同临床基地和病人诊断与前列腺癌或头部和颈部癌症。扫描获得的治疗剂量从患者接受调强放疗计划2013年10月至2020年2月。15个不同的桨被专家读者和放射肿瘤学家手工注释。模型的训练数据集的一个子集自动描绘桨和评估内部和外部数据集。数据分析是2019年10月到2020年9月进行的。
主要结果和措施autocontouring解决方案正在评估外部数据集,及其与体积的准确性是量化协议和表面距离的措施。模型以专家注释为基准的interobserver可变性(IOV)研究。临床效用评估通过测量时间从头手动修正和注释。
结果共有519名参与者(519(100%)人;390年[75%]62 - 75岁)盆腔CT图像和242参与者(184(76%)人;194(80%)50 - 73岁)包括头部和颈部CT图像。模型实现临床水平精度的范围内专家IOV 13 15结构(例如,左股骨,κ= 0.982;脑干,κ= 0.806)和表现一直好内部和外部的数据集(例如,平均得分(SD)骰子左股骨,内部和外部数据集:98.52%(0.50)和98.04% (1.02);P= .04点)。自动生成轮廓校正时间的头部和颈部10日和10前列腺扫描测量的意思是4.98 (95% CI, 4.44 - -5.52)分钟/扫描和3.40 (95% CI, 1.60 - -5.20)分钟/扫描,分别以确保临床接受精度。手动分割的头部和颈部的意思是86.75 (95% CI, 75.21 - -92.29)分钟/扫描专家读者为73.25 (95% CI, 68.68 - -77.82)分钟/扫描放射肿瘤学家。自动生成轮廓代表时间减少了93%。
结论和意义在这项研究中,模型达到水平的临床专家IOV同时减少手工仿形时间内精度和执行持续在前所未有的异构数据集。开源库的可用性和性能可靠,这就产生了明显的放射治疗规划的转型的机会。
每年有超过一百万的病人被诊断为癌症,接受放疗单独或结合手术。1,2调强放射治疗已成为当代癌症治疗的重要组成部分,因为treatment-induced毒性降低,40%的成功治愈患者接受某种形式的治疗。3匹配一个病人放射治疗计划的个性化发展独特的肿瘤和器官的解剖配置风险(桨)是一个多步骤的过程从横断面图像的采集和相关解剖卷的分割在图像通过辐射剂量计算和后续的交付病人。
图像的分割是一个重要的病原因素在这个处理工作流。目前,这个任务是手动执行的肿瘤学家使用专门设计的软件画轮廓周围感兴趣的区域。当任务需要相当的临床判断,还费力和重复性,波状外形的卷需要建造一片一片整个横断面卷。因此,这是一个非常耗时的过程,通常每个病人花了几个小时。4它可以创建工作流,延迟可能不利于病人的结果,但它也提供了一个增加财政负担去医院。因此,有一个重要的动机提供自动或半自动的支持降低整体分割时间的过程。
除了长时间轮廓,有挑战来自依赖计算机断层扫描(CT)扫描作为主要参考图像肿瘤组织和健康组织解剖学。CT图像的固有限制的形象对比软组织使分割的挑战,和仍然存在的不确定性在肿瘤和正常组织的精确程度。这进一步引入了一个关键的挑战为手动轮廓线;能够很好的证明,有来源interoperator可变性(IOV)分割。5- - - - - -11这样的变化可能会影响后续的剂量计算,与潜在的贫困患者的结果。12同样,它提出了一个问题在临床试验中进行跨多个医院的网站。除了节省了时间,自动仿形将提供潜力更大的标准化。
有重大投资建立autosegmentation技术,旨在减少时间和可变性。最近的努力探索机器学习(ML) autosegmentation CT扫描的放射治疗方法。13- - - - - -16当他们达到合理的精度在同一地点的数据集训练和评估,模型性能通常部署在其他医院网站时受损。这样的方法可以进一步限制适应性不同的放疗临床领域。限制这些算法一个身体区域或一个医院网站与特定的收购协议限制了这些方法的价值和适用性在实际临床上下文。此外,这些工具的集成到现有的工作流通常不被认为是医院。为了解决这些局限性,我们提出一个通用的分割方案对前列腺和头部和颈部癌症治疗计划和证明它可以集成到现有的工作流程。
下许可的所有的数据集都与临床相关网站达成协议,收到了良好的舆论的研究伦理委员会从东England-Essex研究伦理委员会和卫生研究的权威。根据双方协议,临床基地同意获得所有批准,许可和批准。本研究遵循的标准质量改进报告卓越(乡绅)报告指南。
提出的分割方法是基于最先进的卷积神经网络(CNN)模型,同样的方法应用于前列腺癌和头部和颈部成像数据集。它使用一个三维(3 d) U-Net模型的变体17生成轮廓的桨从原始三维CT图像(eAppendix 2的补充)。
前列腺癌,这个模型轮廓线以下6结构:前列腺、精囊、膀胱、左和右股骨和直肠。在前列腺癌放疗计划的目的,放射肿瘤学家认为前列腺体积目标,划定为桨,其余结构。在头部和颈部癌症的情况下,我们使用的一个子集桨结构定义为一组放射肿瘤学家,18根据他们的相关例程头颈部放射治疗(表1)。该模型自动训练来描绘这些9结构在给定的头部CT扫描。
我们聚合519盆腔和242头和颈部CT扫描获得在8种不同的临床基地从病人诊断与前列腺癌或头部和颈部癌症,eAppendix 1中概述补充。跨站点扫描显示变化由于扫描仪的差异类型和收购协议。实验目的,图像分成2分离集:主要和外部eAppendix 1中概述补充。前者的目的是用于模型训练和测试的目的;后者是一个排除数据集组成的图像从3随机选择临床基地,用来测量模型的泛化能力,看不见的数据集。主要从这三个数据集不包含任何图像排除网站,从而使一个蒙面评估外部数据集上执行。这些照片是手工注释2临床训练专家读者(r和G.B.)和放射肿瘤学家掩盖别人的注释;因此,结构在每一个图像都是手动波状外形的1专家,后来通过一个单独的肿瘤学家。手工仿形过程的更多细节,请参阅eAppendix 1的补充。外部的头部和颈部使用头部CT扫描数据集是由Nikolov et al,发布的15这是一个开源的数据集19为基准头颈部CT细分模型和收购在癌症成像存档西妥昔单抗20.头颈鳞状细胞癌,癌症基因组图谱的研究。
性能评估模型,我们使用了骰子系数21作为相似性度量,量化之间的对应关系对相同体积分割的结构。完全重叠结构导致100.00%的骰子点数,而0.00%的骰子点数对应完全缺乏重叠。此外,我们测量了双轮廓重叠使用豪斯多夫距离和平均地对地指标(毫米)。描述的指标作为视觉和进一步eAppendix 3补充。
CNN模型训练的合奏与不同的培训和验证集分裂从主数据集而固定不相交测试集(见eAppendix 2补充详情)。生成的轮廓之间的协议模型和专家读者与科恩和弗莱斯κ测量统计22分别对单个和多个注释器。对于每一个结构,达成协议的分数计算在前景像素定义为一个二进制的面具。这是为了避免可能的偏差,由于大量的背景像素。同样,Bland-Altman情节23生成可视化的病人协议级别(eAppendix 3的补充)。之间的性能差异观察主要和外部网站的统计测试是Mann-Whitney测试。24相同的模型训练设置也是主要部署在头部CT数据集训练的头部和颈部模型可以描述桨在头部和颈部放射治疗(表1)。图1显示定性评估的轮廓与拟议的模型预测。此外,识别任何总轮廓线错误,分割也比较的几何表面的距离。
在第二组实验中测试数据集的泛化看不见的临床基地,以前训练的骨盆和头颈部CT模型测试相应的外部数据集(外部),这是由图像获取3特定临床基地,被排除在训练和验证数据集(主要)。通过这个实验,目的是评估训练模型的泛化到看不见的CT收购协议和患者团体。
所有统计分析进行了使用Python版本3.7.3 (Python软件基金会),与scikit-learn包版本0.21.1 Cohen-Fleissκ和scipy包版本1.3.1 Mann-Whitney测试。统计学意义是P<。01的零假设测试和κ> 0.75协议分析。所有的测试都是2-tailed。
共有519名参与者(519(100%)人;390年[75%]62 - 75岁)盆腔CT图像和242参与者(184(76%)人;194(80%)50 - 73岁)包括头部和颈部CT图像。前列腺分割结果(表2)表明,自动生成器官品(整体)前列腺癌扫描是一致的轮廓由临床专家,与表面误差在可接受的误差界(如左股骨,κ= 0.982)。结果与头部和颈部分割结果一致(如脑干,κ= 0.806)(表1)。同样,在外部数据集上验证(表1和表2在放射治疗),模型表现一直好域跨多个网站(例如,平均得分(SD)骰子左股骨,内部和外部数据集:98.52%(0.50)和98.04% (1.02);P= .04点),只有轻微的性能下降由于低分段颌下腺组织的对比。我们的观察的分割错误倾向于发生在上级和劣质程度的管状结构和相邻器官之间的接口。然而,我们现在还没有观察到任何不一致,如果不改正,可能导致重大错误在一个治疗计划,就是明证表面距离的结果。这是因为该后处理方法不允许不一致在远处从解剖结构设计。
可接受的性能预计的范围内IOV发现在人类专家。5,7IOV骰子分数和表面之间的距离3专家轮廓10为每个放射治疗领域提供了测试图像表1和表2。14 15结构,统计协议(即κ> 0.75)自动生成轮廓之间的观察和专家注释。参考轮廓测定采用多数表决方案使用所有3注释器。至少2专家必须同意意味着结构实际上是礼物。除了smg结构,地面真值达到了标准的相似性得分在轮廓线与水平的专家IOV相提并论,指出的κ值和Bland-Altman情节(eAppendix 3补充)收集协议分析。在这里我们可以看到,与高对比度更清晰的结构,如膀胱和股骨,有相当高的一致性专家(κ> 0.96)。但对低对比度和变形特性,如前列腺、精囊,smg,我们看到一个更高的利率的变化,因为器官边界通常不清楚这种不良的存在条件(图2和表2)。类似的模式的性能差异是产生的轮廓模型,在相同的测试图像分割和比较定性参考轮廓(相同的图2)。
模型的临床效益评估通过比较次正确的自动生成与次从头开始手动轮廓图像轮廓。分析,头部和颈部IOV-10和前列腺IOV-10数据集被使用,有不同的扫描成像质量,从好(15)可怜的(5)。内部注释工具用于轮廓和修正任务。辅助工具特征轮廓线和交互式轮廓优化模块,缓解轮廓任务同时确保分割精度高。手动分割的头部和颈部扫描同样9桨了平均为86.75 (95% CI, 75.25 - -98.29)分钟/扫描专家读者为73.25 (95% CI, 68.68 - -77.82)分钟/扫描放射肿瘤学家。同样的扫描,autocontours的检查和校正时间测量为4.98 (95% CI, 4.44 - -5.52)分钟/扫描头部和颈部扫描和3.40 (95% CI, 1.60 - -5.20)分钟/扫描前列腺扫描,检查和更新(如有必要)肿瘤学家,确保临床治疗计划所需精度。这代表平均减少93%。在所有20扫描,每扫描测量校正时间最慢7.05分钟,因为较低的成像质量。平均推理时间23 (95% CI, 20-26)秒被送往段目标和所有桨前景像素全部输入CT扫描。
提出了几个框架autosegmentation的头部和颈部15,25和盆腔器官。13,16,26在2的研究中,13,16作者描述一个方法前列腺癌和桨分割,在器官定位分割之前执行。他们的算法验证的数据集88 CT扫描。类似的级联autosegmentation方法提出了王等26在头部和颈部CT扫描描绘桨;这项研究是由培训(33扫描)和评估(15扫描)使用公共数据集在一个autosegmentation挑战。27
有努力展示的潜在临床用例ML桨等高线自动的解决方案。相比以前的工作,评估进行小组同质图像,我们评估毫升如何解决方案可能导致广义性能(1)不同放射治疗领域和(2)从多个站点的数据集。我们旨在演示这些解决方案的鲁棒性和普遍性。更重要的是,我们发现,将这些模型集成到临床工作流可以减少所需的时间剂量治疗的计划做准备。
跨不同采集设置模型的表现普遍性,同时实现良好的与专家轮廓水平的协议。这可以促进更容易部署新的临床基地。任何实际的重要性进一步采用这项技术在大型医疗系统工作能力在不同临床领域。我们已经表明我们的方法,没有任何实质性的变化,可以使模型在不同的放射治疗领域的培训,演示了通过应用程序在前列腺癌和头部和颈部癌症。这一点尤其重要的考虑到不同的成像与这些不同领域相关的挑战。
增强了实际应用在临床情况下将提出的模型合并到现有的工作流的放射肿瘤学家(图3)。说明系统已经实现和评估由临床专家在剑桥大学医院工作。在此工作流,CT扫描获得从病人参加放射治疗的准备工作。这些扫描数据库最初是存储在医院的形象,后来通过网关安全地转移到autosegmentation平台在匿名化后的云。分割过程完成后,结果文件上传回到医院的图像数据库,创建一个无缝的临床工作流程,临床医生可以评审和细化轮廓在他们现有的轮廓和规划工具。
把这些毫升的工具,它们可以有效地采用临床实践需要一定程度的临床准确性符合专家观察员。当模型在这方面表现良好,在实例模型表现不佳,手动正确分割的机会仍然是一个必要的组成部分提出了工作流。提出了工作流使肿瘤学家能够使用他们现有的临床系统审查和编辑,使这项技术更容易在诊所,因为维护现有的工作流。同时,临床医生可以检查和编辑轮廓在几分钟而不是几小时内。这样可以节省很多时间,即使被认为只有在绝对数量上。
在这项研究中所使用的源代码是公开的。28肿瘤中心这创造了一个机会使用这种技术训练和部署新车型使用自己的数据集。通过这种方式,用户可以包括其他正常组织结构autocontouring管道,包括耳蜗和口腔结构在头部和颈部癌症的治疗方法。新的公共数据集的可用性和共享在诊所在提高模型的性能是一个重要的里程碑,使其可访问。同样,图像质量(智商)保证29日对模型的可靠使用至关重要。智商评估模型之前应该进行部署30.采集和处理时间过滤图像用金属构件。训练模型在一组不同的数据集,是表现在这项研究中,一个有效的方法来处理低对比度(如cone-beam CT)和高噪音的图像。外部数据集验证也是必不可少的测量这些影响;例如,外部的头部和颈部的图像数据集用于这项研究包含严重beam-hardening工件。
更适应形式的放疗,解剖学是resegmented和剂量计划再优化对于每一个部分,被认为是更理想的方式提供治疗,31日一直挑战采取由于其巨大的资源需求。32在这方面,提出了技术可以使连续再分割和自适应的治疗以大规模采用。例如,在hypofractionated方案或紧急治疗的情况下,这些模型的扩展resegment解剖扫描可以在重要的临床实用程序来节省时间和让病人治疗进展更快。集成技术,如核磁共振直线加速器,33用于同步成像和剂量交付,也可能提供更多的自适应的治疗形式确定肿瘤治疗时的位置。
这项研究有一定的局限性。IOV和注释中使用的数据集实验时间小于其余评估提出了研究。为进一步的统计意义,应当重复这些实验与更大的数据集不同的成像质量。此外,表面和骰子指标用于评价模型并不总是与手工仿形过程中节省了时间。15,34这需要设计新的指标,量化细分误差,考虑用户交互需要改正的成本。
本研究发现ML-based autosegmentation减少轮廓时产生临床有效的结构轮廓异构数据集对前列腺和头部和颈部放射治疗计划。这是体现在评估外部数据集和IOV多点数据集实验。总的来说,采用可伸缩的方法导致了现实的挑战在卫生保健系统通过现成的可扩展性在医院网站和多个癌症领域的适用性。未来毫升研究验证该技术的适用性在其他放射治疗领域和更大的数据集将宝贵的ML解决方案在卫生保健系统的广泛采用。
发表:2020年10月1日。
发表:2020年11月30日。doi:10.1001 / jamanetworkopen.2020.27426
更正:本文纠正在2020年12月9日,修复一个错误的抽象。
开放:这是一个开放的分布式根据文章CC-BY-NC-ND许可证。©2020 Oktay O et al。狗万体育下载地址《美国医学会杂志》网络开放。
通讯作者:Ozan Oktay博士健康情报,微软研究院,21个车站Rd,剑桥,CB1 2 fb联合王国(ozan.oktay@microsoft.com)。
作者的贡献:Oktay博士已经完全访问所有数据的研究,负责数据的完整性和数据分析的准确性。
概念和设计:Oktay、Nanavati Schwaighofer Tanno,耶拿,高贵,格洛克,主教,Alvarez-Valle,紫菜。
数据的采集、分析或解释:Oktay、Nanavati Schwaighofer,卡特,布里斯托,耶拿,巴内特,高贵,轮辋,格洛克,奥哈拉,Alvarez-Valle。
起草的手稿:Oktay、Nanavati Schwaighofer,布里斯托,耶拿,格洛克,奥哈拉,Alvarez-Valle,紫菜。
关键的修订手稿的重要知识内容:Oktay Schwaighofer,卡特,Tanno,耶拿,巴内特,高贵,轮辋,格洛克,奥哈拉,主教,Alvarez-Valle,紫菜。
统计分析:Oktay、Nanavati Schwaighofer,卡特。
获得资助:紫菜。
行政、技术或材料支持:Oktay Schwaighofer,布里斯托,耶拿,高贵的,主教,Alvarez-Valle,紫菜。
监督:Oktay Schwaighofer,耶拿,巴内特,轮辋,格洛克,Alvarez-Valle,紫菜。
利益冲突的披露:耶拿博士报道从微软获得个人费用在进行这项研究的。高贵博士报道收到英国癌症研究和个人资助费用来自微软研究院,剑桥,在进行这项研究的。没有其他信息披露报告。
资金/支持:研究工作报告的手稿被微软剑桥研究院自筹资金。
资助者的角色/赞助商:资金没有参与这项研究的设计和实施;的收集、管理、分析和解释数据;准备、审查或批准的手稿;并决定提交出版的手稿。
18岁。
这CL, Steenbakkers RJ, Bourhis J, et al . CT-based描述器官的风险在头部和颈部区域:DAHANCA, EORTC, GORTEC, HKNPCSG, NCIC CTG, NCRI, NRG肿瘤学和曲格列酮共识指南。
Radiother杂志。2015,117 (1):83 - 90。doi:
10.1016 / j.radonc.2015.07.041
PubMed
谷歌学术搜索
Crossref
35。
Acosta O。,,Dowling J.,, Drean G., et al Multi-atlas-based segmentation of pelvic structures from CT scans for planning in prostate cancer radiotherapy. In: El-Baz AS, Saba L, Suri JS, eds.
腹部和胸部成像。施普林格,2014:623 - 656。doi:
10.1007 / 978 - 1 - 4614 - 8498 - 1 -大于