制定评估标准的人工智能计算机视觉伤口注释

医学博士杰弗里·k·乔普林此举MSHS¹ ; 布莱恩·c·Pridgen MD² ; 瑟瑞娜Yeung博士³

¹段创伤、外科重症监护和急性护理手术,外科学系,斯坦福大学医学院,斯坦福,加州
²Buncke诊所,旧金山,加利福尼亚
³生物医学数据科学部门,斯坦福大学,斯坦福大学,加州

JAMA Netw开放。 4 (5):2021;e217851。doi: 10.1001 / jamanetworkopen.2021.7851

人工智能(AI)和机器学习方法被越来越多的用于生成见解临床问题。人工智能领域被称为计算机视觉(CV)杠杆增加医学方面涉及到视觉信息的解释,包括伤口护理。万博manbetx平台首页¹伤口分类、测量,随着时间的推移和发展都是至关重要的最佳护理。这些特征是视觉,应该服从简历算法。²作为研究成果扩散,似乎谨慎的评估标准的工作。这样做会使不同研究团队更好地比较他们的工作。它还可以促进一个更协调的努力构建算法,可以一起帮助解决临床问题。

三大类的简历算法是建立分类、检测和分割。整个图像分类算法分配标签。检测算法分配一个边界框和标签对象在图像。分割算法更进一步通过分配一个面具在图像对象的轮廓和相应的标签。我们不知道任何事先的评估标准考虑和有针对性的专门为CV-based伤口注释。专注于分割算法,豪厄尔等³开始了微妙的方法比较成立伤口轮廓由人类和AI注释器。具体地说,他们使用误差分布比较所做的注释和耦合的定性比较蒙蔽人类的评论家。使用这些方法,它们显示,该算法评估,人工智能与人类分割不同的定量方式类似人类和人类的分割。

第一个挑战,豪厄尔等³解决在这一过程中,数据集生成地面真理。就像许多其他visual-based诊断,伤口评估缺乏一个完全客观地真实。训练模型的过程中鼓励它复制地面实况标签。在许多临床简历细分研究,地面真理是一组human-labeled图像。作者理所当然地注意方差在人类注释器在他们自己的研究。这些差异可能是由于一些人类注释器更熟练的使用数字轮廓或比其他人更注重细节,甚至放大这张照片轮廓更精确。

因此,任何一个团队建设模型应该批判性地思考他们想复制。他们想要模仿一个特定的评定等级的吗?也许一个非常详细的注释器能够跟踪伤口边缘完美,和他们想要集中算法训练。他们想调查人群的智慧吗?⁴可能有多个评级机构注释每个图像给出了更好的训练算法的地面实况。⁵无论如何,培训过程反映了标签。无论对于human-labeled数据路径选择,intra-observer interobserver可变性和一致性应该评估和报告。

一旦算法训练带安全标签的数据时,他们对小说然后测试数据,并评估他们的表现。分类和分割算法都有一组核心的性能指标。传统的分割算法,性能的主要措施是交叉在联盟(借据)或骰子系数。在某些情况下,精度和召回也报道。借据和骰子系数可以从另一个。借据对待假阳性和假阴性则同样,共同优化它们。豪厄尔等³破裂的标准度量利用误差分析借据为它的组成部分。假阴性和假阳性面积指标描述错误的类型和在多大程度上低估了vs overpredicting算法。测量相对误差描述的不同区域。一起使用,这3个指标允许细粒度的理解有多接近预测的跟踪是人类追踪和方向错误发生。

豪厄尔等人提供的另一个重要的见解³大小的影响对一个算法的性能度量的结果。他们指出,“轮廓之间的相对误差往往显著增加小伤口的绝对大小。”³这并不是完全出人意料,因为借据由大小归一化。当你有一个小物体,每个像素错误有更大的影响。在一些极端的情况下,仅仅这一事实之间有重叠预测面具和地面真理掩盖已经可以是一个好的迹象。占大小影响一个可能的方法是将伤口分组为一组有意义的类别(如小型、中型和大型),然后专门评估伤口分割算法执行在每个类别的伤口。

,豪厄尔等³包括全套的图片作为补充附录的大型读者受益。每个图像都包含轮廓由人类注释器和人工智能算法。看着图片和他们的轮廓,可以看到跟踪差异的证据。在补充讨论,作者打破了这些子组。大多数的图像包含伤口注释在边界上略有不同。上述性能指标来评估这些图像工作得很好。也有伤口的图片占主导地位的伤口或小卫星的伤口在哪里不定地注释。例如,有时一个卫星伤口是不确定的。最后,伤口往往很复杂。各种类型的组织,包括坏死、焦痂脱落,造粒,epithelialized,可能都存在。 One segmentation of a wound may appropriately include all portions of the wound within the segmentation mask, while another may annotate only a single portion of the wound (eg, granulation tissue only). Future models could further delineate their performance on these subgroups of problems.

豪厄尔等³清晰的务实在伤口护理评估面临的挑战。他们强调需要“伤口清晰、快速和精确的分析指导最佳临床实践。”³我们同意他们的结论,一个结构化的方法来增强伤口评估由人工智能可以帮助改善病人临床实践并最终结果。他们的方法和方法将有用的那些希望评估伤口分割算法的性能。作为人工智能算法应用于伤口的方法评估继续成熟,我们设想,相应的评估标准也在不断地发展。这是一个重要的第一步。

回到顶部

条信息万博manbetx平台首页

发表:2021年5月19日。doi:10.1001 / jamanetworkopen.2021.7851

通讯作者:杰弗里·k·乔普林此举MD、MSHS段创伤、手术关键护理和急性护理手术,外科学系,斯坦福大学医学院,300年巴斯德博士H3691,斯坦福,CA 94305 (jjopling@stanford.edu)。

利益冲突的披露:没有报道。

引用

1。

王C, Anisuzzaman DM,威廉姆森V, et al .全自动伤口深卷积神经网络分割。Sci代表。2020;10 (1):21897。doi:10.1038 / s41598 - 020 - 78799 - w PubMed 谷歌学术搜索 Crossref

2。

王Anisuzzaman DM,, Rostami B,葛,Niezgoda J, Yu Z。基于图像的人工智能在伤口评估:系统回顾。出来了。预印本出版于2020年9月15日。2021年4月12日通过。https://arxiv.org/abs/2009.07141

3所示。

豪厄尔RS,刘HH,汗AA,等。发展的临床评价方法基于人工智能的数字伤口评估工具。JAMA Netw开放。4 (5):2021;e217234。doi:10.1001 / jamanetworkopen.2021.7234 谷歌学术搜索

4所示。

Kovashka, Russakovsky O,菲菲L,好莱坞k .众包在计算机视觉。现在基础和趋势,2016年。doi:10.1561 / 0600000071

5。

Barnett ML, Boddupalli D, Nundy,贝茨DW。比较通过集体智慧的多个医生诊断的准确性与个人医生。JAMA Netw开放。2019;2 (3):e190096。doi:10.1001 / jamanetworkopen.2019.0096 PubMed 谷歌学术搜索

制定评估标准的人工智能计算机视觉伤口注释

别人也喜欢

专题文章

USPSTF语句

博客

制定评估标准的人工智能计算机视觉伤口注释

看到更多

引用

下载引用文件:

选择你的兴趣

获得最新的研究根据你感兴趣的领域。

别人也喜欢