[跳转至导航栏]
狗万体育下载地址JAMA网络主页
登录
表1。15份示范报告准则文件摘要一个
15模式报告准则文件摘要
表2。模型报告指南,其项目映射到机器学习模型创建和评估的不同阶段,以指导护理
模型报告指南,其项目映射到机器学习模型创建和评估的不同阶段,以指导护理
表3。报告指南中常见的要求项目
报告指南中常见的要求项目
表4。各模型简报对整个报告准则的遵守率
各模型简报对整个报告准则的遵守率
表5所示。请求但较少报告的项目一个
要求但较少报告的项目
1.
王志强,王志强,王志强,等。可扩展和精确的深度学习与电子健康记录。NPJ数字医院.2018;一18。doi:10.1038 / s41746 - 018 - 0029 - 1PubMed 谷歌学者 Crossref
2.
张志刚,张志刚,张志刚;分析用于管理人口健康的算法中的种族偏见。科学.2019, 366(6464): 447 - 453。doi:10.1126 / science.aax2342PubMed 谷歌学者 Crossref
3.
Saria s *, Butte a *, Sheikh a *。通过机器学习更好的医疗:什么是真实的,什么是人造的?科学硕士.2018; 15 (12): e1002721。doi:10.1371 / journal.pmed.1002721PubMed 谷歌学者 Crossref
4.
伊曼纽尔j;医疗保健领域的人工智能:价值会与炒作相匹配吗?《美国医学会杂志》.2019; 321(23): 2281 - 2282。doi:10.1001 / jama.2019.4914PubMed 谷歌学者 Crossref
5.
白杨。高性能医学:人与人工智能的融合。Nat地中海.2019; 25(1): 44-56。doi:10.1038 / s41591 - 018 - 0300 - 7PubMed 谷歌学者 Crossref
6.
奥伯梅耶;人工智能和机器学习的应用正在增加,但非理性繁荣仍然存在。NEJM的催化剂.2019年12月10日在线发布。doi:10.1056 / CAT.19.1090谷歌学者 Crossref
7.
张志强,张志强,张志强,等。使预测模型在实践中有用的框架。美国医学信息协会.2021年,28(6):1149 - 1158。doi:10.1093 /地点/ ocaa318PubMed 谷歌学者 Crossref
8.
Beam al_, Manrai ak_, Ghassemi m_。医疗保健领域机器学习模型再现性面临的挑战《美国医学会杂志》.2020, 323(4): 305 - 306。doi:10.1001 / jama.2019.20866PubMed 谷歌学者 Crossref
9.
马西尼·梅,威彻尔·d,萨达尼·伊斯拉尼·s;医疗保健中的人工智能:来自美国国家医学科学院的一份报告。《美国医学会杂志》.2020, 323(6): 509 - 510。doi:10.1001 / jama.2019.21579PubMed 谷歌学者 Crossref
10.
Gianfrancesco ma_, Tamang s_, Yazdany j_, Schmajuk g_。使用电子健康记录数据的机器学习算法中的潜在偏差。美国医学会实习生.2018, 178(11): 1544 - 1547。doi:10.1001 / jamainternmed.2018.3763PubMed 谷歌学者 Crossref
11.
保罗斯jk;可预见的不平等:理解和解决算法临床预测可能增加健康差距的问题。NPJ数字医院.2020; 3:99。doi:10.1038 / s41746 - 020 - 0304 - 9PubMed 谷歌学者 Crossref
12.
拉杰科玛a *,哈特m *,豪威尔md*,科拉多g_ *,秦mh *。确保机器学习的公平性,促进卫生公平。实习医生.2018, 169(12): 866 - 872。doi:10.7326 / m18 - 1990PubMed 谷歌学者 Crossref
13.
帕瑞克rb;解决医疗保健领域人工智能的偏见问题。《美国医学会杂志》.2019; 322(24): 2377 - 2378。doi:10.1001 / jama.2019.18058PubMed 谷歌学者 Crossref
14.
Coley ry_, Johnson e_, Simon ge_, Cruz m_, Shortreed sm_。心理健康访问后自杀死亡预测模型表现的种族/民族差异JAMA精神病学.2021, 78(7): 726 - 734。doi:10.1001 / jamapsychiatry.2021.0493PubMed 谷歌学者 Crossref
15.
朴艳*,胡娟*,辛格*,等。产后抑郁症临床预测模型中降低偏倚方法的比较。美国医学会网络公开赛.4 (4): e213909。2021;doi:10.1001 / jamanetworkopen.2021.3909PubMed 谷歌学者 Crossref
16.
刘刚,陈志勇,陈志强,陈志强,陈志强。CheXclusion:深胸x线分类器的公平性差异。Pac Symp Biocomput.2021; 26:232 - 243。PubMed 谷歌学者
17.
张志强,张志强,等。通过改进亚种群校准来解决预测模型中的偏差。美国医学信息协会.28 2021;(3): 549 - 558。doi:10.1093 /地点/ ocaa283PubMed 谷歌学者 Crossref
18.
Pfohl sr#, Foryciarz a#, Shah nh#。公平机器学习用于临床风险预测的实证描述。J生物医学信息.2021; 113:103621。doi:10.1016 / j.jbi.2020.103621PubMed 谷歌学者 Crossref
19.
Khetpal v;一个基本上未经测试的人工智能算法是如何潜入数百家医院的。2021年5月28日。2021年6月25日访问。https://www.fastcompany.com/90641343/epic-deterioration-index-algorithm-pandemic-concerns
20.
吴娥*,吴康*,丹内杰*,欧阳丹*,何德*,邹娟*。如何评估医疗人工智能设备:FDA批准分析的限制和建议。Nat地中海.27 2021;(4): 582 - 584。doi:10.1038 / s41591 - 021 - 01312 - xPubMed 谷歌学者 Crossref
21.
色狼c;当算法削减你的医疗保险时会发生什么?边缘.2018年3月21日。2021年6月2日访问。https://www.theverge.com/2018/3/21/17144260/healthcare-medicaid-algorithm-arkansas-cerebral-palsy 谷歌学者
22.
路透e7;研究人员发现,流行的败血症预测模型比声称的“差得多”。MedCity新闻。2021年6月23日。2021年6月28日访问。https://medcitynews.com/2021/06/popular-sepsis-prediction-model-works-substantially-worse-than-claimed-researchers-find/
23.
王志强,王志强,王志强,等。在住院患者中广泛实施的专有败血症预测模型的外部验证。美国医学会实习生.2021, 181(8): 1065 - 1070。doi:10.1001 / jamainternmed.2021.2626PubMed 谷歌学者 Crossref
24.
张志刚,张志刚,张志刚,等。风险预测模型,II:外部验证、模型更新和影响评估。.2012, 98(9): 691 - 698。doi:10.1136 / heartjnl - 2011 - 301247PubMed 谷歌学者 Crossref
25.
张晓明,王晓明,王晓明,王晓明,王晓明。机器学习测试分数:机器学习生产准备和技术债务减少的一个指标。2017年IEEE大数据国际会议论文集.2017年12月11-14日:1123-1132。doi:10.1109 / BigData.2017.8258038
26.
张文敏,张文敏,张文敏,等。PROBAST:评估偏倚风险和预测模型研究适用性的工具:解释和阐述。实习医生.2019年,170 (1):W1-W33。doi:10.7326 / m18 - 1377PubMed 谷歌学者 Crossref
27.
Steyerberg ewa, Vergouwe y;迈向更好的临床预测模型:开发的七个步骤和验证的ABCD。Eur Heart J.2014; 35(29): 1925 - 1931。doi:10.1093 / eurheartj / ehu207PubMed 谷歌学者 Crossref
28.
张文杰,张文杰,张文杰,等。预测模型研究系统回顾的关键评估和数据提取:CHARMS检查表。科学硕士.2014; 11 (10): e1001744。doi:10.1371 / journal.pmed.1001744PubMed 谷歌学者 Crossref
29.
马晓明,吴珊[,张晓明],等。用于模型报告的模型卡。:公平、问责和透明问题会议论文集.计算机协会;2019年1月29日。
30.
Hernandez-Boussard t_, Bozkurt s_, Ioannidis jpa_, Shah nh_。MINIMAR(医疗人工智能报告最万博manbetx平台首页低信息):制定医疗保健人工智能报告标准。美国医学信息协会.2020; 27(12): 2011 - 2015。doi:10.1093 /地点/ ocaa088PubMed 谷歌学者 Crossref
31.
桑达克mpa,高明m,布拉杰n,巴鲁s;用模型事实标签向临床最终用户展示机器学习模型信息。万博manbetx平台首页NPJ数字医院.2020; 3:41。doi:10.1038 / s41746 - 020 - 0253 - 3PubMed 谷歌学者 Crossref
32.
刘鑫[,Cruz Rivera s], Moher d], Calvert mj], Denniston ak[;SPIRIT-AI和consortium - ai工作组。涉及人工智能干预的临床试验报告报告指南:consortium - ai扩展。Nat地中海.2020; 26(9): 1364 - 1374。doi:10.1038 / s41591 - 020 - 1034 - xPubMed 谷歌学者 Crossref
33.
里维拉sc#,刘鑫#,陈aw#, Denniston ak#, Calvert mj #;SPIRIT-AI和consortium - ai工作组。涉及人工智能干预的临床试验方案指南:SPIRIT-AI扩展BMJ.2020; 370: m3210。doi:10.1136 / bmj.m3210PubMed 谷歌学者 Crossref
34.
张志刚,张志刚,张志刚;支持人工智能的临床决策支持软件:临床医生的“信任和价值清单”。NEJM的催化剂.2020; 1(6)。doi:10.1056 / CAT.20.0212谷歌学者 Crossref
35.
Schulz kf, Altman dga, Moher d;配偶。CONSORT 2010声明:报告平行组随机试验的更新指南。国际外科.2011; 9(8): 672 - 677。doi:10.1016 / j.ijsu.2011.09.004PubMed 谷歌学者 Crossref
36.
陈华*,Tetzlaff jm *, Altman dg*, Dickersin k *, Moher d *。SPIRIT 2013:临床试验方案内容的新指南。《柳叶刀》.2013, 381(9861): 91 - 92。doi:10.1016 / s0140 - 6736 (12) 62160 - 6PubMed 谷歌学者 Crossref
37.
冯·埃尔姆e *,阿尔特曼dg*,艾格m*,波考克sj*, Gøtzsche pc*,范登布鲁克jp*;斯特罗布的倡议。加强流行病学观察性研究的报告(STROBE)声明:报告观察性研究的指南。BMJ.2007, 335(7624): 806 - 808。doi:10.1136 / bmj.39335.541782.ADPubMed 谷歌学者 Crossref
38.
张志刚,张志刚,张志刚,等;标准组。标准2015:报告诊断准确性研究的基本项目的更新列表。BMJ.2015; 351: h5527。doi:10.1136 / bmj.h5527PubMed 谷歌学者 Crossref
39.
张志刚,张志刚;人工智能工作组更新。人工智能谘询委员会人工智能工作小组:署长谘询委员会第119次会议。2019年12月13日。2021年6月24日访问。https://acd.od.nih.gov/documents/presentations/12132019AI.pdf
40.
DECIDE-AI指导小组。DECIDE-AI:新的报告指南,以弥合临床人工智能的开发与实施差距。Nat地中海.2021年,27(2):186 - 187。doi:10.1038 / s41591 - 021 - 01229 - 5PubMed 谷歌学者 Crossref
41.
Collins gs;人工智能预测模型报告。《柳叶刀》.2019, 393(10181): 1577 - 1579。doi:10.1016 / s0140 - 6736 (19) 30037 - 6PubMed 谷歌学者 Crossref
42.
张志强,张志强,张志强,等。为评估人工智能干预措施的诊断准确性研究制定具体的报告指南:标准-人工智能指导小组Nat地中海.2020年,26(6):807 - 808。doi:10.1038 / s41591 - 020 - 0941 - 1PubMed 谷歌学者 Crossref
43.
张志刚,张志刚,张志刚,等。在使用电子健康记录的机器学习模型中报告人口数据和代表性。美国医学信息协会.2020; 27(12): 1878 - 1884。doi:10.1093 /地点/ ocaa164PubMed 谷歌学者 Crossref
44.
韦南斯,范·卡尔斯特,张志强,等。COVID-19诊断和预后预测模型:系统综述和关键评价。BMJ.2020; 369: m1328。doi:10.1136 / bmj.m1328PubMed 谷歌学者 Crossref
45.
史诗系统公司。认知计算模型简介:退化指数。2021年1月8日。2021年3月8日访问。68年https://galaxy.epic.com/?浏览/页= 1 ! ! 50 !3883949
46.
认知计算模型简介:败血症的早期检测。史诗系统公司2016年12月13日。2021年3月8日访问。68年https://galaxy.epic.com/?浏览/页= 1 ! ! 50 !3289911
47.
史诗系统公司。认知计算模型简介:计划外再入院的风险(版本2)。2020年5月3日。2021年3月8日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=100051822
48.
史诗系统公司。认知计算模型简介:患者缺席的风险(版本2),2021年1月29日。2021年3月8日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=100020266
49.
史诗系统公司。认知计算模型简介:儿科住院和急诊科就诊。2018年3月31日。2021年3月8日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=3763630&Version=Epic%202018
50.
史诗系统公司。认知计算模型简介:入院或急诊科就诊的风险(版本2)。2020年5月1日。2021年3月8日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=100045918
51.
史诗系统公司。认知计算模型简介:住院患者跌倒风险。2020年9月2日。2021年4月13日访问。68年https://galaxy.epic.com/?浏览/页= 1 ! ! 50 !100014430
52.
史诗系统公司。认知计算模型简介:预测块利用率。2018年8月29日。2021年4月13日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=100014389
53.
史诗系统公司。认知计算模型简介:剩余停留时间。2017年4月7日。2021年4月13日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=3364171&Version=Epic%202018
54.
史诗系统公司。认知计算模型简介:心力衰竭住院。2017年11月1日。2021年4月13日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=3706332&Version=Epic%202018
55.
史诗系统公司。认知计算模型简介:哮喘住院和急诊科就诊。2017年8月29日。2021年4月13日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=3587370
56.
史诗系统公司。认知计算模型简介:高血压。2016年12月13日。2021年4月13日访问。68年https://galaxy.epic.com/?浏览/页= 1 ! ! 50 !3479172
57.
罗伟,冯丹,陈涛,等。生物医学研究中开发和报告机器学习预测模型的指南:多学科观点。J医疗互联网服务.2016; 18 (12): e323。doi:10.2196 / jmir.5870PubMed 谷歌学者 Crossref
58.
诺格特bj],奎尔ger], beaulieue - jones bk],等。关于临床人工智能万博manbetx平台首页建模的最低信息:MI-CLAIM检查表。Nat地中海.2020; 26(9): 1320 - 1324。doi:10.1038 / s41591 - 020 - 1041 - yPubMed 谷歌学者 Crossref
59.
Collins gs2, Reitsma jb3, Altman dg2, Moons kgm3。个体预后或诊断的多变量预测模型的透明报告(TRIPOD): TRIPOD声明。Br J外科.2015, 102(3): 148 - 158。doi:10.1002 / bjs.9736PubMed 谷歌学者 Crossref
60.
王晓明,王晓明,等。克服在临床护理中采用和实施预测建模和机器学习的障碍:我们可以从美国学术医疗中心学到什么?JAMIA开放.2020; 3(2): 167 - 172。doi:10.1093 / jamiaopen / ooz046PubMed 谷歌学者 Crossref
61.
肯特dm_,保卢斯j_,范克拉维伦d_,等。治疗效果异质性的预测方法(PATH)声明。实习医生.2020年,172(1):35 - 45。doi:10.7326 / m18 - 3667PubMed 谷歌学者 Crossref
62.
于彬,Kumbier k;验证数据科学。美国国立自然科学研究院.2020, 117(8): 3920 - 3929。doi:10.1073 / pnas.1901326117PubMed 谷歌学者 Crossref
63.
制定报告人工智能在临床试验中的使用的指导方针。Nat地中海.2020; 26(9): 1311。doi:10.1038 / s41591 - 020 - 1069 - zPubMed 谷歌学者 Crossref
64.
柳叶刀数字健康。指导更好地设计和报告人工智能干预试验。柳叶刀手指健康.2020; 2 (10): e493。doi:10.1016 / s2589 - 7500 (20) 30223 - 5PubMed 谷歌学者 Crossref
65.
陈志强,陈志强,陈志强,等。评估来自自动化电子健康记录管道的外科真实数据的质量。J Am Coll外科医生.2020, 230 (3): 295 - 305. - e12汽油。doi:10.1016 / j.jamcollsurg.2019.12.005PubMed 谷歌学者 Crossref
66.
维诺特tc[,张志强;良好的意图是不够的:信息学干预会加剧不平等。美国医学信息协会.2018; 25(8): 1080 - 1088。doi:10.1093 /地点/ ocy052PubMed 谷歌学者 Crossref
67.
本德;用于自然语言处理的数据陈述:旨在减轻系统偏差并实现更好的科学。Trans协会计算语言学家.2018; 6:587 - 604。doi:10.1162 / tacl_a_00041谷歌学者 Crossref
68.
张志强,张志强,张志强,等。用于数据集的数据表。arXiv.预印本于2018年3月23日在线发布。doi:10.48550 / arXiv.1830.09010 谷歌学者
69.
韦南思,王志强,王志强,王志强。揭开医疗领域人工智能的神秘面纱。BMJ.2020; 370: m3505。doi:10.1136 / bmj.m3505PubMed 谷歌学者 Crossref
70.
Eaneff s_, Obermeyer z_, Butte aj_;人工智能和机器学习技术的算法管理案例。《美国医学会杂志》.2020; 324(14): 1397 - 1398。doi:10.1001 / jama.2020.9371PubMed 谷歌学者 Crossref
71.
马志强,陈艳,王晓明,等。人工智能与临床医生:深度学习研究的设计、报告标准和声明的系统回顾。BMJ.2020; 368: m689。doi:10.1136 / bmj.m689PubMed 谷歌学者 Crossref
72.
王晓明,王晓明,等。无害:负责任的机器学习在医疗保健领域的路线图Nat地中海.2019; 25(9): 1337 - 1340。doi:10.1038 / s41591 - 019 - 0548 - 6PubMed 谷歌学者 Crossref
73.
朴艳* *,陈建平* *,马福曼* *,郭恩恩* *,胡娟* *,达斯* * *。评估医学中的人工智能:临床研究阶段。JAMIA开放.2020; 3(3): 326 - 331。doi:10.1093 / jamiaopen / ooaa033PubMed 谷歌学者 Crossref
74.
张文敏,张志强,张志强,等。风险预测模型,I:开发、内部验证和评估新(生物)标记物的增量价值。.2012, 98(9): 683 - 690。doi:10.1136 / heartjnl - 2011 - 301246PubMed 谷歌学者 Crossref
75.
陈志伟,陈志伟,陈志伟,等。SPIRIT 2013声明:定义临床试验的标准方案项目。实习医生.2013, 158(3): 200 - 207。doi:10.7326 / 0003-4819-158-3-201302050-00583 PubMed 谷歌学者 Crossref
76.
陈志强,张志强,张志强,等。报告诊断准确性研究的标准2015指南:解释和阐述。BMJ开放.2016; 6 (11): e012799。doi:10.1136 / bmjopen - 2016 - 012799 PubMed 谷歌学者 Crossref
77.
王志强,王志强,等;PROBAST集团。PROBAST:评估偏倚风险和预测模型研究适用性的工具。实习医生.2019年,170(1):51-58。doi:10.7326 / m18 - 1376 PubMed 谷歌学者 Crossref
78.
张志强,张志强,等;综合标准报告试验小组。CONSORT 2010解释和阐述:报告平行组随机试验的更新指南。临床流行病学.2010年,63 (8):e1-e37。doi:10.1016 / j.jclinepi.2010.03.004PubMed 谷歌学者 Crossref
79.
陈晓峰,王晓峰,王晓峰,等。SPIRIT 2013解释和阐述:临床试验方案指南。BMJ.2013; 346: e7586。doi:10.1136 / bmj.e7586PubMed 谷歌学者 Crossref
80.
张文敏,张志强,张志强,等。个体预后或诊断(TRIPOD)的多变量预测模型的透明报告:解释和阐述。实习医生.2015年,162 (1):W1-W73。doi:10.7326 / m14 - 0698PubMed 谷歌学者 Crossref
81.
杜克健康创新研究所。脓毒症观察:实施杜克特定的脓毒症早期预警系统。2020年1月18日。2021年7月2日访问。https://dihi.org/project/sepsiswatch/
82.
王志强,王志强,王志强。使机器学习模型在临床上有用。《美国医学会杂志》.2019; 322(14): 1351 - 1352。doi:10.1001 / jama.2019.10306PubMed 谷歌学者 Crossref
83.
ACM公平、问责和透明会议(ACM FAccT)。2021年6月1日。2021年7月2日访问。https://facctconference.org/index.html
84.
罗斯。Epic的人工智能算法受到公司防火墙的保护,无法进行审查,因此提供了关于重症患者的不准确信息。万博manbetx平台首页2021年7月26日。访问时间为2022年1月31日。https://www.statnews.com/2021/07/26/epic-hospital-algorithms-sepsis-investigation/
85.
史诗系统公司。认知计算模型简介。计划外风险:再入院(第二版)。2021年8月11日。访问时间为2022年5月31日。68年https://galaxy.epic.com/?浏览/页= 1 ! ! 50 !100051822
86.
史诗系统公司。认知计算模型简介。患者缺席的风险(第二版)。2022年2月27日。访问时间为2022年5月31日。68年https://galaxy.epic.com/?浏览/页= 1 ! ! 50 !100020266
87.
Jimmerson C。A3解决医疗保健问题:消除浪费的实用方法.生产力的新闻;2007.
88.
ORACLE欧洲核子研究中心。从诊断到整体病人护理,机器学习正在改变医疗保健。2019年10月21日。访问时间为2022年1月24日。https://www.cerner.com/perspectives/machine-learning-is-transforming-health-care
的观点 2607年
: A Systematic Review" data-type="string">
最初的调查
卫生信息学
8月19,2022

通过单一供应商的常用临床预测模型评估对报告指南的依从性系统回顾

作者的从属关系
  • 1生物医学信息研究中心,斯坦福大学医学院,斯坦福,加州
  • 2斯坦福大学医学院儿科部,斯坦福,加利福尼亚
  • 3.露西尔帕卡德儿童医院临床信息部,帕洛阿尔托,加利福尼亚
  • 4科技和数字解决方案,斯坦福医学院,斯坦福,加州
  • 5临床卓越研究中心,斯坦福医学,斯坦福,加州
美国医学会网络公开赛。 2022; 5 (8): e2227779。doi: 10.1001 / jamanetworkopen.2022.27779
要点

问题模型报告准则共同要求哪些项目,部署的临床预测模型的文档是否报告这些信息?万博manbetx平台首页

发现该系统综述结合了15个报告准则模型,并确定了220个不同的要求项目。对来自单个供应商的12个已部署模型的文档的回顾发现,项目完成率的中位数为39%,尽管经常请求的项目被高度报道,但至少有一半的文档可以提供更多关于可靠性(包括外部验证)和公平性的信息。万博manbetx平台首页

意义这些发现表明,指南所要求的项目构成了很大的报告负担,而关于可靠性和公平性的补充可能会改善其文档。

摘要

重要性已经提出了各种模型报告指南,以确保临床预测模型的可靠性和公平性。然而,对于报告哪些模型细节是必要的还没有达成共识,报告指南之间的共性和差异还没有被描述出来。此外,还没有研究部署模型的文档如何很好地遵循这些指导方针。

目标评估模型报告准则所要万博manbetx平台首页求的信息,以及由单个供应商开发的常用机器学习模型的文档是否提供了所要求的信息。

证据审查MEDLINE查询使用机器学习模型卡而且报告机器学习2020年11月4日至12月6日。对参考文献进行了审查,以找到其他出版物,没有具体报告建议的出版物被排除在外。万博ManBetX网页要求提交报告的类似内容合并为代表性项目。四名独立评审员和一名裁决者评估了由单个供应商开发的最常用模型的文档报告项目的频率。

发现从15个模型报告准则中,确定了220个代表集体报告需求的独特项目。尽管通常需要12个项目(由10个或更多指南请求),但仅1个指南就需要77个项目。来自单一供应商的12种常用模型的文档报告中位数为39% (IQR, 37%-43%;范围,31%-47%)来自集体报告要求的项目。许多常见要求的项目有100%的报告率,包括有关结局定义、受试者工作特征曲线下面积、内部验证和预期临床使用的项目。有几个项目报告了一半或更少的时间与可靠性有关,例如外部验证、不确定性度量和处理丢失数据的策略。其他经常未报告的与公平有关的项目(汇总统计和亚组分析,包括种族、民族或性别)。

结论与相关性这些发现表明,对于临床预测模型,需要一致的报告建议,以便模型开发人员共享模型部署所需的信息。万博manbetx平台首页许多已出版的指南加起来需要报告200多个项目。来自1个供应商的模型文档报告了模型报告准则中最常要求的项目。然而,在与模型可靠性和公平性相关的报告项目中发现了有待改进的地方。此分析导致了对供应商的反馈,从而为将来的用户更新文档。

简介

尽管在诸如接收器工作特征(AUROC)曲线下面积等指标上具有良好的预测性能,但使用在电子健康记录数据上训练的机器学习模型1指导护理往往没有被证明能以更好的医疗护理、更低的成本或更公平的结果的形式转化为可衡量的临床收益,2-4导致了一个被称为“人工智能鸿沟”的鸿沟。5造成这种鸿沟的一些潜在原因是,目前的模型没有用,467可靠,89还是公平的。10-18然而,预测模型经常被部署在卫生保健环境中,缺乏透明度或独立验证,1920.他们随后的失败偶尔会引起公众的强烈抗议。221-23

遵守模型报告准则是提高可靠性的一种方法,24-28公平,2930.和有用性2531-34临床预测模型。长期以来,报告指南一直被用于评估临床试验的强度,3536观察,37和诊断38研究。关于报告预测模型性能的指南正受到越来越多的关注,包括美国国立卫生研究院,39还有更多的指导方针正在制定中。40-42

然而,关于这些不同指南的重叠覆盖范万博manbetx平台首页围的信息有限,使得社区参与者很难理解应该预期的共同项目集,更不用说在实践中可以报告哪些项目了。因此,文档中经常缺少重要的信息。万博manbetx平台首页例如,一项综述检查了科学文献中描述的164个模型43发现人口统计学变量如种族(36%)和社会经济地位(8%)的报告率较低,外部验证率也较低(12%)。对已发表的COVID-19诊断和预后模型的批判性回顾44发现大多数模型由于报告不佳而存在较高的偏倚风险。

本系统综述的目的是总结临床预测模型报告指南,并描述指南中要求项目的频率。此外,我们评估了通常部署模型的文档是否提供了模型报告准则所要求的信息。万博manbetx平台首页与之前的工作相比,4344我们专注于伴随模型的面向用户的产品文档,这使我们能够分析已经在实践中部署的模型,而不局限于同行评审出版物中描述的模型。万博ManBetX网页此外,我们全面衡量了所有指南中涵盖的每个请求项目的报告率。

方法

我们的分析分为两个阶段。我们首先编译了模型报告准则,并对其进行了总结,以确定它们所要求的独特报告项,并分析了所有准则中要求最多和最少的项目。一个由4个评审人员(j.h.l.、a.c.、b.s.p.和K.E.M.)和1个评审人员(D.D.)组成的团队随后评估了一个模型文档样本,以确定他们报告的项目以及报告中的任何差距。中的eMethods中详细描述了每个阶段,并提供了其他信息万博manbetx平台首页补充.通过评审过程,我们处理了系统评审和元分析的首选报告项目(棱镜)适用于本研究的报告指南。

总结模型报告指南

我们通过PubMed搜索MEDLINE,使用查询机器学习模型卡而且报告机器学习2020年11月4日至12月6日。我们审查了引文以找到更多的出版物。万博ManBetX网页最后,我们排除了没有给出具体模型报告建议的万博ManBetX网页出版物。

然后,我们在这些报告指南中收集了一组可报告的元素,并将相似的元素合并为不同的、具有代表性的项目,以消除重复。例如,“报告模型的预期用户”31以及"描述外部验证策略"24都是独一无二的物品。首先,我们通过检查每个报告准则,包括解释和阐述文档以及AI扩展来确定初始元素集,以验证每个准则的元素都被捕获了。其次,我们审查了每个元素,并使用专家判断,将那些要求相同信息的元素合并到同一项中。万博manbetx平台首页我们记录了每项研究中描述元素的短语,以便能够完整地追溯哪些元素被合并到每个项目中。最后,我们创建了每个项目的一行摘要,以供审阅人员参考补充).

评估现有模型文档中的项目报告

为了评估这组可报告项在面向用户的文档中的使用情况,我们在2021年3月获得了一个方便的模型文档样本。我们审查了1个供应商(Epic Systems Corporation)提供的面向用户的文档(类似于药品包装插入),他们称之为认知计算模型简介(下称示范摘要)(表格1载于补充).每个模型概要都有一个社区采用得分,该得分代表使用特定模型的组织和使用任何模型的组织的比例,并从1到3的范围内取值。我们选择了2021年3月社区采用评分为2或3分的所有模型。社区采用得分为3分的模型简报是退化指数,45败血症的早期发现,46计划外重新入学的风险(版本2)47患者缺席的风险(版本2)48儿科住院和急诊科就诊,49住院或急诊科的风险(第二版)50模型。社区采用的三分之二的模型简报是关于住院患者跌倒风险的,51预计区块利用率,52剩余逗留时间,53心力衰竭住院人数54哮喘住院和急诊科就诊,55和高血压。56请注意,模型概要由供应商定期更新,我们评估了在我们研究时可用的最新版本。

4名审稿人阅读了12份模型摘要中的每一份,并独立评估了它们是否报告了e附录中总结的项目中指定的信息万博manbetx平台首页补充方法中的方法描述补充).具体来说,对于每个项目,每个评审人员首先确定该项目是否适用于模型,如果确定适用,则是否报告该项目。例如,“到临床试验注册的链接”这一项被确定为不适用于文档不打算描述临床试验的模型。审稿人的具体评估都是可用的(附录补充).审查员然后决定示范摘要是否报告了项目中要求的信息,记录示范摘要中支持他们决定的相关部分。万博manbetx平台首页审稿人是信息学专家(J.H.L.和A.C.)和临床医生(B.J.P.和K.E.M.),他们在我们的学术医疗中心拥有机器学习部署方面的专业知识。

审查员(D.D.)然后审查审查员之间存在分歧的项目,以做出最终决定。裁决者只能从审查员已经选定的选项中进行选择。裁判员也是一名临床医生,在部署机器学习模型方面具有类似的专业知识。的方法中提供了详细的术语和统计计算摘要补充

结果
模型报告准则要求的项目

研究人员对报告准则模型进行了文献检索,结果列出了27种出版物,万博ManBetX网页2529-34384157-74一篇引文综述产生了另外3篇论文。万博ManBetX网页26-28我们排除了没有提供具体模万博ManBetX网页型报告建议的出版物,产生了15个模型报告指南(表1).24-3557-5974-80

这些模型报告准则已在计算机科学刊物(万博ManBetX网页公平、问责和透明问题会议论文集29而且2017年IEEE大数据国际会议论文集25)、生物医学信息学期刊美国医学信息学协会杂志30.NPJ数字医学31而且医学互联网研究杂志57),以及临床刊物(内科学年鉴26757780BMJ3379BMJ开放76自然医学32582474欧洲心脏杂志27《公共科学图书馆·医学》杂志上28NEJM催化剂,34临床流行病学杂志,78国际外科杂志35而且英国外科杂志59).2010年至2015年发布的4份指南被其他文章引用超过1000次,而2019年之后发布的4份指南迄今被其他文章引用不到50次。

在15个报告准则中,11个有如何完成所要求项目的示例。25-2729-31387478-80然而,只有5人展示了一个完整的例子,完成了一个模型的所有项目,2729-3174这些模型中只有一个在医疗系统中得到了实际应用。3181

重复数据删除后,报告指南中要求了220个不同的项目(e附录)补充).的表2列出220个项目与15项报告指引的对照表补充.例如,个人预后或诊断多变量预测模型透明报告(TRIPOD)报告指南有更多要求预处理细节的项目,59而关于临床人工智能建模的最低信息(MI-万博manbetx平台首页CLAIM)则有更多要求模型检查细节的条目。58

表2根据映射到机器学习模型创建和评估的每个阶段的项目数量总结了模型报告指南(Jung等人的图4)7).例如,卡片模型29对模型开发中的公平性贡献最多的项目(n = 29),而模型事实标签(n = 10)31或试验报告综合标准(CONSORT)-AI (n = 10)32为用例评估贡献最多的项目。

表3列出15个报告准则中至少10个所要求的项目。最常要求的项目与任务相关,例如预处理、处理缺失数据、模型性能(包括处理不确定性(例如ci、统计显著性)或AUROC)以及内部验证。共有28个不同的性能指标被要求(表3在补充),包括AUROC、灵敏度、阳性预测值和校准图。

最后,仅1项报告准则就要求77项(表4)补充).其中12项是模型性能指标,例如F得分。ML测试分数有20个与模型部署和监控相关的独特项目,例如模型更新过程。联合体-AI和标准方案项目:介入性试验建议(SPIRIT)-AI总共有21个临床试验特定项目,这些项目大多不适用于Epic系统公司的模型概要。

按示范简报报告项目

评价者之间对项目报告评估的一致性为76%(对于所有审稿人,以及给定模型摘要的每个项目)。在220项中,176项(80%)适用于至少一项示范摘要。其中119项(68%)至少被一种模式简报报道。模型简报报告中位数为39% (IQR, 37%-43%;范围,31%至47%)的适用项目补充).在排除了与绩效指标相对应的项目后——为了避免因没有报告多个几乎冗余的绩效指标而惩罚模型简报——适用项目的中位完成率为43% (IQR, 41%-48%;范围内,33% - -52%)。总体而言,各模型简报的项目报告率中位数为25% (IQR, 0-83%;范围0 - 100%)。

超过90%的模型摘要报告了40个项目(表6)补充).这些通常报告的项目包括关于模型开发和制定的信息,特别是训练数据集、预处理、模万博manbetx平台首页型类型、内部验证和性能指标。这些项目包括报告指引中12项最常要求项目中的9项(表3).所有12个模型概要都报告了以下与用例相关的项目:模型如何在临床护理中使用,谁将使用模型,模型可能影响临床护理的方式,以及使用的基本原理。

少于10%的模型摘要报告了75个项目(表7)补充).这些项目包括缺失的数据统计、预测器和/或结果评估者的盲化、性能测量的可变性(例如ci)、模型系数或大多数预测特征的报告、包括性能误差和交叉子组分析在内的模型检查、面向用户的材料和何时停止使用模型的警告,以及输入数据和模型预测的监测。此外,在要求的28个不同的性能指标中,超过五分之一的模型摘要仅报告了AUROC(100%)、阳性预测值(67%)和敏感性(42%)补充).

通过示范简报遵守完整的报告准则

表4显示对个别报告准则的遵守率,这是模型摘要对每个报告准则所要求的项目的平均完成率。模式报告指南的中位依从率为53% (IQR, 50%-63%;范围内,18% - -74%)。ML测试分数的中位数坚持率最低(18% [IQR, 11%-25%]),而模型事实标签的坚持率最高(74% [IQR, 71%-80%])。在像以前一样剔除绩效指标对应的项目后,坚持率的中位数保持不变,为57% (IQR, 50%-70%;范围内,16% - -73%)。

请求但较少报告的项目

我们确定了15个报告准则中至少4个要求的29个项目,但50%或更少的模型摘要报告了这些项目(表5).这些较少报道的项目中有许多与可靠性测量有关。其中包括外部验证的性能(33%)和模型性能指标的ci或统计意义(0)。关于缺失数据量(8%)和如何处理缺失数据(50%)的统计报告也很低。此外,与公平性相关的项目(例如,数据集代表性和跨子组的表现)的报告较少。这些包括训练数据集关键特征的汇总统计(报告率,50%)或按子组(33%)分解表现。年龄(50%)、性别(33%)和其他相关因素(50%)等人口统计因素既缺乏汇总统计数据,也缺乏分类表现。此外,关于如何将机器学习模型部署到临床工作流程(33%)、模型将有哪些面向用户的材料(0)以及如何更新模型(42%)的指导报告较少。最后,一些与透明度相关的项目较少提供,包括模型系数(8%),谁资助了这项研究(这可能与利益冲突有关)(0),以及如何访问数据集(0)。

讨论

研究界已经发布了许多模型报告指南,其目标是提高预测模型的透明度,以便对部署哪些模型做出明智的决定。然而,在15个报告准则中,共有220个项目被要求,这对模型开发人员来说是负担,对最终用户来说是压倒性的。我们发现,所检查的文档始终报告了这个集合中请求最多的项目,但总体而言,可报告的适用项目的中位数为39%。这种差异强调了迫切需要确定在实践中可行的项目,以及支持部署给定临床预测模型的决定所必需的项目。坚持一个单一的模型报告指南可能是不够的,因为没有一个单一的指南是完全全面的,并且一些项目可能只对某些模型开发社区熟悉,或者只是最近才被认为是相关的。我们的方法根据指南中经常要求的项目和报告中相应的差距确定了模式,为研究团体和模型开发人员提供了以下关于报告模型信息的建议。万博manbetx平台首页

对于模型开发人员,我们建议优先报告最常见的请求项(表3).示范简报在报告这些方面表现出色:12个最常要求的项目中有9个项目的报告率为100%。这些信息包括关于模型开发和使用万博manbetx平台首页的信息,例如结果定义,以及模型打算如何使用。这些通常被要求的项目——往往是关于模型性能的——对于做出部署决策并不总是最重要的,并且不能告诉我们一个模型是否有用。782

这12个通常要求的项目只是指南认为重要的报告的一部分。因此,我们建议额外关注要求但不经常报告的项目(表5),例如与可靠性有关的项目:外部验证、数据缺失和监控。具体示例项目包括外部验证策略、不确定性度量(如ci)、校准图、与基线的性能比较、缺失数据统计和缺失处理策略、如何更新和调优模型,以及用于监控输入数据或新数据中预测质量回归的方法。我们进一步建议报告与公平性(在本解释中,指的是数据集代表性和子组的模型性能)和透明度相关的项目,这些项目也经常被要求但没有被报告(表5).为了公平起见,模型文档应报告按性别、年龄、种族和民族以及其他相关属性的汇总统计数据或分类表现,以及子组和交叉分析的结果。我们承认这是对公平的一种有限的看法(一个专门的学术领域正在更好地定义公平)83这些项必须根据模型的使用方式和数据收集方式进行上下文化。例如,有偏见的结果测量将不会在绩效的亚组分析中浮出水面。6为了透明度,我们建议报告模型系数、模型可重复性、如何访问数据集以及谁资助了研究,这可能与利益冲突的目的有关。尽管演示外部验证的压力越来越大,但考虑到公司必须保护知识产权(如模型架构细节和系数),这些项目很少在文档中报告也就不足为奇了。1984

我们建议研究界直接参与模型开发人员和信息技术人员,以确保发布的建议是可行的,并与部署决策相关。万博manbetx平台首页作为一个积极的进展,基于文章的预印本,与Epic Systems Corporation的数据科学团队的对话导致了对模型概要的更新,包括性能指标的ci,关于所使用的缺失数据imputation策略的信息,以及关于算法类型的附加细节,包括在适用的情况下,用于网格搜索的参数和惩罚类型。万博manbetx平台首页478586这样的交互,但是在更大的范围内发生,对于通过确保开发人员提供关于他们的模型的最相关和最必要的信息来弥合实现差距是必要的。万博manbetx平台首页

因为许多模型报告准则29-313458为了支持模型开发人员和用户,我们认为建议适用于模型概要,需要一个双向对话的开放论坛。的表格2及e附录补充,我们将220个条目按任务分组,以便能够讨论哪些附加条目是相关的。最后,我们建议部署团队使用项目作为检查表,以确保模型开发、有用性、工作流能力和可靠性监控中的质量25并且团队在项目启动时审查项目。87

限制

这项研究有几个关键的局限性。首先,我们只分析了来自单一供应商Epic Systems Corporation的模型文档。其他供应商的模型文档,如Cerner患者量模型,88也可以通过这个框架进行分析。此外,为了尊重版权,我们不能发布我们的审稿人在报告项目时用来证明的模型概要的部分。此外,尽管审稿人是独立工作的,但未来的工作可以改进我们的裁决过程。76%的评级者认为有改善报告的机会。在所有模式摘要中缺乏共识的项目(表8)补充)通常需要主观判断,例如,如果模型摘要不是一项研究,某些项目是否适用(例如,“描述参与者是如何被招募到数据中的”或“描述用于收集数据的研究设计”)。另一些则涉及到对什么样的报告是充分的判断,比如“讨论这项研究的局限性和注意事项。”评估报告依从性的方法可以通过第三方审查员的更细粒度的规则(例如,“部分提供”或“不知道”类别)变得更加一致和具体。

我们的发现应谨慎解释,因为我们的重复数据删除过程可能会掩盖指南之间的某些差异(例如,一些指南提供了明确的说明和示例,而其他指南仅要求报告)。我们还警告不要过度解读所有物品的完成率,因为物品不是可交换的实体。“缺失数据统计”和“敏感性”这两个项目提供不同的信息,因此我们建议在可能的情况下考虑单个项目的完成。万博manbetx平台首页此外,我们无法直接评估哪些项目对制定部署决策有用,因此并不是每个项目对报告都同样重要。最后,为了提供报告质量的上限,审查员被告知,在他们不确定如何对特定项目进行评分的情况下,最好确认该项目已得到解决。例如,对于简单地表示要联系支持代表以验证模型的语句,我们给予了“描述在部署之前如何在新设置中测试模型”的信任。

结论

已经制定了模型报告指南,以确保部署的临床预测模型是可靠和公平的。虽然已经发表了许多,但据我们所知,它们还没有被收集和分析。在这项研究中,我们从15个报告指南中汇编了可报告的项目,发现指南总共要求220个不同的项目。如此广泛的项目共同为模型开发人员带来了巨大的报告负担。为了提供已部署模型报告质量的快照,我们检查了来自一个广泛使用的健康状况供应商的12个最广泛采用的模型。我们发现文档报告了最常请求的项目。但是,文档可以提供更多关于可靠性、透明度和公平性的信息。万博manbetx平台首页与供应商的直接接触导致了对未来用户文档的改进。总的来说,需要更好地确定医疗保健预测模型报告项目的优先级,从而有助于就部署哪些模型做出明智的决定。

回到顶部
条信息万博manbetx平台首页

接受出版:2022年7月4日。

发表:2022年8月19日。doi:10.1001 / jamanetworkopen.2022.27779

开放:这是一篇开放获取的文章,根据CC-BY许可证.©2022卢建华等。狗万体育下载地址JAMA网络开放

通讯作者:Jonathan H. Lu, MS,斯坦福大学医学院生物医学信息研究中心,121校区博士,ap1316a,斯坦福,CA 94305 (jhlu@stanford.edu).

作者的贡献:陆先生可以完全访问研究中的所有数据,并对数据的完整性和数据分析的准确性负责。卡拉汉、帕特尔和莫尔斯博士对这项工作做出了同样的贡献。

概念及设计:卢,帕特尔,普费弗,沙阿。

数据的获取、分析或解释:陆,卡拉汉,帕特尔,莫尔斯,达什。

文稿起草:陆,卡拉汉,达什。

对重要知识内容的手稿的批判性修订:所有作者。

统计分析:陆,卡拉汉。

支持:行政、技术或物质上的支持:菲沙。

监督:Callahan, Pfeffer, Shah。

利益冲突披露:Patel博士报告了谷歌LLC的雇佣情况和Alphabet的所有权股权,这发生在首次提交这项工作之后。没有其他披露的报道。

资金/支持:这项研究得到了斯坦福大学医学院MedScholars的资助(Lu先生)和斯坦福医疗保健人工智能医学项目的支持,该项目由Debra和Mark Leslie以及医学院和斯坦福医疗保健部门的捐赠资助。

资助者/发起人的角色:发起人在研究的设计和实施中没有任何作用;数据的收集、管理、分析和解释;手稿的准备、审查或批准;并决定将手稿提交出版。

额外的贡献:Scott Fleming, BS(斯坦福大学生物医学数据科学系),李思云,BASc(斯坦福大学医学院生物医学信息研究中心),Arjun Gokhale, MD(斯坦福大学医学系),Wui Ip, MD(斯坦福大学医学院儿科系),Lillian Sung, MD, PhD(加拿大多伦多儿童医院),Ron Li, MD(医院医学部),斯坦福大学医学院)提供了项目反馈和指导。Shah实验室和斯坦福医学技术与数字解决方案数据科学团队的成员提供了创意和反馈。Stephen Pfohl博士(斯坦福大学医学院生物医学信息研究中心)提供了读者的反馈。这些合作者没有因为他们对这个项目的支持而获得经济补偿。最后,Alejandro Muñoz del里约热内卢,博士;香农·根特-尼登,马萨诸塞州;保罗·索班斯基,胡扯;Stephen Dove, ScM;马特·温克曼,BS; Canna Heibel, BS; Christina Miles, BS; and Seth Hain, MS, from the Epic Systems data science team provided a constructive conversation after this study’s preprint regarding areas to improve their documentation, which led to the stated revisions to their Model Briefs as well as corrections for 2 items’ grading for 1 model brief (that did not change the overall results and conclusions of the manuscript). They did not receive financial compensation for their support for this project.

附加信息:万博manbetx平台首页的e附录补充包含用于方法的所有数据和代码,包括指南的合并、项目的重复删除、将项目映射到模型开发和任务的阶段、模型概要的分级、裁决和分析,包括“项目摘要”表上每个项目的报告率。

参考文献
1.
王志强,王志强,王志强,等。可扩展和精确的深度学习与电子健康记录。NPJ数字医院.2018;一18。doi:10.1038 / s41746 - 018 - 0029 - 1PubMed 谷歌学者 Crossref
2.
张志刚,张志刚,张志刚;分析用于管理人口健康的算法中的种族偏见。科学.2019, 366(6464): 447 - 453。doi:10.1126 / science.aax2342PubMed 谷歌学者 Crossref
3.
Saria s *, Butte a *, Sheikh a *。通过机器学习更好的医疗:什么是真实的,什么是人造的?科学硕士.2018; 15 (12): e1002721。doi:10.1371 / journal.pmed.1002721PubMed 谷歌学者 Crossref
4.
伊曼纽尔j;医疗保健领域的人工智能:价值会与炒作相匹配吗?《美国医学会杂志》.2019; 321(23): 2281 - 2282。doi:10.1001 / jama.2019.4914PubMed 谷歌学者 Crossref
5.
白杨。高性能医学:人与人工智能的融合。Nat地中海.2019; 25(1): 44-56。doi:10.1038 / s41591 - 018 - 0300 - 7PubMed 谷歌学者 Crossref
6.
奥伯梅耶;人工智能和机器学习的应用正在增加,但非理性繁荣仍然存在。NEJM的催化剂.2019年12月10日在线发布。doi:10.1056 / CAT.19.1090谷歌学者 Crossref
7.
张志强,张志强,张志强,等。使预测模型在实践中有用的框架。美国医学信息协会.2021年,28(6):1149 - 1158。doi:10.1093 /地点/ ocaa318PubMed 谷歌学者 Crossref
8.
Beam al_, Manrai ak_, Ghassemi m_。医疗保健领域机器学习模型再现性面临的挑战《美国医学会杂志》.2020, 323(4): 305 - 306。doi:10.1001 / jama.2019.20866PubMed 谷歌学者 Crossref
9.
马西尼·梅,威彻尔·d,萨达尼·伊斯拉尼·s;医疗保健中的人工智能:来自美国国家医学科学院的一份报告。《美国医学会杂志》.2020, 323(6): 509 - 510。doi:10.1001 / jama.2019.21579PubMed 谷歌学者 Crossref
10.
Gianfrancesco ma_, Tamang s_, Yazdany j_, Schmajuk g_。使用电子健康记录数据的机器学习算法中的潜在偏差。美国医学会实习生.2018, 178(11): 1544 - 1547。doi:10.1001 / jamainternmed.2018.3763PubMed 谷歌学者 Crossref
11.
保罗斯jk;可预见的不平等:理解和解决算法临床预测可能增加健康差距的问题。NPJ数字医院.2020; 3:99。doi:10.1038 / s41746 - 020 - 0304 - 9PubMed 谷歌学者 Crossref
12.
拉杰科玛a *,哈特m *,豪威尔md*,科拉多g_ *,秦mh *。确保机器学习的公平性,促进卫生公平。实习医生.2018, 169(12): 866 - 872。doi:10.7326 / m18 - 1990PubMed 谷歌学者 Crossref
13.
帕瑞克rb;解决医疗保健领域人工智能的偏见问题。《美国医学会杂志》.2019; 322(24): 2377 - 2378。doi:10.1001 / jama.2019.18058PubMed 谷歌学者 Crossref
14.
Coley ry_, Johnson e_, Simon ge_, Cruz m_, Shortreed sm_。心理健康访问后自杀死亡预测模型表现的种族/民族差异JAMA精神病学.2021, 78(7): 726 - 734。doi:10.1001 / jamapsychiatry.2021.0493PubMed 谷歌学者 Crossref
15.
朴艳*,胡娟*,辛格*,等。产后抑郁症临床预测模型中降低偏倚方法的比较。美国医学会网络公开赛.4 (4): e213909。2021;doi:10.1001 / jamanetworkopen.2021.3909PubMed 谷歌学者 Crossref
16.
刘刚,陈志勇,陈志强,陈志强,陈志强。CheXclusion:深胸x线分类器的公平性差异。Pac Symp Biocomput.2021; 26:232 - 243。PubMed 谷歌学者
17.
张志强,张志强,等。通过改进亚种群校准来解决预测模型中的偏差。美国医学信息协会.28 2021;(3): 549 - 558。doi:10.1093 /地点/ ocaa283PubMed 谷歌学者 Crossref
18.
Pfohl sr#, Foryciarz a#, Shah nh#。公平机器学习用于临床风险预测的实证描述。J生物医学信息.2021; 113:103621。doi:10.1016 / j.jbi.2020.103621PubMed 谷歌学者 Crossref
19.
Khetpal v;一个基本上未经测试的人工智能算法是如何潜入数百家医院的。2021年5月28日。2021年6月25日访问。https://www.fastcompany.com/90641343/epic-deterioration-index-algorithm-pandemic-concerns
20.
吴娥*,吴康*,丹内杰*,欧阳丹*,何德*,邹娟*。如何评估医疗人工智能设备:FDA批准分析的限制和建议。Nat地中海.27 2021;(4): 582 - 584。doi:10.1038 / s41591 - 021 - 01312 - xPubMed 谷歌学者 Crossref
21.
色狼c;当算法削减你的医疗保险时会发生什么?边缘.2018年3月21日。2021年6月2日访问。https://www.theverge.com/2018/3/21/17144260/healthcare-medicaid-algorithm-arkansas-cerebral-palsy 谷歌学者
22.
路透e7;研究人员发现,流行的败血症预测模型比声称的“差得多”。MedCity新闻。2021年6月23日。2021年6月28日访问。https://medcitynews.com/2021/06/popular-sepsis-prediction-model-works-substantially-worse-than-claimed-researchers-find/
23.
王志强,王志强,王志强,等。在住院患者中广泛实施的专有败血症预测模型的外部验证。美国医学会实习生.2021, 181(8): 1065 - 1070。doi:10.1001 / jamainternmed.2021.2626PubMed 谷歌学者 Crossref
24.
张志刚,张志刚,张志刚,等。风险预测模型,II:外部验证、模型更新和影响评估。.2012, 98(9): 691 - 698。doi:10.1136 / heartjnl - 2011 - 301247PubMed 谷歌学者 Crossref
25.
张晓明,王晓明,王晓明,王晓明,王晓明。机器学习测试分数:机器学习生产准备和技术债务减少的一个指标。2017年IEEE大数据国际会议论文集.2017年12月11-14日:1123-1132。doi:10.1109 / BigData.2017.8258038
26.
张文敏,张文敏,张文敏,等。PROBAST:评估偏倚风险和预测模型研究适用性的工具:解释和阐述。实习医生.2019年,170 (1):W1-W33。doi:10.7326 / m18 - 1377PubMed 谷歌学者 Crossref
27.
Steyerberg ewa, Vergouwe y;迈向更好的临床预测模型:开发的七个步骤和验证的ABCD。Eur Heart J.2014; 35(29): 1925 - 1931。doi:10.1093 / eurheartj / ehu207PubMed 谷歌学者 Crossref
28.
张文杰,张文杰,张文杰,等。预测模型研究系统回顾的关键评估和数据提取:CHARMS检查表。科学硕士.2014; 11 (10): e1001744。doi:10.1371 / journal.pmed.1001744PubMed 谷歌学者 Crossref
29.
马晓明,吴珊[,张晓明],等。用于模型报告的模型卡。:公平、问责和透明问题会议论文集.计算机协会;2019年1月29日。
30.
Hernandez-Boussard t_, Bozkurt s_, Ioannidis jpa_, Shah nh_。MINIMAR(医疗人工智能报告最万博manbetx平台首页低信息):制定医疗保健人工智能报告标准。美国医学信息协会.2020; 27(12): 2011 - 2015。doi:10.1093 /地点/ ocaa088PubMed 谷歌学者 Crossref
31.
桑达克mpa,高明m,布拉杰n,巴鲁s;用模型事实标签向临床最终用户展示机器学习模型信息。万博manbetx平台首页NPJ数字医院.2020; 3:41。doi:10.1038 / s41746 - 020 - 0253 - 3PubMed 谷歌学者 Crossref
32.
刘鑫[,Cruz Rivera s], Moher d], Calvert mj], Denniston ak[;SPIRIT-AI和consortium - ai工作组。涉及人工智能干预的临床试验报告报告指南:consortium - ai扩展。Nat地中海.2020; 26(9): 1364 - 1374。doi:10.1038 / s41591 - 020 - 1034 - xPubMed 谷歌学者 Crossref
33.
里维拉sc#,刘鑫#,陈aw#, Denniston ak#, Calvert mj #;SPIRIT-AI和consortium - ai工作组。涉及人工智能干预的临床试验方案指南:SPIRIT-AI扩展BMJ.2020; 370: m3210。doi:10.1136 / bmj.m3210PubMed 谷歌学者 Crossref
34.
张志刚,张志刚,张志刚;支持人工智能的临床决策支持软件:临床医生的“信任和价值清单”。NEJM的催化剂.2020; 1(6)。doi:10.1056 / CAT.20.0212谷歌学者 Crossref
35.
Schulz kf, Altman dga, Moher d;配偶。CONSORT 2010声明:报告平行组随机试验的更新指南。国际外科.2011; 9(8): 672 - 677。doi:10.1016 / j.ijsu.2011.09.004PubMed 谷歌学者 Crossref
36.
陈华*,Tetzlaff jm *, Altman dg*, Dickersin k *, Moher d *。SPIRIT 2013:临床试验方案内容的新指南。《柳叶刀》.2013, 381(9861): 91 - 92。doi:10.1016 / s0140 - 6736 (12) 62160 - 6PubMed 谷歌学者 Crossref
37.
冯·埃尔姆e *,阿尔特曼dg*,艾格m*,波考克sj*, Gøtzsche pc*,范登布鲁克jp*;斯特罗布的倡议。加强流行病学观察性研究的报告(STROBE)声明:报告观察性研究的指南。BMJ.2007, 335(7624): 806 - 808。doi:10.1136 / bmj.39335.541782.ADPubMed 谷歌学者 Crossref
38.
张志刚,张志刚,张志刚,等;标准组。标准2015:报告诊断准确性研究的基本项目的更新列表。BMJ.2015; 351: h5527。doi:10.1136 / bmj.h5527PubMed 谷歌学者 Crossref
39.
张志刚,张志刚;人工智能工作组更新。人工智能谘询委员会人工智能工作小组:署长谘询委员会第119次会议。2019年12月13日。2021年6月24日访问。https://acd.od.nih.gov/documents/presentations/12132019AI.pdf
40.
DECIDE-AI指导小组。DECIDE-AI:新的报告指南,以弥合临床人工智能的开发与实施差距。Nat地中海.2021年,27(2):186 - 187。doi:10.1038 / s41591 - 021 - 01229 - 5PubMed 谷歌学者 Crossref
41.
Collins gs;人工智能预测模型报告。《柳叶刀》.2019, 393(10181): 1577 - 1579。doi:10.1016 / s0140 - 6736 (19) 30037 - 6PubMed 谷歌学者 Crossref
42.
张志强,张志强,张志强,等。为评估人工智能干预措施的诊断准确性研究制定具体的报告指南:标准-人工智能指导小组Nat地中海.2020年,26(6):807 - 808。doi:10.1038 / s41591 - 020 - 0941 - 1PubMed 谷歌学者 Crossref
43.
张志刚,张志刚,张志刚,等。在使用电子健康记录的机器学习模型中报告人口数据和代表性。美国医学信息协会.2020; 27(12): 1878 - 1884。doi:10.1093 /地点/ ocaa164PubMed 谷歌学者 Crossref
44.
韦南斯,范·卡尔斯特,张志强,等。COVID-19诊断和预后预测模型:系统综述和关键评价。BMJ.2020; 369: m1328。doi:10.1136 / bmj.m1328PubMed 谷歌学者 Crossref
45.
史诗系统公司。认知计算模型简介:退化指数。2021年1月8日。2021年3月8日访问。68年https://galaxy.epic.com/?浏览/页= 1 ! ! 50 !3883949
46.
认知计算模型简介:败血症的早期检测。史诗系统公司2016年12月13日。2021年3月8日访问。68年https://galaxy.epic.com/?浏览/页= 1 ! ! 50 !3289911
47.
史诗系统公司。认知计算模型简介:计划外再入院的风险(版本2)。2020年5月3日。2021年3月8日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=100051822
48.
史诗系统公司。认知计算模型简介:患者缺席的风险(版本2),2021年1月29日。2021年3月8日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=100020266
49.
史诗系统公司。认知计算模型简介:儿科住院和急诊科就诊。2018年3月31日。2021年3月8日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=3763630&Version=Epic%202018
50.
史诗系统公司。认知计算模型简介:入院或急诊科就诊的风险(版本2)。2020年5月1日。2021年3月8日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=100045918
51.
史诗系统公司。认知计算模型简介:住院患者跌倒风险。2020年9月2日。2021年4月13日访问。68年https://galaxy.epic.com/?浏览/页= 1 ! ! 50 !100014430
52.
史诗系统公司。认知计算模型简介:预测块利用率。2018年8月29日。2021年4月13日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=100014389
53.
史诗系统公司。认知计算模型简介:剩余停留时间。2017年4月7日。2021年4月13日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=3364171&Version=Epic%202018
54.
史诗系统公司。认知计算模型简介:心力衰竭住院。2017年11月1日。2021年4月13日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=3706332&Version=Epic%202018
55.
史诗系统公司。认知计算模型简介:哮喘住院和急诊科就诊。2017年8月29日。2021年4月13日访问。https://galaxy.epic.com/Redirect.aspx?DocumentID=3587370
56.
史诗系统公司。认知计算模型简介:高血压。2016年12月13日。2021年4月13日访问。68年https://galaxy.epic.com/?浏览/页= 1 ! ! 50 !3479172
57.
罗伟,冯丹,陈涛,等。生物医学研究中开发和报告机器学习预测模型的指南:多学科观点。J医疗互联网服务.2016; 18 (12): e323。doi:10.2196 / jmir.5870PubMed 谷歌学者 Crossref
58.
诺格特bj],奎尔ger], beaulieue - jones bk],等。关于临床人工智能万博manbetx平台首页建模的最低信息:MI-CLAIM检查表。Nat地中海.2020; 26(9): 1320 - 1324。doi:10.1038 / s41591 - 020 - 1041 - yPubMed 谷歌学者 Crossref
59.
Collins gs2, Reitsma jb3, Altman dg2, Moons kgm3。个体预后或诊断的多变量预测模型的透明报告(TRIPOD): TRIPOD声明。Br J外科.2015, 102(3): 148 - 158。doi:10.1002 / bjs.9736PubMed 谷歌学者 Crossref
60.
王晓明,王晓明,等。克服在临床护理中采用和实施预测建模和机器学习的障碍:我们可以从美国学术医疗中心学到什么?JAMIA开放.2020; 3(2): 167 - 172。doi:10.1093 / jamiaopen / ooz046PubMed 谷歌学者 Crossref
61.
肯特dm_,保卢斯j_,范克拉维伦d_,等。治疗效果异质性的预测方法(PATH)声明。实习医生.2020年,172(1):35 - 45。doi:10.7326 / m18 - 3667PubMed 谷歌学者 Crossref
62.
于彬,Kumbier k;验证数据科学。美国国立自然科学研究院.2020, 117(8): 3920 - 3929。doi:10.1073 / pnas.1901326117PubMed 谷歌学者 Crossref
63.
制定报告人工智能在临床试验中的使用的指导方针。Nat地中海.2020; 26(9): 1311。doi:10.1038 / s41591 - 020 - 1069 - zPubMed 谷歌学者 Crossref
64.
柳叶刀数字健康。指导更好地设计和报告人工智能干预试验。柳叶刀手指健康.2020; 2 (10): e493。doi:10.1016 / s2589 - 7500 (20) 30223 - 5PubMed 谷歌学者 Crossref
65.
陈志强,陈志强,陈志强,等。评估来自自动化电子健康记录管道的外科真实数据的质量。J Am Coll外科医生.2020, 230 (3): 295 - 305. - e12汽油。doi:10.1016 / j.jamcollsurg.2019.12.005PubMed 谷歌学者 Crossref
66.
维诺特tc[,张志强;良好的意图是不够的:信息学干预会加剧不平等。美国医学信息协会.2018; 25(8): 1080 - 1088。doi:10.1093 /地点/ ocy052PubMed 谷歌学者 Crossref
67.
本德;用于自然语言处理的数据陈述:旨在减轻系统偏差并实现更好的科学。Trans协会计算语言学家.2018; 6:587 - 604。doi:10.1162 / tacl_a_00041谷歌学者 Crossref
68.
张志强,张志强,张志强,等。用于数据集的数据表。arXiv.预印本于2018年3月23日在线发布。doi:10.48550 / arXiv.1830.09010 谷歌学者
69.
韦南思,王志强,王志强,王志强。揭开医疗领域人工智能的神秘面纱。BMJ.2020; 370: m3505。doi:10.1136 / bmj.m3505PubMed 谷歌学者 Crossref
70.
Eaneff s_, Obermeyer z_, Butte aj_;人工智能和机器学习技术的算法管理案例。《美国医学会杂志》.2020; 324(14): 1397 - 1398。doi:10.1001 / jama.2020.9371PubMed 谷歌学者 Crossref
71.
马志强,陈艳,王晓明,等。人工智能与临床医生:深度学习研究的设计、报告标准和声明的系统回顾。BMJ.2020; 368: m689。doi:10.1136 / bmj.m689PubMed 谷歌学者 Crossref
72.
王晓明,王晓明,等。无害:负责任的机器学习在医疗保健领域的路线图Nat地中海.2019; 25(9): 1337 - 1340。doi:10.1038 / s41591 - 019 - 0548 - 6PubMed 谷歌学者 Crossref
73.
朴艳* *,陈建平* *,马福曼* *,郭恩恩* *,胡娟* *,达斯* * *。评估医学中的人工智能:临床研究阶段。JAMIA开放.2020; 3(3): 326 - 331。doi:10.1093 / jamiaopen / ooaa033PubMed 谷歌学者 Crossref
74.
张文敏,张志强,张志强,等。风险预测模型,I:开发、内部验证和评估新(生物)标记物的增量价值。.2012, 98(9): 683 - 690。doi:10.1136 / heartjnl - 2011 - 301246PubMed 谷歌学者 Crossref
75.
陈志伟,陈志伟,陈志伟,等。SPIRIT 2013声明:定义临床试验的标准方案项目。实习医生.2013, 158(3): 200 - 207。doi:10.7326 / 0003-4819-158-3-201302050-00583 PubMed 谷歌学者 Crossref
76.
陈志强,张志强,张志强,等。报告诊断准确性研究的标准2015指南:解释和阐述。BMJ开放.2016; 6 (11): e012799。doi:10.1136 / bmjopen - 2016 - 012799 PubMed 谷歌学者 Crossref
77.
王志强,王志强,等;PROBAST集团。PROBAST:评估偏倚风险和预测模型研究适用性的工具。实习医生.2019年,170(1):51-58。doi:10.7326 / m18 - 1376 PubMed 谷歌学者 Crossref
78.
张志强,张志强,等;综合标准报告试验小组。CONSORT 2010解释和阐述:报告平行组随机试验的更新指南。临床流行病学.2010年,63 (8):e1-e37。doi:10.1016 / j.jclinepi.2010.03.004PubMed 谷歌学者 Crossref
79.
陈晓峰,王晓峰,王晓峰,等。SPIRIT 2013解释和阐述:临床试验方案指南。BMJ.2013; 346: e7586。doi:10.1136 / bmj.e7586PubMed 谷歌学者 Crossref
80.
张文敏,张志强,张志强,等。个体预后或诊断(TRIPOD)的多变量预测模型的透明报告:解释和阐述。实习医生.2015年,162 (1):W1-W73。doi:10.7326 / m14 - 0698PubMed 谷歌学者 Crossref
81.
杜克健康创新研究所。脓毒症观察:实施杜克特定的脓毒症早期预警系统。2020年1月18日。2021年7月2日访问。https://dihi.org/project/sepsiswatch/
82.
王志强,王志强,王志强。使机器学习模型在临床上有用。《美国医学会杂志》.2019; 322(14): 1351 - 1352。doi:10.1001 / jama.2019.10306PubMed 谷歌学者 Crossref
83.
ACM公平、问责和透明会议(ACM FAccT)。2021年6月1日。2021年7月2日访问。https://facctconference.org/index.html
84.
罗斯。Epic的人工智能算法受到公司防火墙的保护,无法进行审查,因此提供了关于重症患者的不准确信息。万博manbetx平台首页2021年7月26日。访问时间为2022年1月31日。https://www.statnews.com/2021/07/26/epic-hospital-algorithms-sepsis-investigation/
85.
史诗系统公司。认知计算模型简介。计划外风险:再入院(第二版)。2021年8月11日。访问时间为2022年5月31日。68年https://galaxy.epic.com/?浏览/页= 1 ! ! 50 !100051822
86.
史诗系统公司。认知计算模型简介。患者缺席的风险(第二版)。2022年2月27日。访问时间为2022年5月31日。68年https://galaxy.epic.com/?浏览/页= 1 ! ! 50 !100020266
87.
Jimmerson C。A3解决医疗保健问题:消除浪费的实用方法.生产力的新闻;2007.
88.
ORACLE欧洲核子研究中心。从诊断到整体病人护理,机器学习正在改变医疗保健。2019年10月21日。访问时间为2022年1月24日。https://www.cerner.com/perspectives/machine-learning-is-transforming-health-care
×
Baidu
map