机器学习的发展势头(ML)算法,利用统计方法来学习有用的模式从数据输入前卫生保健COVID-19流行创造了很高的期望为卫生保健在大流行期间的贡献。然而,这些预期在很大程度上未实现,除了几个显著的成功。这种观点反映了潜在的原因,提出了转变的方法从被动到主动的ML释放其潜能。
每一步的传统ML工作流对人类专家输入,而主动毫升有2个关键周期特性(级别1)和完善上游工程自动化数据收集/准备(2级)(图)。最近采用深度学习在卫生保健研究已开始启用自动化特性学习1对完成一级周期。然而,2级主动毫升发展解决方案需要在高度动态的情况下如大流行。
在大流行期间,数以百计的映像的ML模型已经开发出来。然而,几乎没有任何模型取得了广泛的临床使用COVID-19检测或预测由于几个问题,2包括数据偏差(培训毫升小样本量不足人口覆盖率),数据转移(不匹配的训练和部署数据集,尤其是在大流行扩大到其他人群和卫生保健系统),和方法论的限制(俯瞰数据问题,比如没有验证的数据从一个机构不同的ML算法开发)。除了大流行,数据偏差和转移问题广泛出现在动态医疗场景和导致逐步表现不佳的ML算法,3需要积极的缓解策略。
尤其是成功的例子之一毫升流感大流行期间使用强化学习目标更有效COVID-19测试为旅行者进入希腊。4观察群体流行病学指标不确定无症状感染旅行者,调查人员收集traveler-specific特性,包括年龄,性别,和旅行史,分层 084 954旅客到风险具有较高分辨率的表型不仅仅是原产国。强化学习系统(称为伊娃)分配稀缺的聚合酶链反应(PCR)检测最大化检测无症状感染游客在这些测试(剥削),并自动提供反馈,使希腊目标数据收集,提高风险评估精度undersampled组(探索)。强化学习系统测试效率提高2到4次高峰旅游相比,随机测试和了解希腊的政策“灰色清单“高风险国家要求旅行者从他们提供的证据- PCR检测结果之前到达希腊。4
相对于其他毫升经历了数据偏差和转移问题的应用程序,2希腊系统经历了成功,可以部分归因于完成二级循环利用强化学习指导上游有针对性的数据收集。系统排列要增加透明度的可解释性和采用(例如,说明大CIs通信时需要测试目标旅行者集团[探究])。开发测试关注短期回报的当前的高危人群将失败当新的高风险群体出现,需要持续的探索为长期利益的战略分配测试增加采样率和改善风险评估的新团体。动态平衡exploitation-exploration目标指导持续的有针对性的数据收集使二级强化学习一个有前途的候选人主动毫升。
尽管卫生保健已开始采用一级主动毫升,1向二级可能开辟新的途径。例如,传统的临床试验是昂贵的和经常需要大样本的大小,使其起始和完成等快速变化的医疗条件特别具有挑战性的大流行。一种新兴的自适应平台试验在大流行期间吸引了越来越多的关注。随机、嵌入式、多因子的自适应平台(重新映射)最初建立了社区获得性肺炎是旋转进行试验多种COVID-19治疗同时展示出了有前景的结果叫和sarilumab危重病人。5在重新映射,随着临床证据和知识的发展,response-adaptive随机优先随机患者最有前途的新兴的干预措施。5机器学习算法可以预测哪些病人可能受益于被包含在替代和新的治疗组和帮助指导response-adaptive随机化。
自适应平台的动态特性试验和物流的限制(如有限样本大小)呼吁针对病人招聘和数据收集。2级主动毫升可以满足这些需求,提高审判效率,类似于希腊的目标边界PCR检测。提高审判效率加快发现很重要,即使再交换,最终结论干预可能达到比理想后由于竞争的干预措施和发展知识(例如,徒劳的危重病人康复的等离子体在器官支持自由的日子只有18个月后进入大流行就非常明显6)。
2级主动毫升还使增广数据准备,特别是对于否则很难提取信息。万博manbetx平台首页例如,了解慢性COVID-19后遗症的发展越来越多的患者(特别是门诊),结构化数据捕捉难以充分描述新的症状和发现。围绕COVID-19后遗症的关键万博manbetx平台首页信息大多来自patient-authored文本(例如,消息/讨论病人门户网站/论坛),这不是分析做好准备。利用patient-authored文本,传统方法依靠人工审查尺度是劳动密集型的,困难的。自然语言处理模式可以识别症状被医生从patient-authored文本和收获重要临床变量随着时间的推进以证据为基础的研究。7这样的提取的数据可能添加到描述慢性COVID-19后遗症,提高监测小说或新兴的表现。自然语言处理有潜力集思广益,病人的角度进入2级反馈回路,以增加数据准备和完善下游分析,包括探索患者亚组有更多的一致的临床轨迹和创建可计算表型定义COVID-19后遗症。
毫升的有限的贡献解决COVID-19及时复审流感大流行期间的最佳实践和在未来。大流行,服务员需要适应快速发展的医疗景观,作为一个压力测试毫升。理解成功和未实现的机会不仅突出了底层数据的非代表性问题,也揭示了需要从被动向主动毫升。这种新方法可以减轻数据问题的潜在影响毫升挑战和不断发展的条件下,允许毫升与数据和有意义的共同进化影响更多的卫生保健决策和政策。
通讯作者:元罗博士的健康和生物医学信息学,预防医学,西北大学Feinberg医学院750 N博士湖滨,11 - 189,芝加哥,60611 (yuan.luo@northwestern.edu)。
网上发表:2022年1月27日。doi:10.1001 / jama.2021.24935
利益冲突的披露:罗博士报道收到美国国立卫生研究院拨款(U01TR003528和R01LM013337)。没有其他信息披露报告。
额外的贡献:我们感谢贾斯汀Starren,医学博士,卫生部门和生物医学信息学,预防医学,西北大学Feinberg医学院和Sadiya汗,医学博士,女士,心脏病,医学系,预防医学系,西北大学Feinberg医学院对他们有用的反馈,他们没有补偿。
5。
Mouncey公关戈登•AC, Al-Beidh F,等;REMAP-CAP调查员。白细胞介素- 6受体拮抗剂Covid-19危重患者。
N拉米夫地中海。2021;384 (16):1491 - 1502。
PubMed
谷歌学术搜索