要点
问题可以手枪采购记录,加上机器学习技术,用于预测枪支自杀风险?
发现在这个预后研究将近200万人的手枪事务记录、交易分类中风险最高的5%,接近40%的人与一位买家1年内死于枪支自杀。与一个随机森林中少量的交易评分为0.95及以上,超过三分之二是隶属于一个买家1年内死于枪支自杀35 (24)。
意义这项研究表明,被动地收集行政手枪交易数据可以用来通知根据危险分层有针对性的干预措施。
重要性证据表明,限制获取枪支自杀的高危个体可以预防自杀的有效手段,然而准确地识别这些风险干预仍是一个关键的挑战。武器采购记录可能提供大规模的和客观的数据来源的发展预测枪支自杀风险的工具。
客观的测试是否全州手枪交易记录的数据库,加上机器学习技术,可以用来预测枪支自杀风险。
设计,设定和参与者预后研究使用加州4 976 391手枪的数据库事务记录1 951 006个人从1月1日,1996年,10月6日,2015年。事务级随机森林分类预测枪支自杀风险,实施和特性的相对预测能力通过置换算法估计的重要性。分析从2020年12月1日,5月19日,2022年。
主要结果和措施主要的结果是1年内枪支自杀的武器交易,来自加州死亡记录(1996 - 2016)。使用加州的经销商销售的记录(1996 - 2015),41手枪,交易,买家,社区范围内生成预测变量。
结果总共有4 976 391交易在加州的经销商的销售记录数据库中代表951 006个人(1 525 754人(78.2%的人);平均(SD)的年龄,43.4[13.9]年)。1年内枪支自杀发生在0.07%的手枪交易(3278 2614人之间的交易)。总共有38.6%的观察枪支自杀高危事务分类中泛汰尔(379 983交易),特异性为95%。在随机森林的小的事务数分数高于0.95,超过三分之二(24 35[68.6%])与一位买家有关1年内死于枪支自杀。重要特性包括已知的危险因素,如年龄开始购买,和以前未报告的预测,包括距离枪支经销商和月的购买。
结论和意义这预后研究第一次大规模机器学习个体层面的手枪交易记录的分析。结果显示这些记录识别高危个体的潜在效用来帮助自杀预防工作。它还确定了手枪,个人和社区的特征与枪支自杀,可能有很强的预测关系值得进一步研究。
2020年,47 979美国人死于自杀,24 292年枪支自杀。1枪支是迄今为止最致命的自杀方法,2只占5%的自杀行为,但超过一半的自杀死亡。3大约9 10自杀企图用枪是致命的。3鉴于这种杀伤力,往往冲动自杀企图的本质,火器访问已被确定为一个自杀的主要风险因素4并为预防自杀的干预。5
研究建立了一个清晰的和强大的火器收购和所有权之间的联系和枪支自杀风险。6,7大规模对加利福尼亚州2600万居民的调查研究随访12多年发现,男性拥有手枪是8倍的男人没有自己的手枪死枪自杀;女性手枪业主超过35倍的女性没有自己的手枪死枪自杀。6手枪收购后的第一个30天,手枪所有者的自杀率高出100倍与非所有人相比,这表明收购本身是与高自杀风险有关。
尽管限制枪支个体增加自杀的风险提供了一个关键的挽救生命的机会,准确地识别这些风险仍然是一个关键的挑战。50年的研究的荟萃分析发现的准确性预测自杀企图只是略优于机会。8然而,近年来,随着大规模数据集和计算能力的进步,出现了新的努力,利用机器学习技术来改善预测。9最近的研究使用电子健康记录,10- - - - - -12退伍军人健康数据,13,14和社交媒体的帖子15显示承诺,用机器学习方法通常比临床评估生产更准确和信息预测或传统的回归技术。16,17
枪支交易记录是一个大规模的、客观的和潜在的关键管理数据源,可以用来帮助确定个人枪支自杀的风险。据我们所知,目前的研究是第一次使用这些数据来开发一个机器学习的预测算法。具体来说,我们使用随机森林分类(RF)来测试是否加州的经销商销售的记录(滴)近500万手枪的数据库事务记录1 951 006个人可以用来识别这些风险升高枪支自杀和检查哪些特性是重要的在确定这些预测。
一个完整的描述的数据和分析方法在eMethods提供补充。本研究遵循透明报告个人的多变量预测模型预测或诊断(三脚架)报告准则预测建模18加州大学戴维斯分校,并批准机构审查委员会。知情同意的条件被放弃,因为这是一个主要辅助数据分析鉴定数据带来最小的风险。
我们主要的预测变量产生的累计交易记录为手枪转移从1月1日,1996年,10月6日,2015年。滴记录维护在加利福尼亚司法部自动武器系统数据库。根据加州法律,基本上所有的枪支必须通过许可的枪支零售商,包括私人聚会之间转移,枪支销售显示,礼物,贷款,典当的救赎或委托武器。购买手枪在加州的法定年龄是21年。19详细记录为手枪交易自1996年以来一直在记录和记录长枪始于2014年;因此,我们限制我们的分析手枪。滴记录标识符,包括买家的地址,日期和时间的事务,标识符对卖方来说,枪口径,类型,制作,和模型。
我们确定了枪支自杀死亡(国际疾病分类,第九次修订和国际疾病分类和相关的健康问题,十修订代码X72-X74)的链接购买滴加州公共卫生部门的死亡统计主文件(1996 - 2016),使用概率性匹配的名字,出生日期和性别/性。我们预计1年内枪支自杀的事务。
我们从滴事务数据生成的41个预测变量。一些特性相关的手枪,包括手枪类别(左轮手枪、半自动手枪vs未知);口径,分为小(如点,二十五分,或收),中(例如,38或9毫米)和大型(如.40无误,或.45);和一个指标“廉价”手枪,代理的制造商,选择平均价格在2017年发现蓝皮书枪的价值观。20.
事务特性包括一个二进制指标手枪是否买到枪显示(是的,不,或未知),事务类型(例如,销售,自愿登记、抵押物赎回,或执法收购),和交易状态(批准出售、否认或取消)。我们也计算的数量购买个人在之前1、2、5、10年。我们包括所有个人购买者人口统计变量在滴:性别、种族和民族(美国印第安人,亚洲,亚洲的印度,黑色,柬埔寨,中国,菲律宾,Guamanian,夏威夷,西班牙,日本,朝鲜,老挝,太平洋岛民,萨摩亚人,越南人,白色,其他和未知),出生地(加州和其他地方),和年龄时的事务。
我们地理编码买方和经销商地址来识别相关的人口普查大片和获得社会特征。我们包括几个县级特征与买方的地址和经销商的位置。使用加州死亡统计Masterfile,我们生成了一个县级枪自杀的比率除以总自杀(火器普遍常见的代理)。21我们还包括平均自杀率在县前12个月的月交易和每月移动意味着购买枪支的数量(在案件报道)在过去的12个月里估计当地枪支购买趋势。我们计算之间的距离买方的地址和经销商的位置。最后,为买家和经销商地址,我们包括城乡状态根据美国农业部的城乡连续编码。分析从2020年12月1日,5月19日,2022年。
我们实现了射频分类22事务级数据预测1年内枪自杀。随机森林已被证明是在强劲的分类器23并经常对不平衡数据表现良好。24它已经成功地应用于一系列的上下文,包括犯罪得罪,25,26疾病预测,27和预测自杀意念。15
总之,射频工作通过聚合许多数以百计的分类树,每一个都代表一个递归分区的训练数据。每棵树构建的引导训练数据的示例。创建二叉树分割基于样本的预测变量,随机在每个分区,并选择最好的(即纯粹)分裂。树种植,直到纯度或节点规模达到1。最后,树是聚合创建射频和每个观测接收预测概率或分数基于树的比例分配到积极的类。根据任务,这些分数转换为一个类标签由决策阈值决定。默认阈值是多数决定原则。28
预测枪支自杀的主要挑战是罕见的事件,导致极端的类不平衡。欠采样是一种行之有效的技术来处理不平衡数据,证明改进算法孤立事件信号的能力。29日- - - - - -31日这种方法平衡数据通过减少多数类的大小。我们实现了欠采样在RF算法通过使用引导样本大小相同的每个类(或地层)创建一个平衡数据集每棵树生长。
我们调优2射频参数对训练集:预测变量的数量在每个二进制随机选择分裂和在森林里树木的数量,通过最大化接收操作特性曲线下的面积(AUC)在脱字符号包R,32-86年6.0版本统计计算(R组)。33
我们评估了算法与测试集AUC precision-recall曲线下的面积(AUC-PR)、敏感性,特异性和指标,结合敏感性和特异性上常用的不平衡分类问题34:f值35和Youden索引。36我们也呈现阳性预测值和阴性预测值。
阐明“黑匣子”算法,给出变量重要性措施,提供预测信息对分类精度的贡献。万博manbetx平台首页我们关注意味着精度下降。这种方法排列每个变量和计算精度的差异之前和之后交换(平均超过所有的树木和规范化的SD)的区别。除了总体变量的重要性,我们也存在少数职业专用的重要措施,可用于区分正面和负面的上下文中识别功能不平衡数据。37这些计算基于均值的变化计算错误率仅为观察属于一个特定的类。最后,我们目前夏普利添加剂的解释38,39在eFigures 2到7补充。这些夏普利添加剂的解释有助于进一步确定重要功能的特定的值,预测“推”向一个0或1。
总共有4 976 391滴数据库中的事务(1996 - 2015)代表951 006个人(1 525 754人(78.2%的人);平均(SD)的年龄,43.4[13.9]年)。1年内购买2614独特的个人购买者代表共计3278交易(交易总额的0.07%)死于枪支自杀。
表1比较关键特性与个人相关的事务1年内死于枪支自杀的购买和那些没有。差异注意的交易人员死于枪支自杀左轮手枪包括一个更大的部分购买那些死于枪支自杀(36.4% vs 19.3%),老的意思是(SD)年龄(47.3 [16.9]vs 43.4[13.9]年),一个更高比例的女性(13.6% vs 8.5%),比例白(77.8% vs 69.5%),和更少的意思是(SD)之前的武器购买过去10年(1.6 [4.3]vs 4.9 [13.3])。那些死于枪支自杀有更少的手枪事务;组(683 983)的69.5%和39.3%的其他购买者(585 778 491 933)之前没有交易。
训练集包含3 483 475交易和2295年枪支自杀(0.07%);剩下的测试集是1 492 916交易,其中包括983年枪支自杀(0.07%)。最终的算法与我们的训练数据建立随机选择10预测变量在每个分裂和包含了1001棵树。所有性能指标测试数据报告。
我们的算法AUC是0.81 (95% CI, 0.80 - -0.83);AUC-PR是0.03。默认阈值(0.50)结果的敏感性为0.50,特异性为0.90 (表2)。0.38优化Youden指数和产量的阈值算法的敏感性为0.75,特异性为0.71。最大化的阈值f值(0.90)产生极高的特异性(0.999),但低得多(0.04)的敏感性。最后,阈值为0.57将导致所有实例分类风险最高的5%的枪支自杀。在这种情况下,敏感性为0.39,特异性为0.95,38.6%的观察枪支自杀(379 983)高危泛汰尔与事务相关的分类。eFigure 1补充显示这些指标的值为阈值从0.20到0.99不等。
虽然射频阈值选择了二进制响应(如果高于阈值,如果低于阈值0),它通常可以用于检查原始分数自己和感兴趣的事件的可能性。图1显示生成的预测概率算法排名从最高到最低风险和分成相等的大小图表与观察到的枪自杀的比例在y轴。大约一半(50.9% 983年[500])的所有武器在一年内自杀前2图表预测风险,特异性为90%。该算法更准确在事务被认为非常危险(图2)。例如,超过三分之二(24 35[68.6%])的交易测试集的射频得分0.95及以上被枪支自杀去世与买家在1年之内。交易中得分0.90及以上,296年43(14.5%),后跟一个枪支自杀在1年之内。
图3显示了15个最重要的变量按照重要性,整体和特定的少数类。手枪类别(左轮手枪、半自动或其他),买家种族和民族,购买者年龄和事务的月是最重要的特性。手枪类别和购买者年龄也最少数职业专用功能。其他少数民族职业专用重要特性包括交易的数量在过去的10年里,买方的地址和经销商之间的距离,和普查区的人口比例小于18年。
目前的研究表明,被动地收集个体层面的手枪购买数据可以用来创建适度的枪支自杀风险的预测算法。我们的工作分平衡的权衡和挑战真阳性和假阴性。我们可以获得几乎完美的特异性和阳性预测值较高使用投票门槛更高,但代价是可怜的敏感性。所需的阈值和相应的取舍取决于分类的目的和相关的成本和收益的任何干预风险预测算法可以帮助服务。
一系列可能的干预措施可能被认为与一个算法,如我们已经开发了。例如,枪支交易确认为风险更高的自杀风险信号可能导致枪支经销商向购买者提供自杀预防信息,从而提高项目如枪支商店项目,旨在教枪零售商对自杀的红旗,避免销售枪支自杀的客户。万博manbetx平台首页40,41可能更高的阈值,标记系统可能促使一封来自加利福尼亚司法部的强制性的为期10天的等待期期间购买和火器的拾音器,个别可能一段时间内提供寻求帮助或考虑自杀之前获得枪支。以前的工作表明,在为期10天的等待期其他干预措施可以产生影响:一项随机试验表明,一封信说对法律的制裁违反送到新的枪支买家导致更高的速率枪支被报道偷来的那些收到这封信。42也有研究支持低成本和可伸缩的自杀风险预防工作;举个例子,一个简短的关怀短信发送到军人的风险被认为自杀是可以减少自杀企图和意念。43
在相对较少的交易被视为风险最高,更可观的干预可能被考虑。例如,对于交易成绩在0.90以上(0.02%的交易916年492 [296])或0.95(0.002%的事务[35 916 492 ]),国旗进一步调查考虑类似民事极端的可能性风险保护令(通常称为“红旗”顺序),44法院可以删除或防止枪支持有那些被认为是迫在眉睫的暴力和自残的风险,可以考虑。在这里,更昂贵的干预将贸易灵敏度极高的特异性和阳性预测值较高。研究表明,公民极端风险保护订单可以有效预防自杀工具,估计1生命保存每10-gun 20-gun扣押行动。44,45
机器学习程序,如射频也可以用于识别变量有很强的预测关系,值得进一步研究。46我们发现以前未报告的预测枪支自杀,确认几个已知的危险因素的重要性。购买枪支的类型是最重要的预测枪支自杀(整体和少数职业专用措施重要性),这是一致的结果与最近的一个嵌套病例对照研究表明购买一把左轮手枪(vs半自动手枪)与增加自杀的风险。47半自动手枪比左轮手枪更受欢迎,47,48与更大的弹药容量等特性,可能不是自杀意图的重要个人采购。月购买的一个重要特征。这一发现与许多研究是一致的49和加州死亡记录,发现山峰在春天和初夏(eFigure 8的补充)。购买者的年龄和种族和民族,两个已知的危险因素,也是最重要的功能,符合全民观察自杀率增加与年龄有关,年长的白人中最高的。50
交易的数量在过去的10年是第二个最重要的少数职业专用重要特性。那些死于枪支自杀之前较少购买手枪(表1)。距离枪支经销商也是一个重要的少数职业专用功能。购买者的数据表明,一个更大的份额由枪支自杀去世了更短的距离相对于其他购买者(表1)和短的距离与积极的分类(eFigure 5的概率增加补充)。这一发现可能反映了地理位置的人死于枪支自杀,不同倾向去旅行,或者转学至购物采购与自杀意图。研究表明,酒精出口密度调节可以减少消费的公共卫生是一个有用的工具和相关的危害。51进一步的研究可能会调查枪支经销商距离之间的关系和火器采集和后续的危害。
这项研究有一些局限性。虽然我们的算法显示承诺,但仍然显著改善预测性能的机会。我们只使用行政预测可用的或从手枪生成采购记录。添加数据与指标物质使用或精神疾病,例如,可能会产生更强大的预测。未来的工作也可能考虑的发展阶段的算法在那些被认为风险较高,最近提议。52其他分类算法(如支持向量机53和逻辑回归)54或合奏方法(如超级学习者)55也可以探索提高预测精度,可能无监督异常检测方法。56此外,我们的算法是在交易层面;未来的工作应该考虑个体层面的生存风险预测或重复测量射频方法。57
还有许多的数据限制。滴记录包含缺失和不一致的值;这些不完美的连接和地理编码过程,引入误差和噪声。我们没有记录非法枪支收购或长杆枪收购。枪自杀结果数据不包括其他州的非居民死亡。
此外,分析仅限于手枪购买者;在研究期间,有38%的人死于枪支自杀在加州至少有1记录滴。即使在手枪购买者,许多枪支自杀发生个体归类为低风险。其他形式的干预将是必要的防止枪支自杀这一群体。
最后,目前只有11个州要求授权经销商确认枪支销售信息报告给执法。万博manbetx平台首页58风险预测等我们演示了在其他国家这是不可能的。
准确的自杀风险预测可以在致命手段干预发挥重要作用。证据表明,绝大多数经历过企图自杀的人不会死于自杀,58和政策,限制枪支访问在高危人群中可以防止枪支自杀的有效手段。59这项研究导致了越来越多的证据表明,计算方法可以帮助确定高危人群和有针对性的干预措施的发展。这项研究表明,手枪在加州事务信息定期收集可用于创建枪支自杀风险的预测算法。万博manbetx平台首页
发表:2022年5月22日。
发表:2022年7月11日。doi:10.1001 / jamanetworkopen.2022.21041
开放:这是一个开放的分布式根据文章CC-BY许可证。拉克尔©2022 HS et al。狗万体育下载地址《美国医学会杂志》网络开放。
通讯作者:汉娜·拉克尔博士硕士,MPA,暴力预防研究项目,急诊医学部门,加州大学戴维斯,2315年斯托克顿大街,萨克拉门托,CA 95817 (hslaqueur@ucdavis.edu)。
作者的贡献:拉克尔博士有完全访问所有的数据研究,负责数据的完整性和数据分析的准确性。
概念和设计:拉克尔,Smirniotis Wintemute。
数据的采集、分析或解释:所有作者。
起草的手稿:拉克尔,Smirniotis。
关键的修订手稿的重要知识内容:所有作者。
统计分析:拉克尔,Smirniotis McCort。
获得资助:拉克尔。
监督:拉克尔,Wintemute。
利益冲突的披露:Drs拉克尔先生和Smirniotis McCort报道收到安全未来基金赠款和加州枪支暴力研究中心在进行这项研究的。拉克尔博士报道接受资助的国家司法研究所和国家枪支暴力协作研究。Wintemute博士报道期间收到国家司法研究所资助的研究;乔伊斯基金会的资助,加州健康基金会,海辛西蒙斯Foundaton变,基金一个安全的未来,疾病控制和预防中心和国家司法研究所;和个人费用从国家枪支暴力研究协作和加州枪支暴力研究中心外的提交工作。
资金/支持:这项研究是由安全未来基金(批准a19 - 2744)和加州枪支暴力研究中心。
资助者的角色/赞助商:的资金来源没有参与这项研究的设计和实施;的收集、管理、分析和解释数据;准备、审查或批准的手稿;并决定提交出版的手稿。
20.
Fjestad SP, Fjestad SP。蓝皮书枪的价值观。蓝皮书出版物;万博ManBetX网页2017年。
23。
Fernandez-Delgado M, Cernadas E,巴罗,阿莫林D。我们需要数以百计的分类器来解决现实世界中分类问题?
J马赫学习Res。2014;15 (1):3133 - 3181。
谷歌学术搜索
33。
Liaw,维纳米。由randomForest分类和回归。
R新闻。2002;2(3):在18到22岁的。
谷歌学术搜索
35。
Sokolova M, Japkowicz N, Szpakowicz。除了准确性,f值和中华民国:一个家庭的判别绩效评估措施。:澳大拉西亚的联合会议上人工智能。施普林格;12月2006:1015 - 1021。
37岁。
守夜。构建可辩解的随机森林模型与应用在蛋白质功能分析。旧金山州立大学;2016年。
45岁。
Swanson JW,马Norko,林HJ, et al。实现和康涅狄格的有效性是基于风险的枪切除法:防止自杀吗?
法律一栏Probl。2017;80:179 - 208。
谷歌学术搜索
49。
Christodoulou C, Efstathiou V,布拉绸G, Korkoliakou P, Lykouras L。季节性变化的自杀:简要回顾。
Encephalos。2012年,49 (73):9。
谷歌学术搜索