(跳过导航)
狗万体育下载地址《美国医学会杂志》网络的家
的观点 2421年
简短的报告
2023年4月27日

眼科知识的人工智能聊天机器人的性能评估

作者的从属关系
  • 1舒医学及牙科学院,西安大略大学,伦敦,加拿大安大略省
  • 2眼科及视觉科学,多伦多大学,多伦多,加拿大安大略省
  • 3圣迈克尔医院眼科学系/统一健康多伦多,多伦多,加拿大安大略省
JAMA角膜切削。 2023,141 (6):589 - 597。doi: 10.1001 / jamaophthalmol.2023.1144
要点

问题如何回答实践问题的人工智能聊天机器人ChatGPT执行董事会认证在眼科吗?

发现在125年这个横断面研究,包括基于文本的选择题OphthoQuestions提供的免费试用板认证考试准备,ChatGPT正确回答了58问题(46%)。

意义医疗专业人士和学生应该欣赏人工智能在医学上的进步,在承认ChatGPT用于这个调查没有回答足够多选题在准备为它提供大量援助委员会认证。

文摘

重要性ChatGPT是一个人工智能(AI)聊天机器人,具有重要的社会意义。使用医学人工智能正在开发培训课程,和聊天机器人的性能在眼科没有特点。

客观的评估的性能ChatGPT在眼科回答实践问题委员会认证。

设计,设定和参与者这个横断面研究使用连续样本提供的基于文本的选择题OphthoQuestions实践问题银行董事会认证考试准备。166多项选择题,125(75%)是基于文本的。

曝光ChatGPT回答问题1月9日至16日,2023年,并于2023年2月17日。

主要结果和措施我们的主要结果是委员会的认证考试练习题的数量ChatGPT回答正确。我们二级结果的比例问题,ChatGPT提供额外的解释,问题和响应的平均长度由ChatGPT提供,ChatGPT的性能在没有选择题选项的回答问题,随着时间的推移和性能的变化。

结果2023年1月,ChatGPT正确回答了125个问题58 (46%)。ChatGPT的性能是最好的分类一般内科(11/14;79%)和贫穷在视网膜和玻璃(0%)。的比例问题,ChatGPT提供额外的解释类似的问题回答正确和错误之间(不同,5.82%;95%可信区间,−11.0%到22.0%;χ21= 0.45;P= .51)。的平均长度问题是类似的问题回答正确和错误之间(不同,21.4字符;,36.8;95%可信区间,51.4−94.3;t= 0.58;df= 123;P= 22)。响应的平均长度是类似的问题回答正确和错误之间(不同,−80.0字符;,65.4;95%可信区间,209.5−49.5;t=−1.22;df= 123;P= 22)。ChatGPT一样选择了多项选择题反应最常见的回答OphthoQuestions眼科学员提供的44%的时间。2023年2月,ChatGPT提供正确响应73 125多项选择题(58%)和78年42独立问题(54%),而不选择题选项。

结论和意义ChatGPT回答问题正确的大约一半OphthoQuestions眼科委员会认证的准备免费试用的。医疗专业人员和学员应该欣赏人工智能在医学上的进步而承认ChatGPT本调查中使用它没有回答足够多选题提供大量援助在准备认证。

添加或更改的机构
1对本文发表评论
re:额外的眼科文章评级ChatGPT的性能
埃塞尔,医学博士英里MIAD地中海MBA|阿尔伯塔大学和多伦多大学
称赞你非常聪明。

这是另一个眼科和ChatGPT相关的文章:

https://reader.elsevier.com/reader/sd/pii/S2949889923000053?token=E6D0F10130B0F2FA70BAB137AB20947C5E015686BAC1BFF13FBEE5D6A6293297E2E0CC271D38EEA1BE3C5BA8ED842541&originRegion=us-east-1&originCreation=20230505074700

红晶石M,荷兰国际集团(Ing) EB,会话AI模型眼科诊断:比较ChatGPT和伊莎贝尔Pro鉴别诊断发电机,JFO开放眼科,卷1,2023年,100005年,ISSN 2949 - 8899,
https://doi.org/10.1016/j.jfop.2023.100005。
(https://www.sciencedirect.com/science/article/pii/S2949889923000053)
利益冲突: 没有报道
×
Baidu
map