速速来看！AI写的放射报告，你打几分？

2024-06-22健康

近年来，AI的快速发展已在医疗领域展现出其价值，并成为诊断放射学领域的一个「热点」研究课题。生成式预训练转换器(GPT)是一种先进的大型语言模型，凭借其类似人类的表达和推理能力备受关注。

有研究表明

GPT无需任何专门训练即可达到或接近美国执业医师资格考试（USMLE）所有三项考试的及格门槛，并且对于放射学报告的转换和总结非常有用。

那么GPT模型有可能生成放射学报告或协助放射科医生撰写此类报告吗？一项研究帮助我们揭秘GPT写报告的可能性。

0 1

GPT可生成放射学报告？

在这项初步研究中，评估了 GPT 系列根据简单的影像学描述生成放射学报告 的潜力，并将其性能与放射科医生出具的报告性能进行比较。

研究人员搜集了28名患者的CT图像，根据患者的年龄、性别、扫描部位和影像学发现，使用 GPT-2 、 GPT-3.5 和 GPT-4 模型生成放射学报告 ，再由资深的放射科医生对其进行评估（包括报告的语法和可读性、影像表现、诊断意见、鉴别诊断和总体质量）

结果如下

放射科医生与GPT-3.5或GPT-4在语法和可读性、图像发现和整体质量方面的定性得分没有显著差异（p>0.05）；

然而，GPT系列在 诊断意见和鉴别诊断 评分方面的定性得分 明显低于放射科医生 （p<0.05）。

最终研究得出结论

GPT-3.5和GPT-4有可能 通过非常短的关键词生成具有高可读性和合理图像发现的放射学报告 ；然而，人们仍然担心诊断意见和鉴别诊断的准确性，因此需要放射科医生的验证。

0 2

这样的报告，你打几分？

研究数据已列出，其实我们更好奇实际图像和报告的匹配程度如何，小编抽取了几个案例大家共赏，各位影像医生们，你给AI生成的报告打几分呢？

案例1

患者女性，69岁，图像如下：

从鞍区到鞍上区域观察到均匀强化的肿瘤，提示为垂体腺瘤。

图1： CT平扫横断面（a）、CT增强矢状图（b）和GPT系列生成的放射学报告（c），其中C表格从上到下依次为：影像表现、诊断意见、鉴别诊断

根据图1C可以看到

GPT-2报告相对简单，鉴别诊断似乎相对合理；

GPT-3.5报告中，影像表现和诊断意见部分都比GPT-2 报告更详细；

GPT-4.0报告 整体上与人工生成的报告非常相似 ，鉴别诊断合理，它还列出了其他GPT未提到的钙化和囊性病变。

案例2

患者女性，31岁，图像如下：

腹部增强CT动脉期(a) 显示病变内不均匀增强，静脉期(b)显示病变强化程度普遍强于肝实质，符合血管瘤的典型表现。

图2： 腹部增强CT动脉期（a）、静脉期（b）、GPT系列生成的放射学报告（c ），其中C表格从上到下依次为：影像表现、诊断意见、鉴别诊断

根据图2C可以看到

GPT-2生成的报告中，甚至没有创建鉴别诊断列表，诊断意见主要怀疑是肝细胞癌；

GPT-3.5生成的报告中，虽然格式组织良好，但肝细胞癌仍被列为首要鉴别诊断；

GPT-4.0生成的报告总体上相当不错，鉴别诊断合理。

案例3

患者男性，75岁，图像如下：

放射医生诊断右肾血管平滑肌脂肪瘤。

图3： CT平扫（a）、CT增强（b）、GPT系列生成的放射学报告（c）。其中C表格从上到下依次为：影像表现、诊断意见、鉴别诊断

根据图3C可以看到

GPT-2生成的报告中，肾肿瘤伴有周围水肿的可能性很低，甚至没有创建鉴别诊断列表；

GPT-3.5生成的报告中，虽然病变位于肾脏，但鉴别诊断包括肾上腺腺瘤；

GPT-4.0生成的报告中，整体质量相当好；它还列出了其他GPT未提到的钙化。

以上3个案例的3种报告

满分10分，如果让你来打分

你会打几分？

Nakaura T, Yoshida N, Kobayashi N, et al. Preliminary assessment of automated radiology report generation with generative pre-trained transformers: comparing results to radiologist-generated reports[J]. Japanese Journal of Radiology, 2024, 42(2): 190-200.

·END·

精彩推荐：

更多精彩医学影像内容，尽在鼎湖影像

↓↓ 欢迎进入鼎湖学堂