为了促进能够快速发现新型冠状病毒迹象的系统的开发,圣地亚哥大学的研究人员团队本周发布了一个数据集-COVID-CT-Dataset-包含从143个收集的275个CT扫描确诊为COVID-19病例的患者,他们认为这是同类病例中最大的。为了展示其潜力,他们训练了一个AI模型以达到85%的准确度-他们说可以通过进一步的模型优化来提高准确度。
请务必注意,美国疾病控制与预防中心建议不要使用CT扫描或X射线进行COVID-19诊断,美国放射学院(ACR)和加拿大,新西兰和美国的放射组织也建议不要这样做。澳大利亚。那是因为即使最好的AI系统有时也无法分辨出COVID-19与常见的肺部感染(如细菌性或病毒性肺炎)之间的区别。
但是,像Intel的Xu Cheng这样的人断言,阿里巴巴,RadLogics,Lunit, DarwinAI, Infervision和 Qure.ai等公司的系统可能通过指示需要进一步测试来发挥作用。“简而言之,对于医疗保健专业人员和政府官员来说,分配资源并阻止病毒传播而不知道谁被感染,他们位于何处以及如何受到影响是一项挑战,” Cheng上周在谈到该系统时说道。来自汇盈医疗的产品,声称具有96%的准确度,可检测到COVID-19。
在这种情况下,研究人员自己没有收集扫描结果。正如他们在论文中指出的那样,出于对隐私的考虑,尚未在共享COVID-19诊断系统的许多现有研究中使用的图像。相反,研究小组对1月19日至3月25日发布的760篇COVID-19研究进行了搜索,并使用了一种名为PyMuPDF的工具来提取底层结构信息。这样一来,他们就可以在研究中找到嵌入的图形,并识别与图形相关的标题。
接下来,研究人员通过阅读字幕来手动选择临床COVID-19扫描。对于扫描,他们无法从字幕中进行判断,而是寻找引用图形的文字来做出决定。包含多个CT扫描作为子图的任何图形都被手动拆分为单个图像。
该团队认为,由于数据集很小,因此当模型在训练数据上表现良好但对测试数据的推广效果很差时,训练模型可能会导致过拟合。为了减轻这个问题,他们在国立卫生研究院的ChestX-ray14数据集(大量的X射线胸片图像)上对AI系统进行了预训练,并在COVID-CT数据集上进行了微调。此外,他们通过裁剪,翻转和转换图像以合成合成对来增强COVID-CT中的每个图像。
在对146次非COVID扫描和183次COVID-19扫描进行模型训练后,研究人员报告说,他们的基线AI系统显示出了很高的精确度,但召回率却很低,在这种情况下,这是指模型能够在其中找到所有相关病例的能力。数据集。对于下一步,该团队表示,他们将继续改进该方法以获得更好的准确性。
关于这一点,目前尚不清楚是否有任何研究人员通知了从公开研究中刮取的患者。我们已作出澄清,并将在收到回复后更新此帖子。