研究人员发布冠状病毒患者的CT扫描数据集

2020年4月8日 0条评论 4,304次阅读 1人点赞

冠状病毒患者的CT扫描数据

为了促进能够快速发现新型冠状病毒迹象的系统的开发，圣地亚哥大学的研究人员团队本周发布了一个数据集-COVID-CT-Dataset-包含从143个收集的275个CT扫描确诊为COVID-19病例的患者，他们认为这是同类病例中最大的。为了展示其潜力，他们训练了一个AI模型以达到85％的准确度-他们说可以通过进一步的模型优化来提高准确度。

请务必注意，美国疾病控制与预防中心建议不要使用CT扫描或X射线进行COVID-19诊断，美国放射学院（ACR）和加拿大，新西兰和美国的放射组织也建议不要这样做。澳大利亚。那是因为即使最好的AI系统有时也无法分辨出COVID-19与常见的肺部感染（如细菌性或病毒性肺炎）之间的区别。

但是，像Intel的Xu Cheng这样的人断言，阿里巴巴，RadLogics，Lunit， DarwinAI， Infervision和 Qure.ai等公司的系统可能通过指示需要进一步测试来发挥作用。“简而言之，对于医疗保健专业人员和政府官员来说，分配资源并阻止病毒传播而不知道谁被感染，他们位于何处以及如何受到影响是一项挑战，” Cheng上周在谈到该系统时说道。来自汇盈医疗的产品，声称具有96％的准确度，可检测到COVID-19。

在这种情况下，研究人员自己没有收集扫描结果。正如他们在论文中指出的那样，出于对隐私的考虑，尚未在共享COVID-19诊断系统的许多现有研究中使用的图像。相反，研究小组对1月19日至3月25日发布的760篇COVID-19研究进行了搜索，并使用了一种名为PyMuPDF的工具来提取底层结构信息。这样一来，他们就可以在研究中找到嵌入的图形，并识别与图形相关的标题。

接下来，研究人员通过阅读字幕来手动选择临床COVID-19扫描。对于扫描，他们无法从字幕中进行判断，而是寻找引用图形的文字来做出决定。包含多个CT扫描作为子图的任何图形都被手动拆分为单个图像。

该团队认为，由于数据集很小，因此当模型在训练数据上表现良好但对测试数据的推广效果很差时，训练模型可能会导致过拟合。为了减轻这个问题，他们在国立卫生研究院的ChestX-ray14数据集（大量的X射线胸片图像）上对AI系统进行了预训练，并在COVID-CT数据集上进行了微调。此外，他们通过裁剪，翻转和转换图像以合成合成对来增强COVID-CT中的每个图像。

在对146次非COVID扫描和183次COVID-19扫描进行模型训练后，研究人员报告说，他们的基线AI系统显示出了很高的精确度，但召回率却很低，在这种情况下，这是指模型能够在其中找到所有相关病例的能力。数据集。对于下一步，该团队表示，他们将继续改进该方法以获得更好的准确性。

关于这一点，目前尚不清楚是否有任何研究人员通知了从公开研究中刮取的患者。我们已作出澄清，并将在收到回复后更新此帖子。

邪恶进制

研究人员发布冠状病毒患者的CT扫描数据集

本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可

发表回复取消回复

本作品采用 知识共享署名-相同方式共享 4.0 国际许可协议 进行许可

发表回复 取消回复

本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可

发表回复取消回复