微软,印度技术学院和TCS Research(塔塔咨询服务公司的研发部门)的研究人员共同撰写的预印本纸描述了一个AI框架,旨在帮助城市和地区做出有关锁定,关闭和物理疏远的政策决策,以应对到COVID-19。他们声称,由于它会根据疾病参数(例如传染性,妊娠期,症状持续时间,死亡概率,人口密度和运动倾向)自动学习策略,因此它优于迄今为止使用的建模工具。
如果同行评审过程证实了研究人员的主张,那么该框架对于有冠状病毒病例的近200个国家的组织和政府可能是有用的。包括新加坡和台湾在内的亚洲国家已经证明,接触追踪等遏制策略(即识别可能与感染者接触过的人的过程)可以有效地缓解COVID-19的传播。
共同作者首先生成了一个图形网络-一个包含一些对象的模型,其中一些对相关,其中这些对象对应于顶点,每对顶点都称为边 -具有100个节点和1,000个个体。每个节点代表一个包含一定数量个体的城市或区域,节点对之间的连接强度与节点之间人口的乘积成正比,而与节点之间距离的平方根成反比。
接下来,研究人员对可用于COVID-19的最佳疾病参数进行了建模:潜伏期5-10天,感染期7-14天,出现可见症状的可能性为80%,死亡率为2%,与易感人群接触的感染者具有100%的传播概率。运行了多个模拟以获得可靠的统计数据。
在整个研究过程中,研究人员假设开放节点允许人们往返于网络中的其他开放节点。出现症状的人不允许旅行到其他节点,但是无症状和裸露的人可以这样做。(当一个节点被锁定时,进出该节点的所有通信都被阻止。)此外,他们还解释了以下事实:有症状的人在节点内被隔离,但少数人破坏了隔离并在其中流通。
研究人员还建立了几种基准锁定策略,他们假设每个节点都可以选择每周锁定或打开一次。然后,他们定义了一组策略,如果该节点中有症状的人所占比例超过了5%,10%,20%,50%或超过100%的预定义阈值,则会锁定任何给定节点。
最后,该团队训练了Deep Q Network强化学习算法(该算法通过奖励刺激了软件代理),该算法每周通过运行多个仿真来做出每个节点的二进制决策(“打开”或“锁定”)。疾病的传播。为了使算法确定最佳的锁定策略,他们量化了模拟结果的成本:锁定的每一天和每个感染者的权重为1.0。每次死亡重2.5。奖励被定义为这些成本的负数,因此更高的奖励对应于更低的成本。
在实验中,在75个模拟过程中,模拟持续52周(364天),研究人员确定锁定为5%到10%的策略的感染高峰较低。可以预见的是,该政策对决策会有所警惕,因为决策会导致同一节点内有症状的人和整个人群的比例增加,因此一旦感染开始蔓延,该策略就会锁定较大的节点,而外部感染可能性更高的节点会被锁定一旦感染开始在节点内蔓延。
合著者告诫说,没有一位作者是传染病专家,并且该研究中的AI模型没有考虑人口规模和地理位置,并且他们没有将真实数据用于网络模型。但是他们说正在进行更深入的分析,并且他们将继续分阶段添加更详细的描述和文献综述。
除了这项研究之外,各个团队还在开发AI系统来跟踪COVID-19的传播。卡内基梅隆大学的研究人员正在重新训练预测季节性流感的算法,而柏林的罗伯特·科赫研究所使用的模型考虑了政府的遏制措施,例如封锁,隔离和社会疏远处方,以表明这种遏制措施措施可以成功地减少传播。在其他地方,初创公司Metabiota提供了流行病追踪器和疾病传播的近期预测模型,他们用它们来进行预测。