首页 > 资讯 > 癌症 > 正文
2022-01-21 17:45

人工智能的个性化癌症筛查

Perso<em></em>nalized cancer screening with AI

虽然乳房x光检查目前是乳腺癌筛查的黄金标准,但也存在一些争议:拥护者主张拯救生命的能力,(60至69岁的女性的死亡风险降低了33%比那些没有得到乳房x线照片),和另一个阵营认为昂贵的和潜在的创伤性假阳性(三个随机试验的荟萃分析发现,过度诊断19%从乳房x光检查)。

即使挽救了一些生命,并进行了一些过度治疗和筛查,目前的指南仍然是包治万象:年龄在45岁至54岁之间的女性应该每年进行乳房x光检查。虽然个性化筛查一直被认为是解决问题的方法,但能够利用大量数据来实现这一目标的工具却落后了。

这让麻省理工学院计算机科学与人工智能实验室(CSAIL)和机器学习与健康贾米尔诊所(Jameel Clinic for Machine Learning and Health)的科学家们提出了一个问题:我们能否使用机器学习来提供个性化筛查?

由此产生了Tempo,一种创建基于风险的筛查指南的技术。Tempo使用一种基于人工智能的风险模型,观察哪些人接受了筛查,以及他们何时得到诊断,它将建议患者在未来的某个特定时间点(比如6个月或3年)返回接受乳房x光检查。同样的Tempo政策可以很容易地适应广泛的可能的筛查偏好,这将让临床医生选择他们想要的早期检测,以进行筛查成本的权衡,而无需培训新的政策。

该模型在马萨诸塞州总医院(Massachusetts General Hospital, MGH)的大型筛查乳房x线照相术数据集上进行训练,并在MGH的被隔离患者以及埃默里、瑞典卡罗林斯卡和长工纪念医院的外部数据集上进行测试。利用该团队之前开发的风险评估算法Mirai, Tempo获得了比每年筛查更好的早期检测,同时在卡罗林斯卡医学院需要的乳房x光检查减少了25%。在MGH,它建议大约一年做一次乳房x光检查,并获得了大约四个半月的模拟早期检测优势。

麻省理工学院CSAIL博士生、首席研究员亚当·亚拉(Adam Yala)说:“通过根据患者的个人风险量身定制筛查,我们可以改善患者的预后,减少过度治疗,消除健康差异。”鉴于乳腺癌筛查的规模巨大,每年有数千万女性接受乳房x光检查,改善我们的指导方针非常重要。”

深医学

人工智能在医学上的早期应用可以追溯到20世纪60年代,当时许多人将树形实验作为医学领域的开端。研究人员创建了一个软件系统,被认为是第一个自动化有机化学家决策和解决问题行为的专家类型。60年后,深度医学已经极大地发展了药物诊断、预测医学和患者护理。

目前的指南将人群划分为几个大的群体,比如55岁以下或55岁以上,并建议同一队列的所有成员使用相同的筛查频率。基于人工智能的风险模型的开发,对原始患者数据进行操作,使我们有机会改变筛查方式,为需要筛查的人提供更频繁的筛查,并节省其余的时间,”Yala说。“这些模型的一个关键方面是,随着患者原始数据的变化,它们的预测可以随着时间的推移而变化,这意味着筛查政策需要调整到风险的变化,并在长期的患者数据中进行优化。”

Tempo使用强化学习(一种因在国际象棋和围棋等游戏中取得成功而广为人知的机器学习方法)来制定一种“策略”,预测每位患者的后续建议。

这里的训练数据只包含患者在接受乳房x光检查时的风险信息(例如,他们50岁或55岁时)。该团队需要在中间点进行风险评估,因此他们设计了一种算法,从观察到的筛查中了解患者在未观察到的时间点的风险,随着新的患者乳房x线照片的出现,这种方法不断发展。

该团队首先训练神经网络,根据之前的评估来预测未来的风险评估。然后,该模型在未观察到的时间点估计患者的风险,并支持基于风险的筛查策略的模拟。接下来,他们对这一策略(也是一个神经网络)进行了训练,以使回顾性训练集的奖励(例如,早期检测和筛查成本的结合)最大化。最终,你会得到一个建议,告诉你什么时候可以重新使用下一个屏幕,时间范围从6个月到3年不等,是6个月的倍数,而标准是1 - 2年。

假设病人A来做第一次乳房x光检查,最终在第四年被诊断出来。在第二年,什么都没有,所以他们在接下来的两年里不会回来,但是在第四年,他们得到了诊断。现在在最后一个屏幕之间已经有两年的空白了,肿瘤可能会在那里生长。

使用Tempo,在第一次乳房x光检查时,也就是零年,建议可能是两年后再来检查。然后在第二年,它可能发现风险很高,建议病人六个月后再来,在最好的情况下,它是可以检测出来的。该模型根据风险状况的变化动态地改变患者的筛查频率。

Tempo使用了一个简单的早期检测标准,假设癌症可以提前18个月发现。虽然Tempo在这一假设的不同设定下(6个月,12个月)的表现优于目前的指南,但这些假设都不是完美的,因为肿瘤的早期检测潜力取决于该肿瘤的特征。该团队建议,使用肿瘤生长模型的后续工作可以解决这个问题。

此外,筛选成本指标,计算Tempo推荐的总筛选量,并没有提供整个未来成本的完整分析,因为它没有明确量化假阳性风险或额外的筛选危害。

未来还有很多方向可以进一步改进个性化筛选算法。该团队表示,一种方法是建立在回顾性数据中用于估计早期检测和筛查成本的指标之上,这将导致更精确的指导方针。Tempo还可以调整为包括不同类型的筛查建议,如利用MRI或乳房x光检查,未来的工作可以分别为每种筛查的成本和收益建模。有了更好的筛查政策,重新计算筛查对患者来说仍然具有成本效益的最早和最晚年龄可能是可行的。

“我们的框架是灵活的,可以很容易地用于其他疾病、其他形式的风险模型,以及早期检测效益或筛查成本的其他定义。随着风险模型和结果指标的进一步完善,我们希望Tempo的效用能够继续提高。我们很高兴能与医院合作伙伴合作,前瞻性地研究这项技术,并帮助我们进一步提高个性化癌症筛查,”Yala说。