2022-01-21 18:25

用机器学习正确分类咳嗽

Correctly classifying coughs with machine learning

新加坡科技与设计大学(SUTD)的研究人员表明,深度学习模型可以仅通过咳嗽声准确区分健康儿童和患病儿童。发表在《传感器》杂志上的这些发现,可能为更有效地筛查儿童呼吸系统疾病打开大门,也可能为患者、家长和医生减轻巨大的负担。

在儿童中,咳嗽可能是几种呼吸道疾病的征兆,包括哮喘、鼻窦炎和呼吸道感染。咳嗽作为一种症状的普遍存在,意味着医生经常不得不进行额外的检查和程序,以提供明确的诊断。

领导这项研究的SUTD助理教授Chen Jer-Ming说:“这些测试需要去医院检查,对孩子不是没有风险的,并对医疗资源提出了要求。”“此外,这种探访还会对儿童及其家庭产生其他负面的社会或经济影响,比如有时间离开工作岗位,以及需要特别的育儿安排。”

为了减轻患者和整个医疗系统的负担,人们对利用咳嗽声的细微差别来区分不同的呼吸状况越来越感兴趣。然而,大多数研究都依赖于在录音棚环境中仔细录制的咳嗽音频,这使得它们不适合实际应用,因为背景噪音和低级别设备可能会影响录制的咳嗽的质量。

为了解决这个问题,陈助理教授和来自KK妇女儿童医院和杜克-新加坡国立大学医学院的合作者Hee Hwan Ing博士使用智能手机在现场医院环境中收集咳嗽记录,以反映真实的“生态”条件。接下来,为了帮助他们准确地将咳嗽记录分类为患病或健康,该团队转向了一种称为双向长期短期记忆(BiLSTM)的特定类型的深度神经网络模型。

与其他人工神经网络相比,bilstm是由单个单元组成的,可以在任意时间内记住数值。Chen助理教授解释说,这种记忆机制使得bilstm特别适合处理像音频这样的顺序数据。

为了训练和测试他们的模型,研究小组使用了89名哮喘儿童、160名下呼吸道感染儿童和78名上呼吸道感染儿童的咳嗽记录。为了进行比较,他们还收集了89名健康儿童的咳嗽声。

该团队发现,BiLSTM能够准确地将个人咳嗽声分类为健康或患病,准确率为84.5%。当考虑所有患者的音频样本时,预测模型的准确率为91.2%。这意味着,在10个提供咳嗽记录的患者中,BiLSTM将能够正确识别出9个健康或患病的患者。

然而,当试图区分不同病理性咳嗽时,该模型的准确性较低。例如,该模型错误地将近四分之三的哮喘咳嗽归因于呼吸道感染。反过来,超过60%的哮喘患儿被误诊为下呼吸道感染。

陈助理教授指出:“分析同一名儿童不健康与健康及已痊愈的咳嗽的音频特征,发现不健康的咳嗽,不论其基本情况如何,都与其他不健康的咳嗽更为相似。”这与仅凭咳嗽声很难区分疾病的医生们的轶事记录是一致的。

然而,研究人员发现,当试图区分不同的疾病时,很多模型的错误分类发生了;BiLSTM在区分健康儿童和患病儿童方面仍然非常准确。

尽管它有可能改变儿科的呼吸疾病筛查,但在目前的BiLSTM模型准备好投入临床应用之前,仍有工作要做。

特别是,开发一个智能手机应用程序,它可以收集音频输入,将其转发到中央服务器进行处理,并将结果显示给最终用户,这将是使模型在临床环境中可用的关键。一旦投入使用,该技术就可以利用来自患者的进一步音频数据不断改进,以提高其检测病理性咳嗽的准确性。

陈教授说:“这项研究只是开发高效深层神经网络模型的第一步,该模型可以区分不同的不健康咳嗽声。”“这种自动化的‘实地’方法将支持与咳嗽有关的呼吸道疾病的临床筛查,有助于健康监测和筛查,特别是在偏远和发展中社区。”