基于深度学习模型的疾病诊断研究与应用-以儿童哮喘诊断为例

发布时间:2023-12-04浏览量:

引入语:哮喘作为全球健康问题,困扰着所有年龄段的人群,在儿童中更是常见,是儿童时期最常见的慢性气道疾病,儿童哮喘的临床诊断较为复杂,本案例建立儿童哮喘诊断预测模型,并基于此搭建自动化诊断平台,提高诊断效率。

基于深度学习模型的疾病诊断研究与应用

—以儿童哮喘诊断为例

一、研究背景和目标

儿童哮喘的临床诊断通常基于详细的临床询问,例如喘息和家族史,以及复杂的检查,例如肺功能测试等。这个过程既要求有丰富的临床资源,又需要家长和儿童花费大量的时间,因此开发一套能有效评估儿童哮喘风险的统计预测模型将有助于哮喘的诊断和管理。然而,目前还缺乏精确的儿童哮喘诊断模型,主要难点有二:一是,儿童哮喘的机制十分复杂,许多风险因素仍然未知,这使得预测模型的精确性受到极大影响;二是,现有儿童哮喘诊断模型难以同时容纳众多风险因素,且常常忽略因素间的复杂非线性关系,这会进一步影响预测精度。此外,考虑到该哮喘诊断模型发挥作用的重要场景包括家中、医院候诊期间、以及资源不发达地区,因此很有必要开发一个方便快速的在线自动化诊断平台,从而方便家长和儿童在家中快速自我评估哮喘风险,又可以辅助医生进行诊断,同时还可以帮助我们收集更多数据,进一步提高模型的预测精度。综上,我们的目标是基于大样本儿童哮喘数据,寻找儿童哮喘风险因素,建立精确的儿童哮喘诊断预测模型,最终基于该模型搭建在线自动化诊断平台,服务于广大医务工作者、儿童和家长。

二、研究方法

第一步,我们系统整理出了1999-2016年美国国家健康与营养调查(NHANES)的全部数据。第二步,我们建立了高效的特征筛选算法,进而可以从约6,000个NHANES变量中筛选与儿童哮喘相关的重要风险因素。第三步,我们基于找到的重要风险因素,使用深度学习方法搭建儿童哮喘诊断预测模型。深度学习方法的优点是能够有效提炼出风险因素之间,以及风险因素与哮喘之间的复杂关系,从而提高预测精度。第四步,我们将基于深度学习模型搭建在线自动化诊断平台,同时使用LIME方法对诊断进行解释,为预防和管理提供科学依据。在该项目中,我们与儿童哮喘医生展开了密切合作,确保数据质量、因素筛选、模型构建、以及诊断结果具有临床意义上的合理性与可解释性。研究方法框架见图1。

三、研究结果和应用

第一,通过对NHANES数据的整理,我们获得了约21,000名6岁至17岁学龄儿童的大样本数据。第二,通过特征筛选,我们从约6,000个NHANES变量中筛选出了约300个与儿童哮喘相关的重要风险因素(校正后的p值<0.01)。其中,最重要的特征与合作医生的哮喘诊断指标高度重合,例如喘息,家族性哮喘病史,BMI,嗜酸性粒细胞百分比,肺功能和IgE等。尤其令我们激动的是,这300个重要特征中含有不少之前未发现的哮喘风险因素,这为儿童哮喘的预防和管理提供了新的方向和依据。第三,我们的深度学习模型表现出了优秀的哮喘分类性能(AUC=0.84,图2)。第四,基于该模型,我们成功搭建了一个在线自动化诊断工具(图3),未来将部署在中国人民大学统计学院智能数据云及全面量化开发平台网站。

1701679625374.jpg

图1:研究方法框架图

图2:深度学习模型对哮喘(蓝色)和非哮喘儿童(红色)的预测概率密度分布

图3:可解释的儿童哮喘在线自动诊断平台