基于带病体真实世界数据的疾病关联分析
发布时间:2024-05-20浏览量:案例介绍:
随着国民健康保障意识的日益增强,带病体保险在保障国民健康和推动保险行业发展方面发挥着越来越重要的作用,深入了解疾病间的关联性,不仅有助于精准识别医疗保险受益人的潜在健康风险,更能为带病体保险的设计提供坚实支撑。本案例聚焦于医疗花费数据,依此构建度量疾病间医疗花费相关性的疾病网络模型,旨在为保险行业提供精准的风险评估与健康管理支持。
基于带病体真实世界数据的疾病关联分析
一、研究背景
从数据出发量化疾病相关性,尤其是疾病间医疗花费的相关性,对带病体保险发展有着重要意义。带病体保险是我国国民健康保障事业以及商业保险行业发展的重要战略之一。获取疾病之间的关联性知识能够为识别医疗保险受益人潜在的健康风险提供重要信息,从而为保险设计提供有力支持,更好地满足带病人群的保险需求,提高保险公司对风险人群的精准识别与管理能力。
探索如何运用先进的统计学方法从海量医疗大数据中高效而精准地提取有价值的信息,是推动带病体保险发展进程中的一个关键突破点。随着大数据时代的到来,从数据中提炼信息辅助决策成为了一种重要的研究手段。医疗信息化系统以及电子化病历的普及极大地促进了医疗数据的积累,使得从医疗数据中获取有价值的信息成为可能。然而,由于医疗大数据普遍存在数据结构多样,数据稀疏,计算成本昂贵等问题,如何利用创新的统计学方法,从这些宝贵的医疗数据中高效地提炼准确、有价值的信息,成为了关键的问题。
在上述背景下,本案例利用临床型疾病网络模型,对2015年1月至2019年12月期间山东省济南市城镇职工和城镇居民基本医疗保险的数据进行分析,构建可以在全疾病范围内下量化并存疾病间医疗花费相关性的疾病网络。
二、数据
医疗保险数据具有覆盖面广泛、数据质量高、数据信息丰富等诸多独特的优势。本案例提取了2015年1月至2019年12月期间山东省济南市城镇职工和城镇居民基本医疗保险受益人的480万次住院记录,这些记录涵盖了220万名患者的疾病信息,所使用的医疗服务,及相关花费。数据处理流程图见图1.
图1:数据处理流程图
三、结果
本案例构建的医疗花费疾病网络见图2。如图所示构建的疾病网络一共有86个节点,336个边,且这些节点隶属于7个模块。在图中,每个节点表示一个ICD疾病大类,如果它们之间的医疗花费存在相关性,则两个节点之间用边连接,节点的大小与其连通度(与该节点相连的节点个数)成比例。因此,图2中的节点越大表示与它相连的节点越多(表1展示了网络中联通度前十的ICD疾病大类)。连通度越高表示该疾病与其它疾病医疗花费的相关程度越高,在带病体保险设计以及带病人群健康管理中都属于需要重点关注的疾病。此外,图2中的一种颜色代表一个模块,也被称为网络社区或群组,由一组内在关联性紧密的节点组成。在本案例所构建的基于医疗花费的临床型疾病网络中,模块的形成一方面由于疾病间紧密的病因、病理学相关性,如红色模块大多由糖尿病和肾病相关疾病组成;另一方面由于疾病间共同的临床特征,如紫色模块大多由急性及亚急性疾病组成。后者可能由不同身体系统的疾病组成,这些疾病从病理和病因学角度考虑存在较长的距离,但是在临床治疗中具有共同的特征。因此,临床型疾病网络基于临床结局的疾病相关性提出不同角度的疾病分类方法,更具临床意义,也可以为带病体保险设计与定价提供更多视角与信息。处于同一模块中疾病的医疗花费之间存在较强的内在关联性,在考虑医疗保险受益人潜在的健康风险时,同一模块的疾病应该被同时考虑。由于网络中涉及大量疾病和关联性,更详细的网络结构解读需要依赖更多的生物学、医学知识以及更丰富的数据信息。
图2:基于医疗花费构建的疾病网络
表1:连通度排名前十的疾病
节点编号 |
ICD疾病大类 |
ICD疾病大类名称 |
连通度 |
1 |
I60-I69 |
脑血管病 |
54 |
2 |
J09-J18 |
流行性感冒和肺炎 |
54 |
6 |
K55-K64 |
肠的其他疾病 |
45 |
5 |
M50-M54 |
其他背部病 |
31 |
3 |
I20-I25 |
缺血性心脏病 |
22 |
21 |
N80-N98 |
女性生殖道非炎性疾患 |
22 |
12 |
J00-J06 |
急性上呼吸道感染 |
20 |
25 |
K35-K38 |
阑尾疾病 |
19 |
14 |
D10-D36 |
良性肿瘤 |
19 |
4 |
J40-J47 |
慢性下呼吸道疾病 |
19 |
为了更好地展示和解释本案例构建的医疗花费疾病网络及其在带病体保险设计中的意义和应用,这里选取甲状腺疾患(疾病编号30的节点)作为一个具有代表性的例子进行讨论。图3展示了节点30以及在网络中和它相关的疾病。图3中,标为红色的节点是甲状腺疾患,标为蓝色的节点是与节点30相连且同属于一个模块的疾病,标为黄色的节点是节点30相连但不属于同一个模块的疾病,标为绿色的节点是与节点30不相连但同属于一个模块的疾病。
图 3:甲状腺疾患相关的疾病网络
基于甲状腺疾患,本案例可以给出以下三个结论:
1) 针对某一疾病进行带病体保险设计时,与其直接相连且隶属于统一模块的疾病应当被首要考虑。图3中蓝色的节点4(脑血管病)、节点1(慢性下呼吸道疾病)和节点61(甲状腺和其他内分泌腺恶性肿瘤)不仅与甲状腺疾患与甲状腺疾患属于同一个模块,而且与它直接关联,与甲状腺疾患间存在很强的关联性,在保险设计时更应当被重点考量。
2) 在设计关于某个疾病的带病体保险时,与其直接相连表明这些疾病之间存在直接关联,应被更多地给予考量。图3中蓝色和黄色的节点都与甲状腺疾患直接相连。其中,黄色节点2(流行性感冒和肺炎)和节点6(肠的其他疾病)虽然和甲状腺疾患分处不同模块,但与之直接相连,在设计针对甲状腺疾患的带病体保险时也应该被同时考虑。
3) 隶属于同一个模块的疾病之间存在较强的内在关联性,在考虑医疗保险受益人潜在的健康风险时,应同时考虑到同一个模块中的其他疾病。图3中蓝色和绿色的节点都与甲状腺疾患属于同一个模块,该模块的疾病大多可以归类于感染性和神经内分泌疾病。绿色的节点即使没有和甲状腺疾患直接相连,也与之存在较强的间接相关性,同样在保险设计和健康管理时需要被重点考虑。
四、结论
本案例所构建的疾病网络,能够量化疾病之间医疗费用的关联性,对带病体保险发展的帮助主要体现在以下两个方面。
首先,当需要针对某一种疾病设计相关产品时,疾病网络可以提供其关联疾病的信息(直接相连或隶属同一模块的疾病)。这意味着保险设计者可以根据医疗保险受益人的既往病史更全面、精准地评估医疗保险受益人的理赔风险,实现精细化保险定价,设计更具针对性的保险产品,提高产品的覆盖范围和效益。
其次,疾病网络还可以帮助保司和医疗保险受益人进行更有效的健康管理。通过疾病网络分析,保险公司可以更准确地评估医疗保险受益人由于某些疾病产生大额医疗花费的风险,从而提供个性化的健康管理建议,帮助医疗保险受益人更好地预防和管理潜在的健康风险。
因此,本案例所构建的医疗花费疾病网络对于带病体保险的设计和发展具有重要意义,可以提高保险产品的定价准确性和针对性,同时也能够提供更个性化的健康管理服务,为医疗保险受益人提供更好的保障和关怀。
本案例为中国人民大学统计学院——中国人寿再保险有限责任公司“公共健康与风险管理”联合实验室资助项目的实证结果。
五、研究方法
本研究提出一种基于两部分建模+广义线性模型联合分析的方法。