高血压用药经验分析

发布时间:2024-05-13浏览量:

图片.png

党的十八大以来,以习近平同志为核心的党中央把保障人民健康放在优先发展的战略地位,加快推进健康中国的战略部署。随着高通量测序技术、生物芯片技术、人工智能和大数据分析等技术的快速发展,通过准确地获取和分析大量的生物信息数据,精准医疗的概念被提出。与传统医疗模式的“一刀切”的治疗方式不同,精准医疗通过考虑个体的特有特征、生物标志物、环境因素等综合因素,更好地理解和预测疾病的发展,并提供个性化的治疗方案。本案例致力于探索高血压疾病的用药经验,从而帮助相关研究者更好地理解病情、选择更为个性化的治疗方案。

高血压用药经验分析

本案例旨在探究北京地区三种常用高血压用药(氨氯地平、硝苯地平及其他用药)的用药经验。研究中将单次就诊总金额作为希望最小化的结局指标,单次就诊总金额反映了患者为管理高血压而承担的直接经济负担。降低总金额不仅能减轻患者的经济压力,也是衡量医疗效率的一个重要指标。同时,就诊金额可能间接反映了疾病管理的复杂性和效果。通常情况下,疾病越严重,就诊频次可能更高,所需的治疗和检查也可能更多,导致总费用增加。

一、 数据预处理

1. 数据来源和数据清洗

本数据来自企业提供的脱敏后门诊样本数据,数据中包含的主要变量有'用户ID', '性别', '年龄', '居住地', 'icd_code', '诊断', '就诊日期', '就诊医院', '账单金额','就诊ID', '诊疗明细名称', '发票金额', '诊疗名称', '大项名称', '社保类型', '金额', '赔付金额','映像录入时间'等。我们从所有数据中,根据icd编码,提取出高血压大类疾病(I10-I15)。高血压原始数据缺失值只出现在‘性别’、‘居住地’地两个变量中,由于变量较少,选择直接剔除具有缺失值的记录。剔除后的数据集总计有402436条记录,每条记录是某人某个时间点的就诊用药记录,根据用户ID,共计有1627个随访对象,其中北京地区样本的记录条数占到总样本记录条数的80%以上。而且北京地区样本的信息更为完整且随访周期更长、更为全面,因此我们只保留北京地区数据作为分析。此时共有324908条记录,随访人数有544个。

2. 变量选择

在此研究中,为了更合理地评估高血压用药策略,以下为我们选定的主要协变量:

1. 性别: 作为基本的生物学分类,性别可能影响疾病发展和药物反应。

2. 年龄: 年龄是高血压及其并发症风险的重要因素。

3. 地区: 初步数据显示地区分布不均,可能需要对样本数量较少的地区进行剔除或合并处理。

4. 心血管(抗血小板)用药: 作为高血压治疗中常见的伴随用药,了解其使用情况对分析高血压管理至关重要。

5. 降脂(他汀)用药: 作为心血管疾病预防的常规治疗,能够反映患者的严重程度。

6. 糖尿病用药: 糖尿病是高血压患者常见的共病,其管理状况可能影响高血压的治疗效果。

在治疗策略方面,我们选择氨氯地平、硝苯地平和其他用药作为评价的治疗策略。氨氯地平和硝苯地平是两种常用的钙通道阻断剂,广泛应用于高血压治疗中。它们被广泛研究并在多个临床试验中显示出有效性和安全性,成为高血压治疗的标准选项。这两种药物通过不同的机制作用于血管平滑肌,从而降低血压,但它们的副作用、适应症和患者反应可能有所不同,这些差异使得它们在临床选择中具有互补性。同时在实际的医疗数据中,氨氯地平和硝苯地平作为常见的高血压用药,其数据相对充分,便于收集和分析。而'其他用药'的类别提供了一定的灵活性,以纳入不同种类的用药数据,包括但不限于其他类型的降压药(如ACE抑制剂、ARBs、利尿剂等),这允许研究覆盖更多可能的治疗选项,确保研究结果的全面性和适用性。

在结局变量方面,我们选取就诊总金额作为衡量治疗成本和间接反映疾病严重程度的指标,希望通过最小化该指标来找到“最优”用药策略。

二、 初步可视化分析

1. 年龄

图片.png

图1 年龄与对数平均单次就诊金额的散点图与趋势

图1散点图中每一个点反映的是一个患者的年龄和他们的对数化就诊费用,使用对数转换的原因是因为费用数据的分布是偏态的,转换为对数可以使其更接近正态分布。从图中可以看出,随着年龄的增长,平均单次就诊费用也显示出上升的趋势。这表明随着患者年龄的增长,就诊费用可能呈现增加的趋势。这也反映了老年患者可能由于病情复杂需要更昂贵的药物治疗。

图片.png

图2 用药策略和年龄的箱线图

在对三种高血压治疗策略的年龄分布进行箱线图分析中,我们观察到各策略之间存在显著的年龄分布差异。图2显示硝苯地平更多地被用在年龄更高的人身上,这些发现可能对我们优化用药策略、更精准地定位目标治疗群体具有重要意义。

2. 地区

图片.png

图3 不同区域对数化平均就诊金额的箱线图

图3展示出了就诊花费具有地区差异性,朝阳的平均就诊金额相对更高,而海淀区则相对最低。这种地区性的差异,可能是医疗资源分配、人口结构、医疗服务定价等差异所导致的。

图片.png

图4 不同地区用药占比

图4则呈现了不同地区用药占比的堆叠柱状图,每个柱状图分别展示了三种药物在各个区域的使用比例。这些药物包括治疗高血压的氨氯地平、硝苯地平以及其他类型的药物。

3. 性别

图片.png

图5 性别和对数化平均就诊金额的箱线图

图5展示高血压平均就诊金额和性别没有显著差别。

图片.png

图6 不同性别的用药占比

图6展示不同性别用药的占比大致相同。

4. 合并病数量

图片.png

图7 合并病数量和对数化平均就诊金额的箱线图

图7展示了不同合并病数量下,就诊金额呈现上升的趋势,这反映了更复杂的医疗需求和更高的治疗成本。

图片.png

图8 不同合并病数量的用药占比

图8展示了随着合并病数量的增加和硝苯地平的使用比例呈正相关关系,可能是因为硝苯地平被视为在多重疾病管理中更加适合或更为有效的药物,尤其是在高血压伴随其他疾病的情况下。

5. 用药策略

图片.png

图9 三种用药策略和对数化平均就诊金额的箱线图

图9展示了不同用药下的就诊平均金额,可以看到,硝苯地平花费的平均就诊金额更高,这可能也因为硝苯地平被用于更复杂的具有合并症的高血压病患者中。

三、 最优用药策略的分配

在我们对北京地区高血压用药策略的深入分析中,我们建立了一个决策树模型,以指导个体化的药物选择。图10通过综合考虑患者的居住区域、年龄和并发病情,为每一位患者推荐更为合适的药物治疗方案。例如,在海淀区更加推荐使用氨氯地平,这可能是由于地区内特定的环境因素、患者群体的特征,或者该区域医疗机构的用药习惯。对于丰台区的患者,需要根据心血管疾病风险来调整用药,以确保高风险患者得到更针对性的治疗。此外,对于东城、西城和朝阳区的高龄患者,需要考虑并发症如糖尿病和高血脂的影响,采取更为审慎的用药策略。



图片.png


图10 最优用药策略的决策树模型

进一步,为了决策树模型解释性更高,能够更好地指导患者进行用药策略地指导,我们剔除地区因素,聚焦于年龄分层和共病情况,建立了图11所示的用药策略决策树模型。从图中可以得到以下启发:糖尿病作为高血压的一种共病,需要率先被重点关注,用药策略需要更为审慎;对于高龄患者(大于82岁),硝苯地平可能是更好的选择;进一步,共病的数量对于用药策略具有决定性作用,再其次是不同的年龄分层,对于具有心血管疾病的患者,若其没有其他共病,可以推荐使用氨氯地平;对于中年患者(小于55岁,大于47岁),若其没有高血脂问题,可以推荐使用氨氯地平,但对于存在高血脂问题的患者,需要进一步采用其他用药进行审慎的用药策略。

图片.png

图11 最优用药策略的决策树模型(不含地区)

四、 局限性与讨论

在本案例中,尽管我们将就诊总金额作为衡量治疗成本和间接反映疾病严重程度的指标,并希望通过最小化该指标来找到“最优”用药策略,但需要指出的是,该指标仅能部分反映治疗的成本。理想情况下,最好的结局变量应该是疗效,即血压控制的稳定程度的相关生化指标,或同样疗效下的治疗成本。然而,由于当前数据中缺乏直接的疗效信息,我们选择了就诊总金额作为一个近似的代理指标。然而,值得注意的是,即使治疗成本较低,也不一定代表疗效良好。此外,影响高血压用药的关键因素还有高血压的严重程度、患病时长、原发还是继发、以及伴随疾病等,但目前数据信息中还没有这些变量信息,因此,我们需要谨慎解释研究结果,并认识到这种指标的局限性。未来的研究中可以基于更加详细的数据信息进行分析,进一步纳入更为重要的变量信息,并探索更能准确反映疗效的结局变量,以提高研究的可信度和适用性。

本案例为中国人民大学统计学院——中国人寿再保险有限责任公司“公共健康与风险管理”联合实验室课题资助项目的实证结果。