• 首页
  • 机构概况
    • 研究院概况
    • 学术委员会
    • 研究团队
    • 研究方向
  • 研究成果
    • 学术论文
    • 学术专著
    • 研究报告
    • 研究项目
    • 专利标准
  • 科普案例
  • 数据资源
    • 调查数据
    • 医学信息数据
    • 基因组数据
    • 医学影像数据
    • 临床试验数据
  • 在线分析
    • 肺癌分析工具
    • 阿尔茨海默病分析工具
    • 自动化统计报告工具
  • 联系我们
CN EN

研究成果

  • 学术论文
  • 学术专著
  • 研究报告
  • 研究项目
  • 专利标准
首页 >  研究成果 >  学术论文

NEWInsurance Loss Modeling with Gradient Tree-Boosted Mixture Models

2025-04-17

在精算实践中,有限混合模型是一种广泛应用的统计方法,用于拟合保险损失。尽管期望最大化(EM)算法通常是混合模型参数估计的重要工具,但它存在一些问题,如难以进行特征工程和变量选择,以及容易发生过拟合。为了解决这些问题,我们提出了一种期望增强(EB)算法,该算法在第二步中通过梯度提升决策树,自适应地增加似然函数值。EB算法能够非参数化地、对过拟合敏感地,估计混合概率和成分分布参数,并同时执行自动化特征工程、模型拟合和变量选择,从而充分挖掘特征空间的预测能力。此外,所提出的算法可以与并行计算方法结合,以提高计算效率。最后,两项模拟研究和一项索赔金额的实证研究展示了该算法的良好性能。

NEWIdentification and Estimation of Causal Effects in the Presence of Confounded Principal Strata

2025-03-31

作为因果推断的重要工具,主分层分析近年来得到广泛应用,特别是在不依从问题和死亡截断问题中。在这些研究中,主分层由中间变量的联合潜在结果值确定,通常关注的是每个主分层内的因果效应,即主分层因果效应。传统基于观测数据识别主分层因果效应的研究需要依赖于处理分配的可忽略性假设,该假设本质上要求研究人员准确地测量尽可能多的协变量,以涵盖所有潜在的混杂因素。这在实践中可能由于成本和技术限制等原因而难以实现。针对这一问题,本文在处理和主分层之间存在未观测混杂因素的情况下,提出一种对主分层因果效应进行识别与估计的方法。该方法主要通过借助一对阴性对照变量来减少未观测混杂的影响,从而实现主分层因果效应的非参数识别。模拟结果表明该方法在估计的偏差、标准误和覆盖率上表现良好。此外,本文将所提出的方法应用于白血病研究的真实数据集中,用于评估两种不同的移植方案对于存活组白血病患者复发时间的影响。

人工智能辅助机会性CT与双能X线骨密度检测在2型糖尿病和非糖尿病患者骨量评估中的比较研究

2024-12-11

骨质疏松症是老年人常见的代谢性骨病,表现为骨量减少和骨微结构受损,增加骨折风险。双能X线吸收测量仪(DXA)是目前诊断骨质疏松症的金标准,但其设备有限,难以满足临床大规模筛查需求。近年来,人工智能辅助的医学图像处理技术在骨质疏松症的检测中展现出潜力,尤其是通过X线、CT或MR影像替代DXA进行骨密度测量。糖尿病患者骨质疏松的发生风险较高,且现有DXA检测在糖尿病患者中的骨折风险预测效果有限。因此,AI定量CT骨密度检测在糖尿病患者中的应用价值成为临床关注的焦点。我国作为糖尿病大国,2015—2017年成人糖尿病患病率高达11.2%,糖尿病患者是骨质疏松的高危人群。尽管糖尿病患者骨质疏松的筛查和诊断有着较大需求,但现有的骨密度测量手段在糖尿病人群中的应用仍存在一定的局限性。本文通过对比DXA与AI定量CT骨密度检测在正常与糖尿病人群中的诊断差异,探讨其在骨质疏松和骨量减少筛查中的应用前景。

我国老年失能风险研究:基于删失数据半参转换模型

2024-11-11

老年失能风险是人口老龄化背景下值得关注的重要问题。已有研究往往忽略失能数据的删失属性,无法充分利用数据信息。本文提出了一种新的老年失能风险建模方法,首先在考虑失能数据区间删失和右删失的情况下,对中国老年健康影响因素跟踪调查(CLHLS)数据按个体从健康状态转移到首次失能状态经历的时间进行分类,同时利用CLHLS死亡调查补充个体死亡前的失能信息。在此基础上,基于生存分析中的半参数转换失能时间模型,实现对老年失能率更准确的估计和预测。与传统模型相比,新模型将年龄、性别、教育水平等变量纳入模型,能够对不同特征人群的失能风险做更细致和精准的分析,为完善我国长期护理保险制度提供了实证依据。

Missing Data Considerations for Patient-Reported Outcome Measures in Randomized Controlled Trials

2024-10-28

国际生活质量研究学会(International Society for Quality of Life Research, ISOQOL)年度会议于2024年10月13日至16日在德国科隆举办。研究院教师李扬、林存洁、梅好及团队与跨国制药企业默沙东(MSD)合作完成的研究“Missing Data Considerations for Patient-Reported Outcome Measures in Randomized Controlled Trials”在大会上以海报形式进行发布。

RFDFM: A Deep Factorization Machine Network Model for Invasive Lung Adenocarcinoma Screening in CT Images    

2024-10-24

作为肺癌的一种常见亚型,肺腺癌的诊断在临床实践中具有重要意义,特别是在区分非侵袭性腺癌(Pre-IA)和侵袭性腺癌(IAC)方面。这一区分至关重要,因为这两种病变对应着不同的临床治疗策略:Pre-IA通常需要患者进行随访以观察结节的进展情况,从而制定后续的治疗方案,而IAC一般来说需要进行手术干预。本研究针对肺腺癌的侵袭性分类问题,提出了一种基于影像组学特征的深度因子分解机模型(Radiomic Feature Deep Factorization Machine,RFDFM)。RFDFM模型结构包括了多个关键技术要点:首先,首次在医疗影像领域中引入了因子分解机模块,有效建模了不同影像组学特征之间的相互作用,提高了预测性能;其次,采用低层次特征融合卷积神经网络,最小化信息损耗,增强特征利用效率;此外,在特征融合过程中应用元素级注意力机制,动态为特征分配权重,突出关键特征,提高模型的拟合效率等。

Effectiveness of Influenza Vaccines in Preventing Acute Cardiovascular Events within 1 Year in Beijing, China

2024-09-28

关于流感疫苗对急性心血管事件的保护作用仍存在争议。我们利用全北京市住院电子病历和流感疫苗接种数据,研究了2016年1月1日至2018年12月31日期间接种流感疫苗且在接种后两年内至少经历过一次急性心血管事件的个体。采用自身对照病例系列设计,计算了接种后一年内急性心血管事件的相对发生率(RI)及95%置信区间(CI)。在1647名参与者中(中位年龄:65岁,女性占38.43%),疫苗接种后29–365天内事件风险为基线水平的0.76倍(RI:0.76;95% CI:0.68–0.84)。这一保护作用在较年轻的参与者(P = 0.043)和无心血管病史的个体(P < 0.001)中更为明显,而急性呼吸道感染(P = 0.986)和接种频率(P = 0.272)不会影响流感疫苗对心血管事件的保护效果。本研究发现,流感疫苗对急性心血管事件的保护效果可持续至少一年,这提示其对心血管疾病的预防具有潜力。

Sparse Clustering for Customer Segmentation with High-Dimensional Mixed-Type Data

2024-09-01

客户细分在商业活动中有广泛的应用,如个性化营销和目标产品开发。为了实现客户细分,通常使用聚类方法。然而,现代客户细分面临着高维度和混合型变量(即连续变量和分类变量的混合)的挑战。这对客户细分带来了巨大的难题,因为大多数现有的聚类方法仅设计用于单一类型变量的数据。此外,噪声变量的存在凸显了同时进行变量选择和数据聚类的必要性。基于这些问题,我们开发了一种基于戴维斯-鲍丁指数的稀疏聚类(DBI-SC)方法,用于处理高维混合型数据的客户细分。在该方法中,我们分别为连续变量和分类变量定义了不相似度度量。然后,设计了一个调整后的DBI标准,用以衡量每个变量对聚类的贡献。对于变量选择,我们应用稀疏聚类框架,并为混合型变量引入不同的惩罚参数。DBI-SC方法的筛选一致性性质也得到了研究。大量的模拟研究表明,DBI-SC方法在聚类和变量选择方面均表现出令人满意的性能。最后,使用所提方法对指定的驾驶服务数据集进行了客户细分分析。

上一页
1 2 3 4 5 6
下一页

友情链接

  • 中国人民大学
  • 国家卫生健康委员会
  • 中国人民大学统计学院
  • 国家疾病预防控制局
  • 中国人民大学应用统计科学研究中心
  • 中国疾病预防控制中心

联系方式

联系人:钱老师

邮箱:health@ruc.edu.cn

地址:北京市海淀区中关村大街59号中国人民大学明德主楼10层

中国人民大学健康大数据研究院 版权所有

  • 机构概况
    • 研究院概况
    • 学术委员会
    • 研究团队
    • 研究方向
  • 研究成果
    • 学术论文
    • 学术专著
    • 研究报告
    • 研究项目
    • 专利标准
  • 科普案例
  • 数据资源
    • 调查数据
    • 医学信息数据
    • 基因组数据
    • 医学影像数据
    • 临床试验数据
  • 在线分析
    • 肺癌分析工具
    • 阿尔茨海默病分析工具
    • 自动化统计报告工具
  • 联系我们