• 首页
  • 机构概况
    • 研究院概况
    • 学术委员会
    • 研究团队
    • 研究方向
  • 研究成果
    • 学术论文
    • 学术专著
    • 研究报告
    • 研究项目
    • 专利标准
  • 科普案例
  • 数据资源
    • 调查数据
    • 医学信息数据
    • 基因组数据
    • 医学影像数据
    • 临床试验数据
  • 在线分析
    • 肺癌分析工具
    • 阿尔茨海默病分析工具
    • 自动化统计报告工具
  • 联系我们
CN EN

研究成果

  • 学术论文
  • 学术专著
  • 研究报告
  • 研究项目
  • 专利标准
首页 >  研究成果 >  学术论文

NEWInsurance Loss Modeling with Gradient Tree-Boosted Mixture Models

2025-04-17

在精算实践中,有限混合模型是一种广泛应用的统计方法,用于拟合保险损失。尽管期望最大化(EM)算法通常是混合模型参数估计的重要工具,但它存在一些问题,如难以进行特征工程和变量选择,以及容易发生过拟合。为了解决这些问题,我们提出了一种期望增强(EB)算法,该算法在第二步中通过梯度提升决策树,自适应地增加似然函数值。EB算法能够非参数化地、对过拟合敏感地,估计混合概率和成分分布参数,并同时执行自动化特征工程、模型拟合和变量选择,从而充分挖掘特征空间的预测能力。此外,所提出的算法可以与并行计算方法结合,以提高计算效率。最后,两项模拟研究和一项索赔金额的实证研究展示了该算法的良好性能。

NEWIdentification and Estimation of Causal Effects in the Presence of Confounded Principal Strata

2025-03-31

作为因果推断的重要工具,主分层分析近年来得到广泛应用,特别是在不依从问题和死亡截断问题中。在这些研究中,主分层由中间变量的联合潜在结果值确定,通常关注的是每个主分层内的因果效应,即主分层因果效应。传统基于观测数据识别主分层因果效应的研究需要依赖于处理分配的可忽略性假设,该假设本质上要求研究人员准确地测量尽可能多的协变量,以涵盖所有潜在的混杂因素。这在实践中可能由于成本和技术限制等原因而难以实现。针对这一问题,本文在处理和主分层之间存在未观测混杂因素的情况下,提出一种对主分层因果效应进行识别与估计的方法。该方法主要通过借助一对阴性对照变量来减少未观测混杂的影响,从而实现主分层因果效应的非参数识别。模拟结果表明该方法在估计的偏差、标准误和覆盖率上表现良好。此外,本文将所提出的方法应用于白血病研究的真实数据集中,用于评估两种不同的移植方案对于存活组白血病患者复发时间的影响。

An Ensemble Deep Learning Model for Risk Stratification of Invasive Lung Adenocarcinoma using Thin-Slice CT

2024-04-23

该研究主要提出了一种集成多视野的三维卷积神经网络(EMV-3D-CNN)模型用来对肺癌风险进行分级。肺癌一直是全球威胁人类健康最常见的癌症之一,它也是导致癌症相关死亡的主要原因,约占全部癌症相关死亡的18%。在中国,2020年肺癌发病率和癌症相关死亡率在所有癌症中位居第一位,总体5年生存率约为30%。近年来,随着低剂量计算机断层扫描(Computed Tomography, CT)在肺癌筛查中的普及,更多早期肺癌被发现。而快速发展的人工智能技术,可以让研究人员基于大量历史CT数据,通过设计新颖的深度学习模型来判断肺结节的病灶类型。本研究从实际的临床问题出发,系统解决了在临床实践中,肺结节诊断的三个重要问题

Adaptive Randomization via Mahalanobis Distance

2024-04-23

在疗效比较研究中,研究人员经常寻求最佳的协变量平衡。然而,即使在随机实验中,协变量的不平衡仍然存在,并且随着协变量数量的增加而变得更加严重。为了解决这个问题,本研究引入了一种新的随机化过程,称为通过马氏距离(ARM)的自适应随机化。所提出的方法使用当前不平衡水平和输入单元协变的信息,顺序自适应地分配单元。理论结果和数值比较表明,在具有大量协变量或大量单位的情况下,所提出的方法在协变量平衡、估计精度、假设检验能力和计算时间方面比传统方法具有显著优势。所提出的方法达到了最优协变量平衡,即估计的治疗效果渐近地达到其最小方差,并且可以应用于因果推理和临床试验。最后,数值研究和实际数据分析进一步证明了该方法的优点。在CRAN中可以自由访问实现所提出方法的R包CARM。

A Fresh Perspective on Examining Population Emotional Well-Being Trends by Internet Search Engine: An Emerging Composite Anxiety and Depression Index

2024-04-21

鉴于传统的焦虑或抑郁评估量表实施难、成本大,在了解群体心理特征趋势时存在诸多困难。该论文提供了一种新的方法,通过专注于在线检索信息来分析人群的情绪健康趋势。利用社交媒体上情感丰富的文本来构建舆论词典(POD)。然后,将POD与词向量模型和搜索趋势相结合,建立了复合焦虑抑郁指数(CADI),该指数可以反映特定时间段内一个地区的心理健康水平。研究者利用外部数据验证了CADI的有效性,同时采用回归和亚组分析进一步阐明了公共心理健康(通过CADI测量)与经济发展和医疗负担之间的关联。

人口老龄化下的寿命延长伴随健康水平下降吗?

2023-12-04

国内学者对我国健康预期寿命变动规律的研究大多基于人口抽样调查或CLHLS 和CHARLS 等微观调查数据,这些数据存在一定的抽样偏差和误差问题,少数基于2010 年人口普查数据的研究不能反映近10年的变化情况。另外,已有研究很少使用因素分解法深入分析死亡和健康因素对健康预期寿命变动的影响。基于此我院王晓军教授对该问题进行了研究,在《保险研究》期刊上发表了题目为《人口老龄化下的寿命延长伴随健康水平下降吗?》的论文。

突发重大传染病疫情数据互联网统计体系研究

2023-12-04

新型冠状病毒持续全球蔓延,应对病毒蔓延成为国家应急管理的重点,大数据在这一挑战中的应用和开放备受瞩目。我院赵彦云教授以政府数据开放平台为基础,针对新冠肺炎防控进行了探索性研究,并在统计学顶级期刊《统计研究》发表了《突发重大传染病疫情数据互联网统计体系研究》的论文,提出了政策建议。

我国人口死亡风险异质与混合模型研究

2023-12-04

在人口随机死亡率的建模方法中,对于人口死亡风险异质性的研究尚属相对稀缺。特别是在涉及不同地区、不同性别的多个人口群体死亡率建模时,忽视死亡风险异质性问题可能带来严重影响。然而,当前研究并未将风险异质性假设扩展到多人口死亡率建模中。

上一页
1 2 3 4 5 6
下一页

友情链接

  • 中国人民大学
  • 国家卫生健康委员会
  • 中国人民大学统计学院
  • 国家疾病预防控制局
  • 中国人民大学应用统计科学研究中心
  • 中国疾病预防控制中心

联系方式

联系人:钱老师

邮箱:health@ruc.edu.cn

地址:北京市海淀区中关村大街59号中国人民大学明德主楼10层

中国人民大学健康大数据研究院 版权所有

  • 机构概况
    • 研究院概况
    • 学术委员会
    • 研究团队
    • 研究方向
  • 研究成果
    • 学术论文
    • 学术专著
    • 研究报告
    • 研究项目
    • 专利标准
  • 科普案例
  • 数据资源
    • 调查数据
    • 医学信息数据
    • 基因组数据
    • 医学影像数据
    • 临床试验数据
  • 在线分析
    • 肺癌分析工具
    • 阿尔茨海默病分析工具
    • 自动化统计报告工具
  • 联系我们