• 首页
  • 机构概况
    • 研究院概况
    • 学术委员会
    • 研究团队
    • 研究方向
  • 研究成果
    • 学术论文
    • 学术专著
    • 研究报告
    • 研究项目
    • 专利标准
  • 科普案例
  • 数据资源
    • 调查数据
    • 医学信息数据
    • 基因组数据
    • 医学影像数据
    • 临床试验数据
  • 在线分析
    • 肺癌分析工具
    • 阿尔茨海默病分析工具
    • 自动化统计报告工具
  • 联系我们
CN EN

研究成果

  • 学术论文
  • 学术专著
  • 研究报告
  • 研究项目
  • 专利标准
首页 >  研究成果 >  学术论文

NEWReduced Rank Multivariate Spatial Autoregressive Model for Large-scale Networks

2026-06-08

In spatial and social network analysis, multivariate spatial autoregressive (MSAR) models are effective tools for analyzing network data with multivariate responses. When the dimension of the response is divergent, however, the number of unknown parameters in an MSAR increases at a rate that is proportional to the square of the dimensionality, which poses significant challenges to the model estimation process. To address this issue, we propose a novel reduced-rank MSAR model by imposing a low-rank structure on the spatial influence matrix of the multivariate responses. The proposed model achieves substantial dimensionality reduction and offers insightful interpretations. To mitigate the high computational cost of the quasi-maximum likelihood estimator (QMLE), we propose a least squares estimator (LSE) for estimating the unknown parameters. Furthermore, we establish the asymptotic nature of the LSE when both the network size and the dimensionality of the responses diverge to infinity. To determine the rank, we propose an information criterion estimator and demonstrate the consistency of its rank selection process. Extensive numerical simulations validate the proposed model and parameter estimates. Finally, a dataset derived from Shouqianba, one of the largest aggregate payment platforms, is analyzed for illustration purposes.

NEWIdentification and Multiply Robust Estimation of Causal Effects via Instrumental Variables from an Auxiliary Population

2026-05-25

在目标人群中存在未观测混杂且缺乏工具变量时,因果效应的估计较为困难。本文利用来自辅助人群的工具变量,通过数据融合的方法来识别目标人群中的因果效应。文章首先讨论了基于条件平均处理效应同质性的传统思路,但该方法在处理效应存在异质性时可能产生偏倚。为此,本文提出了等混杂(equal-confounding)假设,即在调整观测协变量后,不同人群中的未观测混杂偏倚相同,但允许处理效应在不同人群之间存在差异。在此基础上,可以利用辅助人群识别混杂偏倚,并据此校正目标人群中处理与结果之间的关联性,从而恢复因果效应。文章进一步提出了多稳健估计方法及去偏机器学习方法,并通过模拟研究和真实数据分析验证了方法的有效性。

Incorporating Prior Information in Gene Expression Network-Based Cancer Heterogeneity Analysis

2024-07-29

癌症在分子层面上具有异质性,表面上看似相似的患者实际上拥有不同的分子景观,并因此表现出不同的临床行为。最近的研究表明,基因表达网络在癌症异质性分析方面比一些更简单的度量方法更有效且信息量更大。基因之间的互联可以分为“直接”与“间接”,其中“间接”互联可能由共享的基因调控因子(如转录因子、微小RNA及其他调控分子)以及其他机制引起。已有研究建议,在网络分析中纳入基因表达的调控因子,并专注于直接的互联,可以更深入地理解更为关键的基因互联。然而,这种分析面临着大量参数(由网络分析、调控因子的纳入及异质性共同导致)和通常较弱信号的严重挑战。为有效应对这一问题,我们提出将已发表文献中包含的先验信息纳入分析。一个关键挑战在于这些先验信息可能是不完整的甚至是错误的。我们开发了一种两步程序,能够灵活地适应不同质量水平的先验信息。模拟结果证明了所提方法的有效性及其相对于相关竞争方法的优越性。在对一个乳腺癌数据集的分析中,得出了与其他方法不同的发现,且识别出的样本子群具有重要的临床差异。

Identification and Estimation of Causal Effects in the Presence of Confounded Principal Strata

2024-07-29

​作为因果推断的重要工具,主分层分析近年来得到广泛应用,特别是在不依从问题和死亡截断问题中。在这些研究中,主分层由中间变量的联合潜在结果值确定,通常关注的是每个主分层内的因果效应,即主分层因果效应。传统基于观测数据识别主分层因果效应的研究需要依赖于处理分配的可忽略性假设,该假设本质上要求研究人员准确地测量尽可能多的协变量,以涵盖所有潜在的混杂因素。这在实践中可能由于成本和技术限制等原因而难以实现。针对这一问题,本文在处理和主分层之间存在未观测混杂因素的情况下,提出一种对主分层因果效应进行识别与估计的方法。该方法主要通过借助一对阴性对照变量来减少未观测混杂的影响,从而实现主分层因果效应的非参数识别。模拟结果表明该方法在估计的偏差、标准误和覆盖率上表现良好。此外,本文将所提出的方法应用于白血病研究的真实数据集中,用于评估两种不同的移植方案对于存活组白血病患者复发时间的影响。

Sequential Covariate-Adjusted Randomization via Hierarchically Minimizing Mahalanobis Distance and Marginal Imbalance

2024-06-01

在对比研究中,协变量平衡和序列分配方案受到越来越多的学术关注。尽管许多理论上合理的自适应随机化方法实现了协变量平衡,但它们通常以成对或成组的方式分配患者。为了更好地满足临床医生由于经济或伦理原因无法等待其他参与者来分配当前患者的实际需求,我们提出了一种对患者进行个体和序列随机化的方法。所提出的方法在概念上将协变量失衡(通过新提出的修正马氏距离衡量)和边际失衡(即两组之间的样本量差异)分开,并以明确的优先顺序将它们最小化。与现有的序列随机化方法相比,所提出的方法在直接保持边际平衡的同时实现了最佳可能的协变量平衡,从而为我们提供了更多的随机化过程控制。我们通过广泛的模拟研究和真实数据分析展示了所提出方法的优越性能,并在失衡度量的收敛性以及随后治疗效果估计方面为该方法建立了理论保证。

Association between Influenza Vaccination and One-Year All-Cause and Cardiovascular Mortality Risk: A Self-Controlled Case Series and Matched Case-Control Study

2024-06-01

关于流感疫苗在生存获益方面的有效性仍存在争议,并且缺乏其保护持续时间的证据。我们使用2005年至2018年美国的国家健康访谈调查(NHIS)数据和死亡公开数据,进行了自身对照病例系列(SCCS)研究和1:4匹配的病例对照研究。SCCS研究的研究人群为在调查前12个月内接种过流感疫苗且在接种后1年内死亡的参与者。匹配的病例对照研究将调查时流感季节死亡的参与者与四名幸存者配对。在SCCS研究的1167名参与者中,接种后29–196天内发生全因死亡的风险较基线水平降低了46%,心血管死亡的风险降低了43%。最强的保护作用出现在接种后29–56天(全因死亡:RI:0.19;95% CI:0.12–0.29;心血管死亡:RI:0.28;95% CI:0.14–0.56)。在匹配的病例对照研究中,包含626例病例和2504名对照,流感疫苗接种与流感季节降低的全因死亡风险(OR:0.74,95% CI:0.60–0.92)和心血管死亡风险(OR:0.64,95% CI:0.44–0.93)相关。本研究强调了流感疫苗在降低全因和心血管死亡风险方面的重要性,其效果可持续约6个月。

Green’S Matching: An Efficient Approach to Parameter Estimation in Complex Dynamic Systems

2024-05-30

微分动力系统的关键参数对于描述整个系统的内在特征至关重要。许多用于估计动力系统参数的方法在计算或统计推断上是不充分的,特别是对于具有高阶微分算子的复杂系统,如运动动力学。本文介绍了格林匹配法,这是一种计算上可行且统计上高效的两步方法,因为通过计算格林函数微分算子的逆,它只需要逼近动态系统中的轨迹,而不需要算出它们的导数。这保证了一般阶方程中的参数估计量的优良统计性质,也是前人方法所不具备的特性。总的来说,格林匹配技术为复杂动态系统中的广泛统计推断提供了一个有效的框架。

A Semiparametric Gaussian Mixture Model for Chest CT-based 3D Blood Vessel Reconstruction

2024-05-30

计算机断层扫描(CT)技术自上世纪70年代问世以来一直是一种强大的诊断工具,利用CT成像数据,科研人员可以对人体内部器官和组织(如血管)进行三维重建。这种人体组织器官的三维重建对于外科手术来说至关重要,此外它也可以作为一个医学教学示例。然而,传统的三维重建工作严重依赖医生的手动操作,这些操作耗时且主观,此外需要医生具有较为丰富的经验。因此,本文针对人体血管自动三维重建的问题,提出了一种新型半参数高斯混合模型。该模型是对经典的混合高斯模型的拓展,它允许参数(例如均值和方差)在不同体素上具有非参数变化。同时,本文也开发了基于核的期望最大化算法来估计模型参数,并给出了相应的渐近理论。此外,本文提出了一种新型的基于回归的方法来选择最佳带宽。与传统的基于交叉验证的方法相比,基于回归的带宽选择方法在计算和统计效率方面表现更好。最后,本文给出了全自动实现人体血管三维重建的实例并取得了较高的精度。

上一页
1 2 3 4 5 6 7 8
下一页

友情链接

  • 中国人民大学
  • 国家卫生健康委员会
  • 中国人民大学统计学院
  • 国家疾病预防控制局
  • 中国人民大学应用统计科学研究中心
  • 中国疾病预防控制中心

联系方式

联系人:钱老师

邮箱:health@ruc.edu.cn

地址:北京市海淀区中关村大街59号中国人民大学明德主楼10层

中国人民大学健康大数据研究院 版权所有 京公网安备110402430004号 | 京ICP备05066828号-1

  • 机构概况
    • 研究院概况
    • 学术委员会
    • 研究团队
    • 研究方向
  • 研究成果
    • 学术论文
    • 学术专著
    • 研究报告
    • 研究项目
    • 专利标准
  • 科普案例
  • 数据资源
    • 调查数据
    • 医学信息数据
    • 基因组数据
    • 医学影像数据
    • 临床试验数据
  • 在线分析
    • 肺癌分析工具
    • 阿尔茨海默病分析工具
    • 自动化统计报告工具
  • 联系我们