基于多层网络分解的癌症在线健康社区跨癌种与时序情感分析
发布时间:2025-09-18浏览量:一、研究背景
癌症的诊断与治疗过程常伴随焦虑、悲伤、恐惧等一系列复杂情绪,不仅影响患者心理适应,也与内分泌、免疫功能及治疗依从性密切相关。在线健康社区(OHC)为患者、家属及相关人员提供了匿名化表达与情感支持的平台,成为研究癌症情感表达的重要数据来源。然而,现有研究多局限于单一癌种或静态分析,缺乏对多癌种共性与特性、以及情绪随时间动态变化的系统建模。
二、研究目标
本研究旨在提出一种基于词共现网络的多层分解模型,系统分析多癌种OHC发帖中的情感表达结构,识别跨癌种的共性特征、癌种特异性模式及其随时间的变化规律,从而为癌症心理干预和患者支持提供数据驱动的见解。
三、研究内容
本文选取美国癌症协会(ACS)旗下Cancer Survivors Network(CSN)平台中八类主要癌症(肺、肾、乳腺、卵巢、前列腺、头颈、结直肠癌及淋巴瘤)在2003年9月至2022年9月期间发布的超过66万条公开帖文,通过AFINN情感词典筛选出200个关键情感词,构建以六个月为时间窗口的词共现网络,并使用最大信息系数(MIC)量化词语间关联强度。
四、研究结果
在时间维度上,本研究识别出三个显著的变化点,分别为2008/09、2009/03和2018/09,这些时间点与社交媒体平台兴起、移动健康应用普及以及数据隐私政策加强等外部社会技术变迁高度吻合。尤其是2018年之后,网络整体密度显著下降,反映出公众对健康信息共享的态度趋于谨慎,平台互动模式发生结构性转变。
图1 情感表达网络在不同癌症中的密度箱线图,随时间变化而绘制。颜色差异代表断点的存在。
在癌种差异方面,本研究通过聚类分析发现肺癌、肾癌和卵巢癌的情感表达模式最为接近,其网络密度显著低于其他类别,情感表达相对抑制,与这三种癌症较高的恶性程度和不良预后形成对应;头颈癌与淋巴瘤聚为一类,乳腺与结直肠癌聚为另一类,而前列腺癌则独自成簇,说明不同癌种在情感表达方式上存在明显的疾病特异性。
图2情感表达网络密度的山脊线图。不同颜色对应于癌症类型的聚类。
进一步从语义网络层面来看,每一类癌症都表现出独特的“专属情感词”,如肺/肾/卵巢癌中专属词“hopeless”与“pain”“care”等词高度共现,反映出患者面对预后较差疾病时的绝望感;前列腺癌的相关帖子则更多使用“superior”“conflict”“threat”等与理性判断和身份相关的词汇;而乳腺和结直肠癌患者则更频繁地使用“shame”“guilt”“grief”等与身体意象和亲密性相关的负面情绪词,体现出该类癌症对患者心理和社会功能的深层影响。
本研究最终通过跨癌种与时间动态的双重视角,揭示了癌症患者情感表达的复杂结构,为面向特定癌种和时期的心理支持策略提供了实证依据。
五、相关文献
Fan, X., Liu, M., & Ma, S. (2025). Network-based modeling of emotional expressions for multiple cancers via a linguistic analysis of an online health community. The Annals of Applied Statistics, 19(3), 2218-2236.