Subsampling Spectral Clustering for Stochastic Block Models in Large-Scale Networks

发布时间:2024-04-26浏览量:


科学技术的快速发展产生了大量的网络数据,给网络社区检测带来了重大的计算挑战。针对这一问题,我们提出了一种二阶子采样谱聚类算法,旨在识别计算资源有限的大规模网络中的群落结构。该算法通过对整个网络进行简单的随机子采样来构建子网络,然后将现有的谱聚类扩展到子网络,以估计整个网络节点的社区标签。因此,对于大规模数据集,该方法甚至可以使用个人计算机来实现。此外,所提出的方法可以并行推广。从理论上讲,在随机块模型及其推广下,相应地建立了度校正随机块模型,子采样谱聚类方法的理论性质。最后,为了说明和评估所提出的方法,进行了大量的模拟研究和两个真实数据分析。