电话

17709168119

Barabási最新研究:利用图神经网络加速网络布局

标签: 2024-02-06 

  Barabási最新研究:利用图神经网络加速网络布局网络分析的第一步是将感兴趣的网络可视化,这一过程需要特定算法的支持。目前两个最流行的可视化软件包 Cytoscape 和 Gephi 已经被用于 4 万多份出版物,记录了从系统生物学到生态学、社会科学、甚至文学的网络布局。然而,受制于现有算法的计算复杂性,大多数的可视化工作仅限于几百个,偶尔几千个节点的网络。

  网络可视化依赖于力导向布局(force-directed layout, FDL)的不同实现,这种图布局算法将链接视为弹簧,将链接的节点拉近,并依靠短程排斥力来避免节点重叠。受计算化学中能量最小化的启发,最终的布局通过梯度下降使总势能最小化而得到。虽然对数百个节点来说广泛有效,但该算法计算复杂度高,使得大型真实网络的可视化难以计算。

  因此,在探索大型真实系统的时候,如具有 20,000 个蛋白质和 300,000 个链接的人类细胞的蛋白质-蛋白质相互作用网络,或具有数百万节点的社交媒体中涌现的网络,受到了计算复杂性的阻碍,使我们揭开其结构的能力受到根本限制。试图将这种大型系统的结构可视化的结果往往是得到的仅仅是个粗略的“毛球”,只能提供对网络结构的有限洞察力。

  最新发表于 Nature Communications 的一项研究,使用图神经网络(GNN)来加速 FDL 算法的实现,不仅将运行速度提高了 10~100 倍,同时还产生了更多信息的布局,对于具有社区和局部规则性的网络特别有效。不仅如此,作者还使用图神经网络生成互联网的三维布局,并引入额外的措施来评估布局质量及其可解释性,探索算法在检测社区和链接长度分布的能力。

  该方法可以提高疫情中流行病状态的发现,帮助干预和缓解疾病传播开云网址·(中国)官方网站,改进级联故障的建模,并帮助在芯片设计中找到最佳图布局,以及加速模型捕捉社交媒体中的意见动态。深度神经网络的新颖使用也可以帮助加速其他基于网络的优化问题,可以应用从反应扩散系统到流行病的广阔领域中。

  图1. 使用神经网络实现网络布局。该神经网络依靠全连接层(FC)将高维嵌入投射到 d 维布局上。

  图2. 互联网有22,963个节点开云网址·(中国)官方网站,48,436条链路,在直方图的左边,显示了图神经网络加速的布局,而右边则是 FDL 的布局,用蓝色的节点和链接突出显示了同一个社区。

  图3. 互联网的三维布局。(a)由图神经网络生成的布局开云网址·(中国)官方网站。(b)FDL 由于被困在一个较高的能量状态中,无法识别局部社区,大范围的布局似乎是随机的,类似于一个“毛球”。(c)FDL 布局的局部放大,记录了社区结构的缺失。

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

推荐新闻