在大数据时代,图结构数据广泛存在于社交网络、推荐系统和生物信息学等领域。然而,当前的图神经网络(GNN)方法在处理大规模、异质和噪声较大的图结构数据时,往往面临着可解释性不足、过度平滑、噪声堆叠、计算复杂性高的挑战。
近期,软件学院、国际信息与软件学院万良田副教授研究团队通过创造性地融合隐层表征与拓扑信息、小波去噪与图卷积、自监督学习中的LLE降维优化、Z-laplacian框架的矩阵分解方法等多种有效方法,解决了图结构数据处理中的系列难题,为该领域的进一步研究提供了新的方向和思路。相关研究相继发表在中国计算机学会认定的数据挖掘及知识发现领域顶级学术会议及期刊(A类)中,包括2024年国际知识发现与数据挖掘大会、2023年国际万维网会议,以及IEEE知识与数据工程汇刊。文章第一作者均为万良田副教授,第一完成单位为开云平台首页 。
成果1:基于隐层表示学习的灵活图扩散模型
研究团队通过分析过度平滑问题,提出了基于扩散的隐层表征学习方法。该方法通过设计灵活的图聚合模型,根据不同节点的邻接关系自适应聚合邻居信息,从而有效应对异质图和深层网络中的过度平滑问题。FGND在堆叠256层后依然具备优秀的可区分度。
图1 FGND与GCN模型堆叠多层后隐层表示区分度对比(Cora)
成果2:小波去噪滤波器统一并改进图卷积神经网络
为解决噪声累积问题,研究团队引入了小波去噪滤波器,将其与图卷积神经网络相结合,利用小波扩散局部性的特点,显著提升了模型的效果以及可解释性,同时设计了一种新的图采样策略,在多个数据集上实现了更加稳定和准确的节点分类。
图2 字母GSP在不同小波系数下的扩散程度
成果3:基于自监督学习的图神经网络模型
研究团队聚焦于图对比学习的优化与可解释性,通过将LLE降维算法引入自监督学习框架,团队设计了更具解释性的对比学习模型,大幅提升了图嵌入的准确性,同时保持了较低的计算复杂度。研究团队提出的GraphTL模型相比之前的图对比模型MVGRL、GRACE以及有监督模型GCN,分类效果更加优秀。
图3 GraphTL模型与其他模型在分类效果上的对比
成果4:Z-拉普拉斯矩阵分解:具有可解释图信号的网络嵌入
针对计算复杂性和效率问题,研究团队提出了一种基于Z-laplacian框架的图嵌入方法。该方法通过引入偏置参数,实现了对不同时间长度扩散的精确控制,不仅提升了模型在节点分类和链路预测任务上的表现,还显著降低了计算复杂度。
图4 Z-NetMF模型在BlogCatalog数据集上的分类效果
相关研究得到了国家重点研发计划、国家自然科学基金、辽宁省自然科学基金、中央高校基本科研业务费专项资金、浙江实验室以及重庆市教委科技研究计划项目的资助和支持。
论文1链接:https://dl.acm.org/doi/10.1145/3637528.3671860
论文2链接:https://dl.acm.org/doi/10.1145/3543507.3583253
论文3链接:https://dl.acm.org/doi/abs/10.1145/3543507.3583441
论文4链接:https://ieeexplore.ieee.org/document/10313024
来源:软件学院、国际信息与软件学院
编辑:李梦瑶
审核:王增强 于舒雯