軟件所在圖對比學習拓撲判別方面取得進展
軍工資源網 2024年01月23日近日,中國科學院軟件研究所研究團隊的論文Hierarchical Topology Isomorphism Expertise Embedded Graph Contrastive Learning被計算機科學領域學術會議AAAI 2024 Fast Track接收。論文提出了一種新穎的引入層次拓撲同構專家知識的自監督圖對比學習方法HTML(Hierarchical Topology isomorphism expertise embedded graph contrastive Learning)。該方法采用知識蒸餾技術,能夠學習圖層和子圖層的拓撲同構專家知識,同時具有即插即用的特點,適用于多種先進的圖對比學習方法。
圖對比學習方法的一個主要挑戰是探索圖數據的異構判別信息。作為人工衍生的離散數據結構,圖數據包含兩種關鍵的潛在判別信息:特征級信息和拓撲級信息。近期研究表明,盡管當前的圖對比學習方法能夠有效探索特征級判別信息,卻只能模擬相對有限的拓撲級判別信息。
為此,研究團隊嘗試通過指導圖神經網絡學習拓撲級信息,來提高圖對比學習方法學習判別性信息的能力。經探索實驗證明,雖然基于圖神經網絡的基準圖對比學習方法(GraphCL)不能有效地學習圖拓撲專家知識,但是將這種圖拓撲專家知識引入基于圖神經網絡的圖對比學習方法會引發判別性能的急劇提升。由此表明圖拓撲專家知識能進一步補充基于圖神經網絡的圖對比學習方法,謹慎融合特征級和拓撲級判別信息可以顯著提高圖對比學習模型在無監督圖表示學習上的性能。
基于上述實驗分析,研究團隊提出引入層次拓撲同構專家知識的圖對比學習方法HTML,即使用知識蒸餾技術在圖對比學習模型中隱式地引入圖拓撲專家知識。為了對具有不同拓撲結構的圖進行全局分類,研究團隊將Weisfeiler-Lehman(WL)測試作為圖層專家系統,引導基準圖對比學習方法學習圖層拓撲同構專家知識。為了捕獲細粒度的拓撲級判別信息,研究團隊引入計算重疊子圖的結構系數方法作為子圖層專家系統,同時引導基準圖對比學習方法學習子圖層拓撲同構專家知識。
研究團隊還基于貝葉斯決策規則給出理論分析,證明了與傳統的圖對比方法相比,HTML實現了更嚴格的貝葉斯誤差界;同時在17個真實世界數據集、4個圖對比學習模型、2個圖表示學習任務上進行了實驗,結果表明HTML在不同實驗設置下均表現出最佳性能。
探索實驗結果
HTML模型框架圖