首頁>焦點 > 正文

螞蟻集團發布大圖模型探索大模型與圖計算融合研究

2023-09-08 12:35:30 出處：環球網

(相關資料圖)

【環球網科技綜合報道】9月8日消息，在2023外灘大會“新一代數據底座——探索圖智能的應用與發展”分論壇上，螞蟻集團帶來了一項融合研究—“大圖模型”（Large Graph Model，簡稱LGM）。這項研究將圖計算與圖學習及大語言模型結合，利用大語言模型的生成能力和圖計算的關聯關系分析能力，提供更直觀、更全面的信息呈現和更精準的洞察，從而更好地解決海量復雜的數字化應用難題。目前螞蟻已完成第一階段“生成式異質圖增強”的研究工作，相關成果論文被世界計算機頂會（WWW 2023）收錄。

圖計算是一種強大的數據處理技術，可以解決復雜關系網絡中的關聯性難題，在金融反欺詐、天氣預報、藥物開發，甚至類腦研究領域都有應用，被譽為人工智能“牛鼻子”。大模型是最有可能走向通用人工智能的技術，在某些領域的任務達到了與人類相當甚至更好的表現。

為什么要用尖端技術驅動尖端技術？大語言模型不能獨立完成數據分析和挖掘任務嗎？螞蟻集團高級技術專家劉永超表示，大語言模型可以推理出隱性關聯關系，但是無法繪制關系圖，而研究數據關系需要體現清晰的鏈路，使用圖結構表示更便于理解。“將大語言模型與圖計算結合，就是先從海量信息中邏輯推理，再利用超級計算算出關系，這就類似給人類大腦外接了一臺超級計算機，能力更強了”，劉永超解釋。

在這項研究中，螞蟻集團主要開展了兩項工作。第一，利用大語言模型豐富圖數據。區別于普通的上下文依賴模型，大語言模型可以根據現有數據生成新的數據點。這項工作名為 “生成式異質圖增強”工作，即通過大語言模型來擴展和豐富不同類型的圖數據。第二，通過Prompt（一種指令或提示）引導模型學習和發現特定數據特性。例如，設置一個 Prompt“一年內違約3次以上的群體的共同特征”，模型便會生成滿足特定條件的數據樣本。這種能力可以加速數據分析和特性發現的過程。

關鍵詞：