(相關資料圖)
【環球網科技綜合報道】9月8日消息,在2023外灘大會“新一代數據底座——探索圖智能的應用與發展”分論壇上,螞蟻集團帶來了一項融合研究—“大圖模型”(Large Graph Model,簡稱LGM)。這項研究將圖計算與圖學習及大語言模型結合,利用大語言模型的生成能力和圖計算的關聯關系分析能力,提供更直觀、更全面的信息呈現和更精準的洞察,從而更好地解決海量復雜的數字化應用難題。目前螞蟻已完成第一階段“生成式異質圖增強”的研究工作,相關成果論文被世界計算機頂會(WWW 2023)收錄。
圖計算是一種強大的數據處理技術,可以解決復雜關系網絡中的關聯性難題,在金融反欺詐、天氣預報、藥物開發,甚至類腦研究領域都有應用,被譽為人工智能“牛鼻子”。大模型是最有可能走向通用人工智能的技術,在某些領域的任務達到了與人類相當甚至更好的表現。
為什么要用尖端技術驅動尖端技術?大語言模型不能獨立完成數據分析和挖掘任務嗎? 螞蟻集團高級技術專家劉永超表示,大語言模型可以推理出隱性關聯關系,但是無法繪制關系圖,而研究數據關系需要體現清晰的鏈路,使用圖結構表示更便于理解?!皩⒋笳Z言模型與圖計算結合,就是先從海量信息中邏輯推理,再利用超級計算算出關系,這就類似給人類大腦外接了一臺超級計算機,能力更強了”,劉永超解釋。
在這項研究中,螞蟻集團主要開展了兩項工作。 第一,利用大語言模型豐富圖數據。區別于普通的上下文依賴模型,大語言模型可以根據現有數據生成新的數據點。這項工作名為 “生成式異質圖增強”工作,即通過大語言模型來擴展和豐富不同類型的圖數據。第二,通過Prompt(一種指令或提示)引導模型學習和發現特定數據特性。例如,設置一個 Prompt“一年內違約3次以上的群體的共同特征”,模型便會生成滿足特定條件的數據樣本。這種能力可以加速數據分析和特性發現的過程。
關鍵詞: