“如果以攀登高峰比喻邊緣人工智能(AI)不同階段發展的話,我們現在還站在山腳,即處于邊緣推理階段。”9月3日,在京舉行的2023年中國國際服務貿易交易會專題論壇中國智能產業論壇上,英特爾中國區網絡與邊緣事業部首席技術官、英特爾高級首席AI工程師張宇說。他表示,即便實現了邊緣人工智能發展的下一個目標——邊緣訓練,也只是站到了半山腰,距離真正站到山頂、實現邊緣自主機器學習(AutoML),還有很長的路要走,其間仍要克服多個挑戰。
(資料圖片僅供參考)
張宇 受訪者供圖
仍面臨多重挑戰
邊緣計算是在靠近物或數據源頭的網絡邊緣側,融合網絡、計算、存儲、應用核心能力的開放平臺,就近提供邊緣智能服務,滿足行業數字化在敏捷聯接、實時業務、數據優化、應用智能、安全與隱私保護等方面的關鍵需求。隨著邊緣端相關需求日益凸顯,2016年11月30日,英特爾公司與華為技術有限公司、中國科學院沈陽自動化研究所、中國信息通信研究院等聯合倡議成立了邊緣計算產業聯盟(ECC)。該聯盟旨在搭建邊緣計算產業合作平臺,推動OT和ICT產業開放協作,促進邊緣計算產業健康與可持續發展。
很快,隨著人工智能技術的快速發展及其向行業的進一步滲透,邊緣人工智能成為邊緣計算領域重點關注的方向之一。那么,邊緣計算和人工智能這兩者間的關系是怎樣的?邊緣計算和邊緣人工智能未來的發展目標又是否一致?就此,在接受《中國科學報》專訪時,張宇表示,作為一種技術,AI可以賦能包括邊緣計算、云計算等在內的多種計算模式。而邊緣計算作為其中一種計算模式,可以利用AI、5G等技術,在靠近數據源頭的地方給用戶提供更加及時、更具有安全性的需求響應。從長期來看,邊云融合是邊緣計算的最終發展目標。而在此過程中,智能化作為邊緣計算的一個重要趨勢,在推動最終目標的實現方面扮演著重要角色。
在中國智能產業論壇上發表的主題演講中,張宇指出,產業界對于連接、智能應用、數據隱私保護等需求的增加,推動了邊緣計算尤其是邊緣人工智能的發展。不過,當下人工智能在邊緣端的應用大多還停留在邊緣推理階段,即行業還是要利用數據中心極大的算力或大量數據訓練出一個模型,然后將訓練結果推送到前端進行推理操作。在他看來,“這種應用模式最大的局限性是對模型的更新頻率有限”。
以自動駕駛為例。自動駕駛企業在車輛出廠前會利用大量數據訓練模型,然而這時其所采用的訓練數據集跟駕駛人員真正駕駛時所面臨的路況以及駕駛場景之間會有差異,造成訓練以后模型泛化能力往往有限。這時,最有效的解決辦法就是不斷在使用過程中根據駕駛人員的駕駛習慣以及所面臨的實際路況,對模型進行不斷的二次修正,即進行邊緣訓練。
此外,如何在樣本量比較小的情況下進行有效訓練,實現有效的模型更新,例如在正常的產線上檢測出帶有缺陷的樣本?在對隱私保護越來越重視的情況下,如何在保護數據隱私的同時創新出一些能夠在邊緣側進行模型訓練的新技術?這些都是推動邊緣人工智能進入第二階段,即邊緣訓練時所要解決的問題,而這些問題往往是建設數據中心時不一定需要面對的問題。
然而,即使順利完成第二階段,人工智能所潛藏的局限性仍會制約邊緣人工智能的發展。
“有時我們和行業專家探討這一話題時,會開玩笑說,‘當下的人工智能一半是人工,一半是智能。’因為現在的人工智能,不管應用在邊緣端,還是應用在數據中心,人都在其中扮演了一個非常重要的角色。”在張宇看來,要實現真正意義上的人工智能,就需要實現自主機器學習,即網絡模型感知人的意圖,并選取適宜的樣本集訓練模型,將訓練結果推送到訓練階段進行相應操作,甚至根據訓練的結果不斷更新網絡模型,以達到理想的結果。這才是邊緣人工智能發展的最終形態。
三方面的突破
“要實現邊緣人工智能的最終目標,需要在算力、算法,乃至理論上進一步突破。”張宇說。
他告訴記者,制約邊緣人工智能發展的關鍵要素主要有三個方面。一是算力,即算力要足夠,能支撐越來越復雜的網絡模型。二是數據,因為要解決問題不能僅只設計一個模型,而是必須不斷通過數據訓練得到最終的訓練結果并付諸實用。三是人工智能核心理論的突破。“這三個方面相輔相成,缺一不可。只有這樣,才能到達邊緣人工智能的‘山頂’。”
如何面對這一過程中的諸多挑戰,并提供相應的解決方案?在張宇看來,這需要產業界的通力合作。
他舉例說。作為一家數據公司,英特爾給業界提供的是面向邊緣人工智能、網絡、數據中心的完整硬件和軟件解決方案。尤其在人工智能方面,英特爾提供了從計算、通訊到存儲等一系列產品,供開發人員進行選擇。
在計算方面,英特爾提供了包括CPU、GPU及各種人工智能芯片等在內的多種產品組合,滿足用戶對人工智能不同算力的要求。以計算為例,針對人工智能大模型的訓練和推理,英特爾在今年7月推出第二代Gaudi深度學習加速器——Habana Gaudi 2。它不僅能提供大量的算力,同時還能提供通訊能力。在近期MLPerf公司針對業界主流大模型的評測中,Gaudi 2成為全球唯二能夠提供針對大模型訓練極佳性能的產品。“對于大模型訓練,往往不能靠單顆芯片單打獨斗,而是要靠一個集群。而大集群的性能不僅僅取決于計算能力,同時也取決于通訊能力和存儲能力,Gaudi 2處理器則兼顧了這幾方面的能力。”張宇說。
此外,在硬件方面,考慮到邊緣人工智能在算力、算法復雜性以及數據安全保護等方面的訴求,英特爾采取的策略是,在增強通用處理器的同時,還提供專用的人工智能加速芯片,以滿足用戶對邊緣人工智能算力的要求。
張宇介紹說,今年英特爾還發布了第四代至強可擴展處理器。這款處理器上包含了一系列面向人工智能的技術創新,特別值得一提的是其嵌入了高級矩陣擴展(AMX)技術。該技術可以直接對矩陣計算進行加速,從而使得人工智能的推理和訓練能力相比上代提高了10倍。
當問及邊緣人工智能何時能到達“山頂”時,張宇坦言,這一時間點很難預測。不過,相比算力和算法上的進步,目前理論上的進展仍然相對較慢,而這正是下一步需要重點突破的地方。
關鍵詞: