(相關資料圖)
大語言模型:NLP技術的奇點時刻。語言模型的核心是對任意一段文本序列進行概率建模,用一個高維向量來表示一個token的全部特征。我們將深度學習應用于NLP領域的范式轉移總結為"有監督的機器學習->預訓練+微調->預訓練+提示"。其中,ChatGPT的橫空出世開啟了“預訓練+提示”的新范式,這主要得益于OpenAI對生成類模型(GPT)和算法規模化(Scalability)這兩個基礎技術路線的成功押注,大語言模型“涌現”出了解決復雜問題的通用能力,催生了本輪全球范圍內的生成式AI浪潮。
大模型應用:數據感知與代理能力。如何將個人的個性化私有數據和企業多年積累的行業專有知識嫁接到大模型的通用能力上,是大模型在垂直領域商業化落地的核心技術問題。我們在報告中詳細列舉了三種目前業內主流的實踐方法,并對其優劣進行了比較分析。除了獲取外部數據外,通過增加代理能力(Agent),讓大語言模型具備自主理解、規劃、執行復雜任務的能力,同時與計算機內部環境,甚至物理世界進行交互,這也將顯著打開大模型應用的想象空間。此外,我們認為提升模型支持的上下文長度是應用創新的關鍵靶點,模型小型化也將助力大模型應用的商業化落地。
應用分析框架:通用能力與外部能力的組合。大模型應用可以被總結為,在基座模型的通用能力上,疊加一些其他的可實現的外部能力,這就包括上述的數據感知(可連接其他外部數據源)和代理能力(允許大模型與環境互動)。根據這一范式,我們可以將現階段大模型的應用邊界歸納為通用認知能力與上述兩種外部能力的排列組合?;诖?,展望未來大模型新應用的靶點可總結為:①通用能力的增強(上下文長度、復雜推理、數學、代碼、多模態等)、②外部能力的擴充(處理非結構化數據、使用更復雜的工具、與物理世界的交互等)
投資建議:AI大模型賦能下游應用,C端標準化工具類產品有望率先享受產業紅利,重點公司包括金山辦公、萬興科技、同花順、科大訊飛、福昕軟件等。AI在B端加速落地,具備細分行業數據與客戶資源卡位的企業有望優先受益,重點公司包括恒生電子、拓爾思、稅友股份等。算力是AI大模型產業化落地的必備環節,建議關注AI服務器相關廠商以及國產AI芯片廠商:浪潮信息、中科曙光、優刻得、紫光股份、海光信息、寒武紀、拓維信息、神州數碼以及在向量數據庫及垂直大模型領域有技術優勢的星環科技等。
風險提示:AI技術迭代不及預期的風險,商業化落地不及預期的風險,政策支持不及預期風險,全球宏觀經濟風險。
(來源:財通證券)
粉絲特惠:好股票APP五個熱門產品任選一款,體驗五天!歡迎下載注冊體驗!
關鍵詞: