(資料圖片僅供參考)
2023年7月2日,“2023全球數字經濟大會人工智能高峰論壇”在中關村(000931)國家自主創新示范區會議中心舉行。此次論壇以“智能涌現,重塑未來”為主題,聚集了10余位人工智能領域頂級專家學者以及企業和機構代表,共同分享了對當前最炙手可熱的大模型發展話題的深入洞見和思考。
本次論壇發布了首批“北京市人工智能大模型高質量數據集”,晴數智慧與另外9家單位的18個高質量訓練數據集入選,包括晴數智慧“智能座艙人機交互高質量數據集”與“超大規模中文多領域對話數據集”、人民日報語料數據集、國家法律法規語料數據集、兩會參政議政建言數據集、“科情頭條”全球科技動態數據集、中國科學引文數據庫數據集、科技文獻挖掘語義標注數據集等,涵蓋經濟、政治、文化、社會、生態等不同領域,總規模超過500T,將為通用大模型和行業大模型訓練提供有力保障。
本次論壇上還重磅發布了北京市通用人工智能產業創新伙伴計劃第二批成員名單,該伙伴計劃由北京市經信局聯合市科委中關村管委會、市發改委共同啟動,標志著北京成為全國范圍內率先對大模型產業落地出臺針對性支持政策的地區。“伙伴計劃”旨在搭建人工智能大模型的開放合作平臺,建立協同合作機制,通過持續優化產業鏈布局,大幅提升優質算力、高質量數據供給支撐能力,培養一批應用大模型技術實現突破性成長的標桿企業。
據了解,第二批“伙伴計劃”征集工作引起產業界的廣泛響應和積極參與。截至6月30日,共有416家京內外大模型研發和應用企業申請加入。經學術界、產業界、投資界專家的充分論證以及市場化機制評估,北京晴數科技有限公司與其他9家企業作為數據伙伴入選第二批“伙伴計劃”,并在此次論壇上進行了公布。
人工智能大模型的突破源于高質量數據的不斷發展,提升高質量數據要素供給能力是推動通用人工智能大模型領域創新的關鍵。目前國內中文語料庫數據稀缺、數據處理成本高、數據相關條例尚未完善。
晴數智慧作為一家全球領先高質量數據集解決方案企業,擁有近億輪次可用于大模型訓練的高質量成品對話數據集。晴數智慧在傳統采集標注基礎上,圍繞構建高質量數據,為客戶提供MLOps(機器學習運維閉環)支撐,在數據咨詢,生成,清洗,分類,微調,測試等環節,提供專業的DaaS(Data as a Service) 解決方案。晴數智慧核心團隊深耕AI數據領域近二十年,參與起草國家標準《人工智能 面向機器學習的數據標注規程》(GB/T 42755-2023)、《信息技術智能語音交互測試方法 第1部分:語音識別》(GB/T 41813.1-2022)、《信息技術 智能語音交互測試方法 第2部分:語義理解》(GB/T 41813.2-2022),積累沉淀了豐富的數據治理經驗。
加入北京市通用人工智能產業創新伙伴計劃,晴數智慧將助力打造用于大模型構建和微調的數據專區與國家級數據訓練基地建設、制定數據服務標準,為模型訓練提供優質且合規的數據,降低模型訓練成本。同時與算力、模型及各應用領域的伙伴共同打造MLOps,助力大模型產業落地。
(免責聲明:此文內容為廣告,相關素材由廣告主提供,廣告主對本廣告內容的真實性負責。本網發布目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,請自行核實相關內容。廣告內容僅供讀者參考。)
(責任編輯:王治強 HF013)關鍵詞: