首頁>博客 > 正文

五大模型解高考數學：阿里通義千問、360智腦10題全錯得0分；訊飛星火答對一半

2023-06-08 23:22:21 出處：搜狐科技

一年一度高考季，高考試題是大眾關注的焦點，也成為了AI能力的試金石。AI大模型數學功底到底如何？比人類“聰明”嗎？搜狐科技使用五款AI大模型對2023高考上海數學試卷進行了同題測試。

在測試中，搜狐科技選取了高考試卷前10道填空題，讓百度文心一言、阿里通義千問、科大訊飛星火認知大模型、360智腦、ChatGPT進行回答。

(相關資料圖)

測試結果顯示，這五款大模型在答數學題的能力上差異顯著。

最“聰明”的訊飛星火答對了5題，正確率50％。百度文心一言和ChatGPT“緊跟其后”，答對了4題，正確率為40％。

360智腦和通義千問則“全軍覆沒”，一道題也沒答對，交了白卷。

值得一提的是，昨天搜狐科技也用五款大語言模型產品，對高考作文全國卷（甲）進行了測試，并邀請了5位語文名師打分。

打分結果顯示，ChatGPT高考作文得分最高，文心一言、訊飛星火得分稍低，但跟ChatGPT處于同一水平。360智腦和通義千問得分最低。

雖然語文作文題和數學計算題，對大模型能力考察的維度并不盡相同。但巧合的是，不擅長寫作文的360智腦和通義千問，似乎也不擅長做數學題。

通過這兩次高考題測試，也能從側面反應出各家大模型的能力確實是“參差不齊”。如果ChatGPT、文心一言、訊飛星火是“學霸”，那么360智腦和通義千問則是妥妥的“學渣”。

附測試中使用的高考數學題題目：

1.不等式|x-2|<1的解集為__

2.a=(2,3)，b=(-1,2)，則a·b=__

3.首項為3，公比為2的等比數列的前六項和S6=__

4.tanA=3，tan2A=__

5.f(x)={2^xx>0;1，x≤0}的值域為__

6.復數z=1-i，則|1+iz|=__

7.圓的方程x^2+y^2-4y-m=0的面積為π，則m=__

8.三角形的三邊長為a=4，b=5，c=6，則sinA=__

9.某地一年四個季度的GDP(億元)，第一季度GDP為232，第四季度GDP為241，且四個季度的GDP逐季度增長，中位數、平均數相等。則該地一年的GDP為__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0，正數k的最大值為__

責任編輯：

關鍵詞：

熱點推薦

五大模型解高考數學：
五大模型解高考數學：阿里通義千問、360智腦10題全錯得0 建信信托聯合金杜律師事務所發布年度中國家族財富可持續 中考落榜怎么辦?考不上高中有哪些出路|當前熱訊 南王科技：6月12日在深交所上市股票代碼301355 視訊 2023呼和浩特幼升小信息采集表打印時間（開始+截至） 儋州市教育局、市衛健委等部門聯合開展“全國愛眼日”活: 建信信托聯合金杜律師

理財更多>>

投資更多>>

論壇更多>>

世界視點！血鳶淚龍心心血鳶淚 1、是《血鳶淚》嗎高貴如她，奈何一朝成為亡國奴。2、為了復仇，漫天的

上市公司更多>>

華是科技：6月7日公司高管溫志偉減持公司股份合計20萬股 證券之星訊，根據6月8日市場公開信息、上市公司公告及交易所披露數據整

相關內容

消費

每日頭條!開啟輕客內卷新時代，車機體驗人性化，這樣的依維柯你滿意否？

越跌越買！315億大舉抄底！-每日看點

洪山區成立首個商會勞動爭議調解組織

產業

看東南大學王煒如何合理規劃自行車停車問題 在中國，基于可持續發展政策的推行，自行車成為了許多人喜愛的交通工具。而隨著自行車

健康又清爽，瑞幸咖啡抓馬西瓜拿鐵、葡萄冰萃美式一杯開啟冰爽夏日 五月已過，炎炎夏日即將到來，喜愛咖啡的朋友，快來開啟痛飲冰咖的快樂時刻！清甜馥郁

鮮活美味再獲認證！君樂寶悅鮮活狂攬iSEE全球食品創新獎兩項大獎 5月14日，食品行業內頗受認可的iSEE全球食品創新獎第五屆頒獎典禮在上海舉行。君樂寶

最新血脂管理指南發布!心血管健康專家西班牙波利王教你如何科學合理降血脂 近期，《中國血脂管理指南(2023)》(以下簡稱《指南》)全新發布。《指南》顯示，我國血

基金

一招短線選股法是什么意思？尾盤買入法的好處有哪些？拉尾盤什么意思？ 尾盤買入法：屬于短線的操作，今天買了，明天就有機會賣的。每天下午14:30分的時候有

老司机91精品网站在线观看_久久69精品久久久久久hb_成人欧美在线观看_免费一级日本c片完整版

五大模型解高考數學：阿里通義千問、360智腦10題全錯得0分；訊飛星火答對一半

熱點推薦

相關內容