老司机91精品网站在线观看_久久69精品久久久久久hb_成人欧美在线观看_免费一级日本c片完整版

首頁>股票 > 正文

GPT-3、ChatGPT和GPT-4,一起做腦筋急轉彎

2023-06-28 06:14:58    出處:夕小瑤科技說?

一個烙餅煎一面一分鐘,兩個烙餅煎兩面幾分鐘?

讓你來回答,是不是一不小心就掉到溝里了?如果讓大語言模型來做這種腦筋急轉彎會怎樣呢?研究發現,模型越大,回答就越可能掉到溝里,即使是擁有千億參數的大模型也不能幸免。但是ChatGPT卻能很好回答這些問題。讓我們一起來看看吧。


(資料圖片)

腦筋急轉彎

作者采用了CRT數據作為腦筋急轉彎的測試數據。該數據在心理學領域,廣泛地被用于衡量人類的思維習慣,判斷是否習慣于直覺思維。

腦筋急轉彎數據示例

如上圖所示,作者探索了3種CRT數據和1種語言邏輯陷阱。例如:

CRT-1:蘋果和梨花了1塊1,蘋果比梨貴1塊,問梨花了多少錢?直覺答案:0.1塊 = 1.1-1,正確答案:0.05塊。

CRT-2:5個人種5棵樹花5分鐘,10個人種10棵樹花多少分鐘?直覺答案:10分鐘,正確答案:5分鐘。

CRT-3:培養皿中的細菌每分鐘擴增一倍面積,48分鐘可以填滿,問填滿一半要多久?直覺答案:24分鐘,正確答案:47分鐘。

語言邏輯陷阱:剛上小學的小紅去參加高考,她會考幾科?直覺答案6科,正確答案:小學生不參加高考。

模型表現

模型表現如下圖所示,可以看到模型較小時,隨著模型增大,模型回答正確答案和直覺答案的比例在提高,回答無關答案的比例在下降。

但隨著模型進一步增大,無關答案比例進一步下降,直覺答案比例進一步上升,正確答案比例卻不升反降。包括BLOOM、LLAMA、GPT-3在內的大語言模型明顯掉入腦筋急轉彎的陷阱。即使是經過指令調整與RLHF的text davinci-002/003也未能幸免。

不同模型表現對比

而在上圖中,經過指令調整的ChatGPT與GPT-4,一下子正確答案的比例就高了許多。究竟是什么魔法使得ChatGPT的腦筋會轉彎呢?我們不得而知。

下圖具體對比了GPT-3、ChatGPT,GPT-4在幾類不同的腦筋急轉彎的表現,可以更加凸顯上述現象。

不同腦筋急轉彎類型上的模型表現對比

如果改換輸入形式會怎樣?下圖上為問答的形式,和上面的實驗相同。下圖中、下分別為多選、續寫的形式。可以看到,修改提問形式之后,正確率略有上升,但整體差別不大。

下圖顯示,通過少監督展示學習,GPT-3的正確率會有所上升。但即使展示到40個左右的樣本,準確率和無監督的ChatGPT相比仍有差距,更不用說GPT-4了。

結論

這篇論文針對很有意思的一類問題,發現了大語言模型的一個很有意思的現象。作者也嘗試了多種方法,但無論是改變提問形式還是增加監督數據,GPT-3在腦筋急轉彎上的表現仍然難以達到ChatGPT的水平。究竟ChatGPT使用了怎樣的魔法讓模型的腦筋會轉彎呢?

關鍵詞:

相關內容

消費
產業
建信財險董事羅晶任職資格批復 環球視訊 建信財產保險有限公司:你公司《建信財產保險有限公司關于羅晶任職資格
理想離理想還很遠 銷量和聲勢并不意味著一切。
魅族20 Pro手機獲推Flyme10.0.2.2A穩定版更新,優化系統和游戲 全球熱推薦 IT之家6月26日消息,魅族向魅族20Pro手機推送了Flyme10 0 2 2A穩定版系
鷹之航:十余載技術積淀 捍衛航空安全保障體系 證券時報網訊,近日,深交所披露公告顯示,專注于航空機載設備制造和維
基金
老司机91精品网站在线观看_久久69精品久久久久久hb_成人欧美在线观看_免费一级日本c片完整版

      国产精品久久午夜| 亚洲欧美另类综合偷拍| 国产精品午夜电影| 亚洲美女区一区| 欧美激情一区二区| 国产精品久久福利| 国产亚洲制服色| 久久精品在线免费观看| 亚洲精品第一国产综合野| 日产国产欧美视频一区精品| 国产精品一区二区黑丝| 久久色.com| 亚洲www啪成人一区二区麻豆| 欧美午夜视频网站| 精品国产乱码久久久久久图片| 国产精品美女久久福利网站| 亚洲最大成人网4388xx| 欧美96一区二区免费视频| 国产夫妻精品视频| 国产 日韩 欧美大片| 免费观看30秒视频久久| 成人福利视频网站| 国产精品久久久久久久久果冻传媒| 亚洲综合丁香婷婷六月香| 欧美三级资源在线| 国产色91在线| 亚洲小少妇裸体bbw| 国产成人精品免费在线| 国产精品嫩草久久久久| 在线一区二区三区四区五区| 日韩欧美国产电影| 亚洲精品视频在线看| 亚洲精品国久久99热| 亚洲猫色日本管| 国产一区二区三区视频在线播放| 国产亚洲精久久久久久| 色综合天天综合网天天看片| 久久影院午夜片一区| 亚洲妇女屁股眼交7| 色视频欧美一区二区三区| 在线免费观看日韩欧美| 91精品中文字幕一区二区三区| 国产精品无遮挡| 蜜臀va亚洲va欧美va天堂| 99精品视频在线免费观看| 亚洲精品v日韩精品| 日韩欧美激情一区| 亚洲一区在线视频观看| 成人av高清在线| 亚洲一区日韩精品中文字幕| 精品国产免费一区二区三区四区 | 亚洲一级在线观看| 床上的激情91.| 亚洲激情图片小说视频| 欧美精品一区二区在线播放| 亚洲线精品一区二区三区八戒| 福利一区在线观看| 亚洲欧美国产77777| 欧美成人猛片aaaaaaa| 久久亚洲综合色| 亚洲蜜臀av乱码久久精品| 粉嫩aⅴ一区二区三区四区五区| 亚洲人成小说网站色在线| 精品国产乱码久久久久久夜甘婷婷 | av在线播放不卡| 91黄色免费版| 中文字幕一区二区三区视频| 国产成人在线色| 亚洲一级不卡视频| 国产视频一区二区在线观看| 韩国理伦片一区二区三区在线播放| 亚洲女人小视频在线观看| 久久亚洲一级片| 日本sm残虐另类| 久久久99精品免费观看不卡| 欧美日韩综合不卡| 午夜欧美电影在线观看| 国产亚洲欧美日韩在线一区| 在线亚洲人成电影网站色www| 亚洲精品亚洲人成人网| 久久香蕉国产线看观看99| 精品视频一区二区不卡| 亚洲国产日日夜夜| 国产在线观看免费一区| 中文字幕一区免费在线观看| 欧美日韩国产天堂| 日韩在线a电影| 亚洲欧美另类综合偷拍| 久久久久免费观看| 成人午夜精品在线| 欧美日韩国产综合久久| 亚洲bt欧美bt精品| 亚洲男女毛片无遮挡| 亚洲欧洲日韩女同| 91一区一区三区| 精品三级av在线| 国产成人精品免费网站| 日本韩国一区二区三区视频| 一区二区三区精品在线| 亚洲国产成人午夜在线一区| 欧美性受xxxx黑人xyx| 日韩综合一区二区| 亚洲一区二区三区在线| 亚洲欧美日本韩国| 中文字幕一区二区三区四区不卡 | 中文字幕不卡在线观看| 久久久亚洲精华液精华液精华液| 国产激情精品久久久第一区二区| 欧美在线免费播放| 奇米亚洲午夜久久精品| 亚洲欧美视频在线观看| 久久综合网色—综合色88| 日韩精品欧美精品| 亚洲成a人片在线观看中文| 亚洲成人在线免费| 亚洲制服丝袜一区| 一区二区三区国产精华| 国产精品不卡在线观看| 综合中文字幕亚洲| 日本一二三四高清不卡| 国产精品乱人伦一区二区| 久久精品人人做人人综合| 日韩免费视频线观看| 蜜臀av一区二区在线免费观看| 五月综合激情日本mⅴ| 亚洲777理论| 一本大道久久a久久综合| 爽好久久久欧美精品| 亚洲图片自拍偷拍| 一区二区三区免费在线观看| 国产精品免费网站在线观看| 精品日产卡一卡二卡麻豆| 成人午夜在线免费| 亚洲精品在线电影| 久久免费视频色| 国产午夜亚洲精品理论片色戒| 久久蜜桃一区二区| 国产精品成人午夜| 国产精品久久久久久久浪潮网站| 欧美精彩视频一区二区三区| 精彩视频一区二区三区| 欧美久久一区二区| 国产成人在线视频网址| 日韩亚洲电影在线| 成人ar影院免费观看视频| 精品国产露脸精彩对白| 99国产精品久久久久| 日本韩国一区二区| 亚洲一区二区中文在线| 亚洲综合免费观看高清完整版在线 | 国产精品久久久久久久久免费相片 | 国产欧美精品一区二区三区四区 | 亚洲成a人v欧美综合天堂下载| 欧美久久久久中文字幕| 国产女同互慰高潮91漫画| 性感美女极品91精品| 91精品国产综合久久福利| 国产精品毛片a∨一区二区三区 | 亚洲图片自拍偷拍| 91麻豆精品国产| 日本一区二区三区免费乱视频| 午夜久久久影院| 精品久久久三级丝袜| 一区二区三区在线观看视频 | 蜜桃视频在线一区| 欧美成人在线直播| 一区二区三区在线免费视频| 国产成人丝袜美腿| 亚洲三级久久久| 欧美伦理电影网| 国产精品系列在线| 精品在线免费视频| 国产精品不卡视频| 欧美美女一区二区| 亚洲欧美日韩成人高清在线一区| 国产精品亚洲综合一区在线观看| 中文字幕一区三区| 欧美三级电影一区| 中文字幕一区二区三中文字幕| 国产毛片精品国产一区二区三区| 亚洲人精品午夜| 91精品国产aⅴ一区二区| 亚洲女同ⅹxx女同tv| 成人app在线观看| 视频一区在线播放| 日本一区二区三区四区| 欧美色综合网站| 亚洲摸摸操操av| 95精品视频在线| 玖玖九九国产精品| 亚洲欧美色一区| 日韩精品一区二区三区视频| 亚洲va国产天堂va久久en| 久久影音资源网| 久久国产精品99久久人人澡| 亚洲三级在线免费观看| 精品国产精品网麻豆系列| 91福利视频在线| 综合婷婷亚洲小说| 91网站在线观看视频|