前言
上次發了如何向大語言模型提問(如何讓人工智能的作業回答,顯得不那麼人工稚嫩?)後,很多朋友問我哪一款更好用,講真的我也不太清楚。今天就用腦筋急轉彎和編程題,來向不同的ai進行提問,看看會怎麼樣吧
一、問題的選擇
1、腦筋急轉彎
小明拿了一百元去買一個七十五元的東西,但老闆卻只找了五元給他,這是爲什麼?
答:因爲小明只付了八十元
這題很容易陷入思維誤區,認爲小明帶了一百元整,從而得出是老闆找錯錢的結論
2、編程
按照國際象棋的規則,皇后可以攻擊與之處在同一行或同一列或同一斜線上的棋子。 n 皇后問題 研究的是如何將 n 個皇后放置在 n×n 的棋盤上,並且使皇后彼此之間不能相互攻擊。 給你一個整數 n ,返回所有不同的 n 皇后問題 的解決方案。 每一種解法包含一個不同的 n 皇后問題 的棋子放置方案,該方案中 'Q' 和 '.' 分別代表了皇后和空位。用python實現。
題目摘自《力扣》經典的n皇后問題
結果實例
ok,題目選好了,接下來就開始對各個ai下手了。看看哪一個能成爲我完成作業的“愛寵”
二、提問時間
先說一下,本次測試的回答結果,都是基於不加任何引導,直接提問的基礎上。
1、通義千問
(1)腦筋急轉彎
看來沒有得到我們想要的答案
(2)編程
將代碼直接複製去pycharm裏跑,當n=4時的輸出結果
當n=1時的輸入結果
可以看到千義通問在代碼編寫上還是很強的,輸出結果與示例基本相同
2、文心一言
(1)腦筋急轉彎
捕捉到關鍵詞“八十元”,但這邊它說我們"明確提到小明拿了一百元“,這確實是,不過我沒說付了100元啊。算它對吧,畢竟考慮到這種情況了
(2)編程
當n=4時的輸出
n=1時的輸出結果
看來文心一言在這兩者中都表現得還不錯
3、豆包
(1)腦筋急轉彎
說實話,我之前是沒用過《豆包》的,它的回答像是在和提問者閒聊。同時也一下識破了這是個腦筋急轉彎,給出了我們想要的答案
(2)編程
直接拿去跑,好像跑不出來嘞。但在腦筋急轉彎問題上滿分
4、智譜清言
(1)腦筋急轉彎
沒有我們想要的答案
(2)編程
結果沒問題,但我要求橫着打印輸出結果,它不聽話
5、kimi
(1)腦筋急轉彎
等等,等等,這個回答我怎麼看不太懂。這也是謎語的一部分嗎?
(2)編程
kimi的表現真是一言難盡
6、復旦.眸思
(1)腦筋急轉彎
嗯...
(2)編程
去了解了一下,這款大模型的着重點是”圖像識別“,着重點不在這上面,有點爲難人家了
7、天工AI
(1)腦筋急轉彎
好乾脆的回答,有一種早就聽過這個題的感覺
(2)編程
豎着打印結果沒問題,但讓它橫着打印結果
結果就會出錯
三、總結
首先我得說明這個結果是片面的,只是爲大家提供一個參考。畢竟題目都來自網上,實際生活中遇到問題得具體分析
單單就本次測試來說,我認爲綜合表現最好的是《文心一言》。在代碼上表現最好的是《通義千文》,而腦筋急轉彎方面則是《豆包》
就測試這麼多吧,我這邊選取的都是國內的大模型。如果你還對其他冷門一點的ai感興趣可以去heeee.com/ai
看看,裏面整理了許多ai大模型,免得自己去找了。
後語
不得不說這篇文章寫起來還挺麻煩的,如果覺得有意思希望能夠爲我多多電電
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com