腦筋急轉彎與編程題的碰撞,各熱門AI中表現最好的竟然是它?

前言

上次發了如何向大語言模型提問(如何讓人工智能的作業回答,顯得不那麼人工稚嫩?)後,很多朋友問我哪一款更好用,講真的我也不太清楚。今天就用腦筋急轉彎和編程題,來向不同的ai進行提問,看看會怎麼樣吧

一、問題的選擇

1、腦筋急轉彎

 小明拿了一百元去買一個七十五元的東西,但老闆卻只找了五元給他,這是爲什麼?

答:因爲小明只付了八十元

這題很容易陷入思維誤區,認爲小明帶了一百元整,從而得出是老闆找錯錢的結論

2、編程

按照國際象棋的規則,皇后可以攻擊與之處在同一行或同一列或同一斜線上的棋子。 n 皇后問題 研究的是如何將 n 個皇后放置在 n×n 的棋盤上,並且使皇后彼此之間不能相互攻擊。 給你一個整數 n ,返回所有不同的 n 皇后問題 的解決方案。 每一種解法包含一個不同的 n 皇后問題 的棋子放置方案,該方案中 'Q' 和 '.' 分別代表了皇后和空位。用python實現。

題目摘自《力扣》經典的n皇后問題

結果實例

ok,題目選好了,接下來就開始對各個ai下手了。看看哪一個能成爲我完成作業的“愛寵”

二、提問時間

先說一下,本次測試的回答結果,都是基於不加任何引導,直接提問的基礎上。

1、通義千問

(1)腦筋急轉彎

看來沒有得到我們想要的答案

(2)編程

將代碼直接複製去pycharm裏跑,當n=4時的輸出結果

當n=1時的輸入結果

可以看到千義通問在代碼編寫上還是很強的,輸出結果與示例基本相同

2、文心一言

(1)腦筋急轉彎

捕捉到關鍵詞“八十元”,但這邊它說我們"明確提到小明拿了一百元“,這確實是,不過我沒說付了100元啊。算它對吧,畢竟考慮到這種情況了

(2)編程

當n=4時的輸出

n=1時的輸出結果

看來文心一言在這兩者中都表現得還不錯

3、豆包

(1)腦筋急轉彎

說實話,我之前是沒用過《豆包》的,它的回答像是在和提問者閒聊。同時也一下識破了這是個腦筋急轉彎,給出了我們想要的答案

(2)編程

直接拿去跑,好像跑不出來嘞。但在腦筋急轉彎問題上滿分

4、智譜清言

(1)腦筋急轉彎

沒有我們想要的答案

(2)編程

結果沒問題,但我要求橫着打印輸出結果,它不聽話

5、kimi

(1)腦筋急轉彎

等等,等等,這個回答我怎麼看不太懂。這也是謎語的一部分嗎?

(2)編程

kimi的表現真是一言難盡

6、復旦.眸思

(1)腦筋急轉彎

嗯...

(2)編程

去了解了一下,這款大模型的着重點是”圖像識別“,着重點不在這上面,有點爲難人家了

7、天工AI

(1)腦筋急轉彎

好乾脆的回答,有一種早就聽過這個題的感覺

(2)編程

豎着打印結果沒問題,但讓它橫着打印結果

結果就會出錯


三、總結

首先我得說明這個結果是片面的,只是爲大家提供一個參考。畢竟題目都來自網上,實際生活中遇到問題得具體分析

單單就本次測試來說,我認爲綜合表現最好的是《文心一言》。在代碼上表現最好的是《通義千文》,而腦筋急轉彎方面則是《豆包》

就測試這麼多吧,我這邊選取的都是國內的大模型。如果你還對其他冷門一點的ai感興趣可以去heeee.com/ai


看看,裏面整理了許多ai大模型,免得自己去找了。

後語

不得不說這篇文章寫起來還挺麻煩的,如果覺得有意思希望能夠爲我多多電電

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com