脑筋急转弯与编程题的碰撞,各热门AI中表现最好的竟然是它?

前言

上次发了如何向大语言模型提问(如何让人工智能的作业回答,显得不那么人工稚嫩?)后,很多朋友问我哪一款更好用,讲真的我也不太清楚。今天就用脑筋急转弯和编程题,来向不同的ai进行提问,看看会怎么样吧

一、问题的选择

1、脑筋急转弯

 小明拿了一百元去买一个七十五元的东西,但老板却只找了五元给他,这是为什么?

答:因为小明只付了八十元

这题很容易陷入思维误区,认为小明带了一百元整,从而得出是老板找错钱的结论

2、编程

按照国际象棋的规则,皇后可以攻击与之处在同一行或同一列或同一斜线上的棋子。 n 皇后问题 研究的是如何将 n 个皇后放置在 n×n 的棋盘上,并且使皇后彼此之间不能相互攻击。 给你一个整数 n ,返回所有不同的 n 皇后问题 的解决方案。 每一种解法包含一个不同的 n 皇后问题 的棋子放置方案,该方案中 'Q' 和 '.' 分别代表了皇后和空位。用python实现。

题目摘自《力扣》经典的n皇后问题

结果实例

ok,题目选好了,接下来就开始对各个ai下手了。看看哪一个能成为我完成作业的“爱宠”

二、提问时间

先说一下,本次测试的回答结果,都是基于不加任何引导,直接提问的基础上。

1、通义千问

(1)脑筋急转弯

看来没有得到我们想要的答案

(2)编程

将代码直接复制去pycharm里跑,当n=4时的输出结果

当n=1时的输入结果

可以看到千义通问在代码编写上还是很强的,输出结果与示例基本相同

2、文心一言

(1)脑筋急转弯

捕捉到关键词“八十元”,但这边它说我们"明确提到小明拿了一百元“,这确实是,不过我没说付了100元啊。算它对吧,毕竟考虑到这种情况了

(2)编程

当n=4时的输出

n=1时的输出结果

看来文心一言在这两者中都表现得还不错

3、豆包

(1)脑筋急转弯

说实话,我之前是没用过《豆包》的,它的回答像是在和提问者闲聊。同时也一下识破了这是个脑筋急转弯,给出了我们想要的答案

(2)编程

直接拿去跑,好像跑不出来嘞。但在脑筋急转弯问题上满分

4、智谱清言

(1)脑筋急转弯

没有我们想要的答案

(2)编程

结果没问题,但我要求横着打印输出结果,它不听话

5、kimi

(1)脑筋急转弯

等等,等等,这个回答我怎么看不太懂。这也是谜语的一部分吗?

(2)编程

kimi的表现真是一言难尽

6、复旦.眸思

(1)脑筋急转弯

嗯...

(2)编程

去了解了一下,这款大模型的着重点是”图像识别“,着重点不在这上面,有点为难人家了

7、天工AI

(1)脑筋急转弯

好干脆的回答,有一种早就听过这个题的感觉

(2)编程

竖着打印结果没问题,但让它横着打印结果

结果就会出错


三、总结

首先我得说明这个结果是片面的,只是为大家提供一个参考。毕竟题目都来自网上,实际生活中遇到问题得具体分析

单单就本次测试来说,我认为综合表现最好的是《文心一言》。在代码上表现最好的是《通义千文》,而脑筋急转弯方面则是《豆包》

就测试这么多吧,我这边选取的都是国内的大模型。如果你还对其他冷门一点的ai感兴趣可以去heeee.com/ai


看看,里面整理了许多ai大模型,免得自己去找了。

后语

不得不说这篇文章写起来还挺麻烦的,如果觉得有意思希望能够为我多多电电

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com