前言
上次发了如何向大语言模型提问(如何让人工智能的作业回答,显得不那么人工稚嫩?)后,很多朋友问我哪一款更好用,讲真的我也不太清楚。今天就用脑筋急转弯和编程题,来向不同的ai进行提问,看看会怎么样吧
一、问题的选择
1、脑筋急转弯
小明拿了一百元去买一个七十五元的东西,但老板却只找了五元给他,这是为什么?
答:因为小明只付了八十元
这题很容易陷入思维误区,认为小明带了一百元整,从而得出是老板找错钱的结论
2、编程
按照国际象棋的规则,皇后可以攻击与之处在同一行或同一列或同一斜线上的棋子。 n 皇后问题 研究的是如何将 n 个皇后放置在 n×n 的棋盘上,并且使皇后彼此之间不能相互攻击。 给你一个整数 n ,返回所有不同的 n 皇后问题 的解决方案。 每一种解法包含一个不同的 n 皇后问题 的棋子放置方案,该方案中 'Q' 和 '.' 分别代表了皇后和空位。用python实现。
题目摘自《力扣》经典的n皇后问题
结果实例
ok,题目选好了,接下来就开始对各个ai下手了。看看哪一个能成为我完成作业的“爱宠”
二、提问时间
先说一下,本次测试的回答结果,都是基于不加任何引导,直接提问的基础上。
1、通义千问
(1)脑筋急转弯
看来没有得到我们想要的答案
(2)编程
将代码直接复制去pycharm里跑,当n=4时的输出结果
当n=1时的输入结果
可以看到千义通问在代码编写上还是很强的,输出结果与示例基本相同
2、文心一言
(1)脑筋急转弯
捕捉到关键词“八十元”,但这边它说我们"明确提到小明拿了一百元“,这确实是,不过我没说付了100元啊。算它对吧,毕竟考虑到这种情况了
(2)编程
当n=4时的输出
n=1时的输出结果
看来文心一言在这两者中都表现得还不错
3、豆包
(1)脑筋急转弯
说实话,我之前是没用过《豆包》的,它的回答像是在和提问者闲聊。同时也一下识破了这是个脑筋急转弯,给出了我们想要的答案
(2)编程
直接拿去跑,好像跑不出来嘞。但在脑筋急转弯问题上满分
4、智谱清言
(1)脑筋急转弯
没有我们想要的答案
(2)编程
结果没问题,但我要求横着打印输出结果,它不听话
5、kimi
(1)脑筋急转弯
等等,等等,这个回答我怎么看不太懂。这也是谜语的一部分吗?
(2)编程
kimi的表现真是一言难尽
6、复旦.眸思
(1)脑筋急转弯
嗯...
(2)编程
去了解了一下,这款大模型的着重点是”图像识别“,着重点不在这上面,有点为难人家了
7、天工AI
(1)脑筋急转弯
好干脆的回答,有一种早就听过这个题的感觉
(2)编程
竖着打印结果没问题,但让它横着打印结果
结果就会出错
三、总结
首先我得说明这个结果是片面的,只是为大家提供一个参考。毕竟题目都来自网上,实际生活中遇到问题得具体分析
单单就本次测试来说,我认为综合表现最好的是《文心一言》。在代码上表现最好的是《通义千文》,而脑筋急转弯方面则是《豆包》
就测试这么多吧,我这边选取的都是国内的大模型。如果你还对其他冷门一点的ai感兴趣可以去heeee.com/ai
看看,里面整理了许多ai大模型,免得自己去找了。
后语
不得不说这篇文章写起来还挺麻烦的,如果觉得有意思希望能够为我多多电电
更多游戏资讯请关注:电玩帮游戏资讯专区
电玩帮图文攻略 www.vgover.com