返回文章列表
AI

Gemini-3 对比 ChatGPT-5.1:一个直击要害,一个娓娓道来,该怎么选?

小米
2025-12-04
3小时前
Gemini-3 对比 ChatGPT-5.1:一个直击要害,一个娓娓道来,该怎么选?

使用Google 的Gemini-3-Pro有一段时间,发现:对比OpenAI 的ChatGPT-5.1,Gemini-3的回答往往冷峻、没那么啰嗦,更容易“直击”问题的要害。

ChatGPT-5.1的回答有时候会像一位“知心大姐姐”,从头到脚、娓娓道来的帮你把问题梳理清楚,但有时候我会觉得过于冗余,不够精炼;而,Gemini刚好弥补了这一点缺点。

因此,现在我使用AI工具的流程大致如下:

1)编程:用Claude 写代码,用ChatGPT 解决Bug

2)疑问:对于同一问题,同时用ChatGPT与Gemini问一遍,对比答案

3)核查:如果同一问题,回答南辕北辙,或有疑问,可以用ChatGPT核验Gemini的回答,以及Gemini查验ChatGPT的答案,相当于交叉验证。

这样做的目的,是让不同的AI模型之间,相互卷;互相给对方做检查,进而减少一部分的AI幻觉。

现在互联网上有99%的内容是AI写出来的,然后AI又自己把所生成的内容自顾自的学习一遍,因此里面到底有多少错误,已经超出了我的认知负荷,只能借助AI机器人先主动核查。

第一次能清楚地辨别AI的错误,是在确认“市值加权”与“价值加权”的区别时。无论我用什么模型,AI给出的答案都是关于“市值加权”的。换言之,在AI的数据库里,“价值加权”的资料少得可怜,以至于它无法分清楚这两者的区别和用法。

有了这次深刻的经历后,对于AI给出的任何回答,我都会保留一份怀疑的心态。因此,对于一些很重要的问题,我也会利用不同的AI模型反复地核查。

之所以让AI之间相互“卷”,因为每家公司的大模型算法都不一样。简言之,每个公司给自家模型注入的思考方式(解决问题的思路),有自身的差异。

尽管,大模型公司都没有公开AI背后的思路,但是根据AI的回答风格可感知一二。当我们让AI大模型“相互卷”时,就是在判别哪种思维方式在某个问题上处理的更合适。

例如,有时候,我很喜欢Gemini的那种冷峻的回答方式。不仅如此,我还去观看了它背后的研究团队及创始人是怎么在思考AI这件事情。

Demis Hassabis(德米斯·哈萨比斯)是Google DeepMind公司的CEO,让Google在AI上扳回一局,扬眉吐气,重整昔日荣光的Gemini-3,就是这位兄才及团队的杰作。


在别人还不知道AI为何物的时候,Demis就开始了疯狂的追求AGI之路。并且,他对追求AGI的愿景很清晰和简单:“解决智能”,然后利用智能“去解决其他所有问题”。

我觉得这句话真是天才之作,优雅、简洁,它背后饱含的深意是:既然这世间有各种各样难以克服的难题,每个人穷尽毕生的精力都可能难以解决;那么,如果能创造(发明)一个“代理人”,用它来解决所有的难题;这将意味着,关键问题就是发明“代理”。

不难从中看出,他解决问题的思路是反过来的,并没有掉入我们习惯的陷阱——如何解决一个个难题,而是假定问题已经被“代理”解决。因此,关键任务就是发明创造,这个寄予希望的全知“代理”——也就是他所追求的AGI(通用人工智能)。



为了实现这个目标,他把分成了好几步走:首先,是训练人工智能打游戏,初步摸索AI的实力。

其次,让AI与人类最顶级的棋手对决。围棋是个纯靠实力取胜的领域,如果AI能够战胜人类选手,那么也就意味着AI在这一领域具备同等的实力。


进而,反向说明,对AI的训练,可以推广到其它的研究领域。因为,团队既然可以成功训练出AI下围棋的能力,那么也就意味着它有学习其它领域并成为顶级高手的可能。

再次,为了验证这种猜想,Demis和DeepMind团队把目光瞄准了无论是复杂度还是难度都顶个儿高的生物学领域。


他和团队用训练出来的AlphaFold,解决了蛋白质结构预测的难题——这是科学界50年来一直面临的重大挑战。他也因此,获得了2024年诺贝尔化学奖。


后来的故事,我们也都清楚:2020年11月30日,OpenAI 发布了ChatGPT,瞬间让AI走进了普通人的世界。而,这也让Google陷入了空前的危机,因为用户有了更容易找到答案的方式,那么搜索引擎极大可能被丢弃。

匆忙上线的Bard,让Google笑料百出,不得已他们整合了AI团队,而Demis就是那位合并后Google人工智能公司的CEO。

他们重新架构了聊天机器人的代码,然后内部启用新的品牌名——Gemini,与谷歌另一个品牌Gmail有异曲同工之妙。

在第一代与二代时候,Gemini与ChatGPT的差异还是很大,但到了第三代,明显感觉回答的质量上来了,并且它的风格相当的独特:就是Demis及团队惯常的反直觉、直击要害的简约风。与他们在解决问题时的思路,有一脉相承的感觉。


不知道未来Gemini的进化会达到什么样的水平,但正如Demis本人所说:创新的速度正变得越来越快,并且还在加速。或许,在不远的将来,AGI或许真能实现。这也将是,我们人类用来解决疑难问题的好帮手。


另外,顺便推荐一下Demis的纪录片《思维游戏》,视频里展现了AI很多其它方面的功能,比如与它探讨问题、聊天,就感觉电影《她》的场景切实的在眼前。


同样,你还能发现痴迷于解决问题和发明的人是种什么感觉。当外界嘲笑Demis把DeepMind以4亿英镑的价格卖给谷歌的价格太低,只需再等一段时间,或许就能卖到100亿。

而Demis想到的是,我不可能用10亿买回1年的时间,我得尽快开始深入研究,一分钟都不能耽误,而谷歌却能提供大量的数据、算力、资金等等。

总之,在使用AI的过程中,尽量让不同公司的大模型之间“相互卷”,尽管这样不可能完全消除AI的错误与幻觉,但是可以为我们提供解决该问题最恰当的方式之一。

而支持这样做的动因是:每家公司大模型背后的思维链路略有不同,相当于他们各自有不同的训练方法和逻辑,而我们刚好可以全部都能利用。

进而,你获得的答案质量,也相对更高一些。不要小看这一点点差距,用得次数多,时间长,久而久之,复利会让一切的小数变成难以企及的高山。

本文内容仅供参考,不构成任何专业建议。使用本文提供的信息时,请自行判断并承担相应风险。

分享文章
合作伙伴

本站所有广告均是第三方投放,详情请查询本站用户协议