等待了两个月，一直期待的东西终于来了。

Gemini 3，正式发布。

上周我就有强烈的预感，给大家预告过。

但真正发布的时候，那种震撼感还是没防住。

东西太多了，咱们一个一个聊，这篇先聊 Gemini 3。

你都不需要看模型跑分，看图就知道了，这可是真金白银的投票。

市场才是最诚实的听众。

但更离谱的是，Gemini 3 在各大主流权威基准上。

几乎都是第一，不服不行。

我连夜测了一圈，大受震撼。

技术细节什么的，咱们先放一边，等会再聊。

现在，我直接带你看实测效果。

实测

1、做一个高质量逼真的宠物精灵球

你看这个质感，这个光影细节，颜值美学直接拉满了。

我盯着玩了好几遍。

说实话，作为一个从小看《神奇宝贝》长大的人，第一反应确实是有点恍惚。

看着它，你是真的会涌起，很多童年的美好回忆。

2、苹果 MacOS 操作系统克隆

兄弟们，这个真的有点坐不住了。

居然能把 MacOS 的界面做成这个效果。

窗口的拖拽，菜单栏的动画效果，窗口层级的遮挡。

都是即时生成的代码渲染出来的，看的我真有点恍惚了。

我们一直在期待即时 UI，也就是 AI 会根据你的需求。

现场生成一个专属的，一次性的软件界面，你可以用完即走。

这不就来了？

看这个时候我挺感慨的。

我们总是高估 AI 一两年的变化，却低估它长期的颠覆。

当软件变得像水一样，随时生成，随时销毁。

这种招之即来，挥之即去的掌控感，或许才是人机交互真正的未来。

3、3D 埃菲尔铁塔的像素艺术

对像素艺术的创作，也是轻松拿捏。

你看这个雾气的氛围感，绝了。

整体还有一种《我的世界》的复古美感。

4、3D 双人台球游戏

Gemini 3 出来的效果，绝对是我目前见过最好的，没有之一。

啊，这久违的兴奋感。

你看这个台球的碰撞反弹，力度衰减，运动轨迹。

丝滑得像真的一样。

可以直接拿去做游戏原型了。

5、3D DNA 片段模拟

还有这个 DNA 片段的模拟，能调整长度，扭曲和突变。

完美呈现。

这意味着，那些复杂的科研演示和教学工具。

现在，跟 Gemini 3 说一句话就能实现。

6、3D 魔方模拟

魔方看起来简单，实际上是个大坑。

但 Gemini 3 不仅做出来了，还实现了随机打乱和自动还原。

真是 36 除以 6，除了 6，还是 6。

目前，Gemini 3 在 Google AI Studio 和 Gemini 上，均已经上线。

跑分

看完实测，过一下几个最关键的跑分。

数不过来了，Gemini 3 几乎都是拿的第一。

注意，不是略微领先，是断层式领先。

关键跑分对比

LMArena 是一个让不同大模型在同一竞技场里公平比拼，用真人投票结果得出的实力排名表。

Gemini 3 拿到了 1501 分，遥遥领先。

WebDev Arena 是聚焦前端开发的竞技场。

Gemini 3 拿到了 1487 分，还是第一。

Vending-Bench 2 这个测试最有意思。

他是让 AI 去经营一年自动售货机，看谁更会做生意，更会长期规划。

Gemini 3 还是遥遥领先。

ARC-AGI-2 专门用全是没见过的新奇智力题，来检验模型是不是能真正举一反三，而不是靠死记硬背。

Gemini 3 继续断层领先。

尾声

Google 这次没留后路，直接把王炸拍在了桌子上。

看完 Gemini 3 的发布，我最大的感受不是兴奋，而是一种久违的踏实感。

之前我们总担心 Scaling Law 会不会撞墙，担心 AI 会不会卡在瓶颈期。

但 Google 用一堆赤裸裸的数据告诉我们。

那座指引方向的灯塔，依然亮着。

今晚对于 AI 行业来说，大概率是个不眠之夜。

竞争对手的压力，不再是 PPT 上的愿景，而是实打实可用的产品。

但对于我们普通用户来说，这才是最幸福的时刻。

王者归来，不仅仅是一句口号。

它意味着我们手里的工具。

又锋利了一个量级。

Gemini 3好用吗？Gemini 3实测

实测