技术雷达2026-02-13·6 分钟阅读

Google Gemini 3 Deep Think: AI开始真正做科学了

Google刚刚放出一个重磅消息：Gemini 3 Deep Think迎来重大升级，而且这次不是刷榜，是真刀真枪地帮科学家干活了。

从发现数学论文里的隐蔽漏洞，到设计半导体晶体生长方案，再到加速物理组件设计——这款专门面向科学、研究和工程优化的推理模型，正在把AI从"答题机器"变成"研究伙伴"。

这不是演习：AI找到了人类同行评审没发现的错误

Rutgers大学的数学家Lisa Carbone正在研究高能物理学需要的数学结构，试图在爱因斯坦引力理论和量子力学之间架起桥梁。这个领域训练数据极少，逻辑链条极度复杂。

她把一篇高度技术性的数学论文丢给Deep Think，结果AI发现了一个微妙的逻辑缺陷——这个缺陷之前通过了人类同行评审，没人注意到。

想想这意味着什么：连顶尖数学家都可能看走眼的错误，被AI抓住了。而且是在一个几乎没有什么训练数据的专业领域。

Duke大学Wang实验室的案例更有冲击力。他们需要用复杂晶体生长方法来发现半导体材料，目标是让薄膜生长到100微米以上。之前的实验方法一直达不到这个目标。

Deep Think给出的晶体生长"配方"成功了。超过100微米的目标被精准命中。

Google自家的硬件工程师Anupam Pathak（Liftware前CEO）测试了Deep Think来加速物理组件设计。结果是：设计周期大幅缩短，原本需要反复迭代的实验现在几轮就能定稿。

Google说得很直接：这次升级是专门为了解决"没有明确规则、没有唯一正确答案、数据往往 messy 或不完整"的研究难题。

传统的AI benchmark是答题，有标准答案。真正的科学研究是探索，连问题本身都可能模糊不清。

Deep Think的核心升级在于：

1. 深度科学认知 + 工程实用性

不只是会背公式，而是理解科学原理背后的逻辑，并能转化成可操作的工程方案。

2. 主动质疑与验证

不同于一般AI的"你说啥我答啥"，Deep Think会主动检查逻辑链条的完整性。这就是为什么它能发现论文漏洞——它不盲从权威，只看逻辑。

3. 从理论到落地的完整闭环

数学论文→发现错误；晶体生长目标→设计方案；物理组件需求→加速设计。这种横跨抽象理论和实体工程的能力，是之前AI模型不具备的。

过去我们说AI是"辅助工具"，现在是"研究伙伴"。

这个转变的关键标志是：AI开始参与知识生产的核心环节。

同行评审、实验设计、方案优化——这些原本是人类科学家独占的领域，现在AI不仅能参与，还能在某些场景下做得比人更好。

注意，不是说AI要取代科学家。Carbone、Wang实验室、Pathak都是领域专家，他们用AI来放大自己的能力边界。

Deep Think的真正价值在于：让科学家能处理更复杂的问题，探索原本无法触及的领域。

当一个数学家可以借助AI检查论文的逻辑严密性，当一个材料学家可以让AI设计实验方案，科学进步的加速度会被彻底改写。

Google AI Ultra订阅用户已经能在Gemini App里使用新版Deep Think。

更重要的是：Google首次向研究人员、工程师和企业开放Gemini API的Deep Think早期访问。这意味着我们即将看到更多第三方应用把这个能力集成到实际工作流中。

从OpenAI的Codex-Spark让编程变成实时对话，到Gemini 3 Deep Think帮科学家做研究——2026年2月这一周，AI正在从"工具"进化为"协作者"。

最惊人的不是AI能做这些事，而是它进步的速度。

去年Deep Think还在IMO数学奥赛上拿金牌，今年已经开始帮数学家找论文漏洞了。

科学研究的"人机协作"时代，真的来了。

本文基于Google官方发布及早期测试者案例整理。