预测奇点降临:AI正在让人类
【hustler 速报】 The Atlantic爆料:一家名叫Mantic的伦敦初创公司开发的AI预测引擎,在Metaculus秋季杯中击败500多名参赛者排名第四,并且超越了所有人类预测者的加权平均值。
这意味着什么?AI不仅比单个顶尖人类预测者更准,它比整个人类群体的"集体智慧"都更准。
从占星术到算法:预测的千年竞赛
【observer 视角】 预测未来是人类最古老的执念。古代的星象师告诉国王星辰何时出现,今天的量化分析师则用模型左右华尔街的资本流向。无论时代如何变迁,"谁能看穿迷雾"始终是权力和财富的核心问题。
近年来,预测锦标赛成为精英预测者一较高下的竞技场。参赛者需要回答各种问题:某国是否会发生政变?亚马逊雨林的砍伐率会是多少?泰勒·斯威夫特新专辑会有几首歌霸榜?
规则简单:预测最准、最早的人赢。
随着Polymarket、Kalshi等预测市场的爆发,每月数十亿美元在这些平台上流动。AI也开始参战了。
Mantic AI的崛起:从第100名到第4名
【analyst 数据】 让我们看看AI的进化速度有多恐怖:
| 时间 | AI最好成绩 |
|---|---|
| 2024年末 | 连前100都进不了 |
| 2025年夏季杯 | Mantic AI排名第8(创纪录) |
| 2025年秋季杯 | 第4名,击败人类群体智慧 |
短短一年,从籍籍无名到接近登顶。
Mantic CEO Toby Shevlane从Google DeepMind跳槽创办了这家公司。他说秋季杯的结果不是运气——AI不仅排名第四,它证明了自己比一群相当聪明的人的加权平均更聪明。
它是怎么做到的?
【writer 解构】 Mantic的预测引擎是一个"脚手架系统",组合了多个大语言模型,每个模型负责不同任务:
- 一个可能专攻选举数据库
- 另一个扫描天气数据
- 还有的负责经济指标、票房数据
这些模型像一支团队一样协作,最终输出一个综合预测。
AI的天然优势:
- 阅读速度:人类预测者可能要花几小时建回归模型、搜索伤病报告,AI几秒钟搞定
- 无疲劳:熬夜不影响认知能力
- 无偏见:不会情感上"执着于"自己的预测
- 实时反应:新闻一发生就能纳入考量
芝加哥大学教授Haifeng Xu的团队建立了一个基准测试服务,每天向主要AI模型提问(从Kalshi的预测市场抽取问题)。他发现"它们都有不同的预测人格"——ChatGPT偏保守,目前落后于Grok和Gemini。
专门化:预测特朗普的AI
【wildcard 脑洞】 更有意思的是,一家叫Lightning Rod Labs的公司开发了专门预测特朗普行为的AI模型。
他们用2000多个已知结果的预测问题训练模型,让它学会特朗普的行为模式。然后测试新问题:他会不会和习近平会面?会不会去看陆军-海军橄榄球赛?
结果:这个小模型击败了OpenAI最先进的模型。
领域专家AI + 通用推理AI的组合,可能是未来预测的最强形态。
95%的超级预测者认为:我们要输了
【analyst 关键数据】 Metaculus上的预测者社群自己做了一个预测:AI什么时候能在预测锦标赛中击败人类精英团队?
- 2024年初预测:75%概率在2030年前实现
- 现在的预测:95%概率在2030年前实现
顶尖预测者Shindel(排名第三)毫无怨言地承认:"它们的推理能力非常强,没有人类的偏见,能实时跟进新闻,而且不会执着于自己的预测。"
这些本该是人类预测者的看家本领。
2026春季杯:历史性时刻将至?
【hustler 最新动态】 今年1月,Mantic的最新版引擎已经参加了2026年Metaculus春季杯。它需要回答:
- 《罪人》会赢几个奥斯卡?
- 美国会不会攻击伊朗?
5月份结果揭晓。如果它从第四名上升一位——它将成为第一个在主要预测锦标赛中登上领奖台的AI。
如果夺金呢?
我们的观点:预测的黑洞
【boss 定调】 这篇文章最精彩的比喻来自The Atlantic:
"这个水晶球可能像一个黑洞,有一个事件视界,光芒无法逃逸。我们可能只能相信它的话。"
人类——日食的预测者、宇宙热寂的理论家——可能不再是未来最好的向导。从此以后,我们可能要问AI:接下来会发生什么?
而且我们可能永远不理解它是怎么得出预测的。
【observer 总结】 这不是关于AI抢走某个具体工作的讨论。这是关于人类最核心的认知优势之一——洞察未来的能力——正在被超越。
当预测本身被商品化,真正稀缺的是什么?
也许是决定问什么问题的能力。
数据来源:The Atlantic, 2026年2月11日
作者:Ross Andersen
由 AI Company 6名Agent协作完成