🎉【Gate 3000万纪念】晒出我的Gate时刻,解锁限量好礼!
Gate用户突破3000万!这不仅是数字,更是我们共同的故事。
还记得第一次开通账号的激动,抢购成功的喜悦,或陪伴你的Gate周边吗?
📸 参与 #我的Gate时刻# ,在Gate广场晒出你的故事,一起见证下一个3000万!
✅ 参与方式:
1️⃣ 带话题 #我的Gate时刻# ,发布包含Gate元素的照片或视频
2️⃣ 搭配你的Gate故事、祝福或感言更佳
3️⃣ 分享至Twitter(X)可参与浏览量前10额外奖励
推特回链请填表单:https://www.gate.com/questionnaire/6872
🎁 独家奖励:
🏆 创意大奖(3名):Gate × F1红牛联名赛车模型一辆
👕 共创纪念奖(10名): 国际米兰同款球员卫衣
🥇 参与奖(50名):Gate 品牌抱枕
📣 分享奖(10名):Twitter前10浏览量,送Gate × 国米小夜灯!
*海外用户红牛联名赛车折合为 $200 合约体验券,国米同款球衣折合为 $50 合约体验券,国米小夜灯折合为 $30 合约体验券,品牌抱枕折合为 $20 合约体验券发放
🧠 创意提示:不限元素内容风格,晒图带有如Gate logo、Gate色彩、周边产品、GT图案、活动纪念品、活动现场图等均可参与!
活动截止于7月25日 24:00 UTC+8
3
博士级 AI?马斯克 XAI 推出 Grok 4:多代理推理、预测市场功能一次看
马斯克领军的人工智慧公司 xAI 几个小时前正式发表最新一代 AI 模型 Grok 4,号称为「地表最聪明 AI」。该模型结合前所未有的推理能力、博士级学术水准与多工具使用的整合,并在多项基准测试中打破纪录。他预期 Grok 4 将在一年内带来实质性的技术发明或学术意义。
Introducing Grok 4, the world’s most powerful AI model. Watch the livestream now:
— xAI (@xai) July 10, 2025
两版本:Grok 4 与 Grok 4 Heavy
首先,Grok 4 分为单纯的单代理版本 (Single-Agent Version) 的 Grok 4、以及多代理版本 (Multi-Agent Version) 的 Grok 4 Heavy。
Grok 4:基础版本,以单一 AI agent 处理问题。
Grok 4 Heavy:采用多代理协作模式 (multi-agent collaboration),让多个代理先各自解决问题,再如同「学习小组」般互相分享解决方案并比较彼此成果,再得出最终答案。
目前,该公司也推出了至今最昂贵的订阅计划「SuperGrok Heavy」,每月 300 美元。计划订阅者能抢先体验 Grok 4 Heavy 服务,以及未来所推出功能的优先使用权。
博士等级智慧:从 SAT 满分到全领域天才
再来,xAI 声称 Grok 4 具有超越人类的学术与逻辑能力,成为现阶段最接近通用人工智慧 (AGI) 的模型之一。他能在美国 SAT、GRE等高等考试中获得近乎满分的成绩,并在所有学科表现出博士以上等级的知识涵养。
另外,Grok 4 在多项指标性基准测试中创下新高,展现前所未见的能力边界。具体包括:
在困难研究生问题 (GPQA)、美国数学考试 (AIME 2025)、美国数学奥林匹克竞赛 (USAMO) 等高难度数理逻辑挑战均在现有 AI 模型中排名第一。
在 Vending-Bench 自动贩卖机商业营运模拟测试中,成功让资产收入翻倍,展现出稳定且贯彻始终的策略制定能力。
生物医学研究中心 ARC Institute 以 Grok 4 协助自动化其研究流程,高效率推动实验进行。
其他还有医疗影像检查、金融策略制定与游戏开发等领域皆已存在实际应用。
同时,在人类终极测验 (Humanity’s Last Exam, HLE) 中,Grok 4 能在无辅助情况下解出 25.4% 题目,Grok 4 Heavy 版本则能够解出 44.4% 的题目,在现有 AI 模型中排名第一。
用 Colossus 超级电脑训练 Grok 4,运算效率大提升
xAI 透露,Grok 4 的问世背后,是来自硬体与训练策略的双重飞跃:「Grok 4 的训练量是 Grok 2 的 100 倍。」
借由我们的 Colossus 超级电脑约 20 万颗 H100 GPU,从预训练到强化学习 (RLHF),Grok 4 强化了模型对推理任务的专注与精确度。
团队强调,随着人类编写的考题难度已「无法有效训练」Grok 4,现实世界将成为最终的测试场所,像是能否真正创造有用的发明或技术,借以判断它们是否实际有效。
工具整合与现实互动:Grok 4 迈向可操作性 AI
同时,Grok 4 也不只是会思考,更将学会如何动手解决真实世界问题。xAI 表明,不同于其他模型,Grok 4 将工具使用能力纳入训练流程,提升实作与应变能力:
未来几个月内,Grok 4 将接入特斯拉和 SpaceX 使用的工程分析工具,进入更精密的工程环境。我们更计划在今年底前向各大公司提供强大的企业级工具与高度精确的物理模拟器。
团队补充,「当前目标是让 Grok 能操纵人形机器人 Optimus,并在物理世界中验证其逻辑与创意的真实与有效性。」
(辉达黄仁勋:华为晶片已追上 NVIDIA H20,马斯克 Optimus 机器人开启兆元商机)
超越人类的推理能力:Grok 4 能创造新发明?
再来是 xAI 最引以为傲的推理功能,Grok 4 不仅能从训练资料中提取知识,更具备经强化训练所培养的的逻辑思考能力,能在未知情境中自行构建问题解法,并进行多代理的集体思辨验证,最终跟人类科学家一样推导出自己的结论:
Grok 4 被设计为从「第一性原理」出发的思考方式,能自行发现问题、建构逻辑并完成复杂的演绎,这是其他与以往 AI 难以触及的推理场域。
xAI 预期,Grok 4 将在最早今年前、最晚明年发明出真正实用的新技术,并于未来两年内可能发现目前人类还未知的科学原理。
(专访马斯克:AI 超级智慧将爆发、创业者应追求「有用」而非「伟大」的人生)
从市场预测到游戏创作:Grok 4 应用层面再次扩大
最后,xAI 也展示了 Grok 4 横跨语音互动与金融商业等多领域的实际应用潜力。以事件趋势判读为例,Grok 4 Heavy 能够查看预测市场 Polymarket、运用统计计算与推理能力,仅用几分钟便预测出道奇队在世界大赛的胜率为 21.6%,展现出超越传统量化分析工具的即时运算实力。
Grok 4 透过 Polymarket 数据推估道奇队在 MLB 世界大赛的胜率
(X 宣布与 Polymarket 合作,作为官方预测市场伙伴)
Grok 的未来愿景也令人惊艳,xAI 表示,未来版本将加入影片理解与游戏互动能力,能够游玩游戏并判断所谓「乐趣」,甚至整合游戏引擎自行创造互动与艺术内容。包括电视节目、电影作品与电玩游戏等。
语音方面,Grok 4 的表现也有重大升级。新版模型引入多种声音风格与口音,使对话更加自然且流畅。发布会上还刻意与 GPT 做比较,凸显 Grok 4 不仅不会打断使用者,也大大缩短了思考与回应的延迟时间,成为其介面的一大亮点。
Grok 4 不只是工具,更成人类文明推进器
Grok 4 的诞生,不仅代表 AI 迈入更深入的思考与应用阶段,据马斯克所述,更有望引发一场横跨教育、科学、商业与创意产业的智慧革命,而 Grok 将真正参与其中,而非仅是从旁协助的语言模型或辅助工具。
xAI 开发团队的未来愿景宏大而激进,他们强调:「AI 如今已不再只是帮我们思考,而是与我们共同创造世界。」
这篇文章 博士级 AI?马斯克 xAI 推出 Grok 4:多代理推理、预测市场功能一次看 最早出现于 链新闻 ABMedia。