豪掷 20 万 GPU，马斯克用 Grok-3 砸出技术曙光了吗？-新闻资讯-工信资质中心-工业和信息化企业资质管理中心

豪掷 20 万 GPU，马斯克用 Grok-3 砸出技术曙光了吗？

发布时间：2025-02-20 文章来源：本站

在周一这个普通又不平凡的日子里，埃隆・马斯克旗下的 xAI 公司扔下了一颗重磅炸弹 —— 全新大模型 Grok-3 正式亮相。一同闯入大众视野的，还有由 20 万块 GPU 搭建而成的超级计算集群，马斯克此举，究竟是在技术前沿成功突围，还是单纯依靠海量资源 “豪赌” 未来？这无疑成为了科技界热议的焦点。

豪掷20万块GPU训练Grok-3，马斯克“大力出奇迹”了吗？

Grok-3：实力强劲却难称突破

从性能维度审视，Grok-3 的表现堪称惊艳。在标准的 AI 基准测试中，无论是数学（AIME）、科学（GPOA），还是编程（LCB）领域，它都拔得头筹，盲测环节更是表现卓越。此前内部代号为 “Chocolate” 的测试版本，在 LLMArena 平台上斩获最高 ELO 评分，这清晰地表明，相较于其他模型，用户更青睐 Grok-3 给出的答案。

尤为值得一提的是，Grok-3 的 “推理测试版” 在 AIME2025 基准测试中斩获 93 分的佳绩，把一众顶尖模型远远甩在身后，其他模型得分均未超过 87 分，充分彰显了其在数学推理方面的深厚功底。

然而，当我们将目光聚焦到现场演示，Grok-3 似乎更多地处于 “追赶者” 的角色，而非 “引领者”。xAI 展示的解决物理问题以及从头编写游戏代码的能力，ChatGPT、Claude 和谷歌的 Gemini 早已实现。这就意味着，Grok-3 是凭借强大的算力将他人已涉足的领域做到极致，而非另辟蹊径，开拓全新的技术方向。

20 万块 GPU 集群：风头盖过模型本身

相较于 Grok-3 模型，业界对马斯克构建的 20 万块 GPU 集群展现出了更为浓厚的兴趣，特别是在 DeepSeek 引发低成本模型训练热潮的当下。

试想一下，20 万块 GPU 紧密排列，那将是一个何等壮观的 “钢铁巨擘”！xAI 为这个超级计算集群起名为 “巨像”（Colossus），霸气的名字背后是实打实的强悍实力。

这个计算集群的训练分为两个阶段：首先在 10 万块 GPU 上历经 122 天的漫长训练，随后又耗时 92 天，将规模拓展至 20 万块。xAI 团队坦言，搭建这个集群的难度远超模型开发本身，堪称 “硬件先行，软件跟进” 的经典案例。

先跟随后创新：马斯克的未来布局

但 xAI 的雄心壮志显然不止于此。他们计划在接下来的几周内上线语音交互功能，马斯克着重强调，这并非普通的文本转语音（TTS）技术，而是真正意义上的 AI 语音模型。

与此同时，开发者将获得 API 访问权限以及音频转录功能，这意味着 Grok-3 有望成为第三方应用的得力助手，极大拓展其应用场景。

更具想象力的是，xAI 还打算成立一家 AI 游戏工作室，鼓励开发者借助 Grok-3 开发游戏。这一举措或许将成为 Grok-3 的一大独特卖点，毕竟，利用 AI 打造游戏，光是想想就令人热血沸腾。

小结

20 万块 GPU 的巨额投入，无疑让 Grok-3 在性能上实现了质的飞跃。但技术突破的核心，绝非单纯的 “堆砌资源”，创新才是永恒的灵魂。目前来看，Grok-3 更像是 “大力出奇迹” 的产物，至于未来它能否在语音交互、游戏开发以及 API 应用等新领域闯出一片新天地，我们唯有拭目以待。

声明：本站所使用的图片文字等素材均来源于互联网共享平台，并不代表本站观点及立场，如有侵权或异议请及时联系我们删除。

行业动态