关闭广告

英伟达发布新一代Rubin平台,推理成本较Blackwell降10倍,拟下半年发货

华尔街见闻官方1156人阅读

英伟达在CES展会推出新一代Rubin AI平台,标志着其在人工智能(AI)芯片领域保持年度更新节奏。该平台通过六款新芯片的集成设计,在推理成本和训练效率上实现大幅跃升,将于2026年下半年交付首批客户。


美东时间5日周一,英伟达CEO黄仁勋在拉斯维加斯表示,六款Rubin芯片已从合作制造方处回厂,并已通过部分关键测试,正按计划推进。他指出"AI竞赛已经开始,所有人都在努力达到下一个水平"。英伟达强调,基于Rubin的系统运行成本将低于Blackwell版本,因为它们用更少组件即可实现相同结果。

微软和其他大型云计算提供商将成为下半年首批部署新硬件的客户。微软的下一代Fairwater AI超级工厂将配备NVIDIA Vera Rubin NVL72机架级系统,规模可扩展至数十万颗NVIDIA Vera Rubin超级芯片。CoreWeave也将是首批提供Rubin系统的供应商之一。

该平台的推出正值华尔街部分人士担忧英伟达面临竞争加剧,并怀疑AI领域的支出能否维持当前速度。但英伟达保持长期看涨预测,认为总市场规模可达数万亿美元。

性能提升瞄准新一代AI需求

据英伟达公告,Rubin平台的训练性能是前代Blackwell的3.5倍,运行AI软件的性能则提升5倍。与Blackwell平台相比,Rubin可将推理代币生成成本降低至多10倍,训练混合专家模型(MoE)所需GPU数量减少4倍。

新平台配备的Vera CPU拥有88个核心,性能是其替代产品的两倍。这款CPU专为代理推理设计,是大规模AI工厂中能效最高的处理器,采用88个定制Olympus核心、完整Armv9.2兼容性和超快NVLink-C2C连接。

Rubin GPU配备第三代Transformer引擎,具备硬件加速自适应压缩功能,可提供50 petaflops的NVFP4计算能力用于AI推理。每个GPU提供3.6TB/s的带宽,而Vera Rubin NVL72机架则提供260TB/s带宽。

芯片测试进展顺利

黄仁勋披露,全部六款Rubin芯片已从制造合作伙伴处返回,并已通过显示其可按计划部署的关键测试。这一表态表明英伟达正维持其作为AI加速器领先制造商的优势地位。

该平台包含五大创新技术:第六代NVLink互连技术、Transformer引擎、机密计算、RAS引擎以及Vera CPU。其中第三代机密计算技术使Vera Rubin NVL72成为首个提供跨CPU、GPU和NVLink域数据安全保护的机架级平台。

第二代RAS引擎横跨GPU、CPU和NVLink,具备实时健康检查、容错和主动维护功能,以最大化系统生产力。机架采用模块化、无线缆托盘设计,组装和维护速度比Blackwell快18倍。

广泛生态系统支持

英伟达表示,包括亚马逊的AWS、谷歌云、微软和甲骨文云在2026年将率先部署基于Vera Rubin的实例,云合作伙伴CoreWeave、Lambda、Nebius和Nscale也将跟进。

OpenAI CEO Sam Altman表示:“智能随计算扩展。当我们增加更多计算时,模型变得更强大,能解决更难的问题,为人们带来更大影响。英伟达Rubin平台帮助我们持续扩展这一进展。”

Anthropic联合创始人兼CEO Dario Amodei称,英伟达“Rubin平台的效率提升代表了能够实现更长记忆、更好推理和更可靠输出的基础设施进步”。

Meta CEO扎克伯格表示,英伟达的“Rubin平台有望带来性能和效率的阶跃式变化,这是将最先进模型部署给数十亿人所需要的”。

英伟达还称,思科、戴尔、惠普企业、联想和超微预计将推出基于Rubin产品的各类服务器。包括Anthropic、Cohere、Meta、Mistral AI、OpenAI和xAI等AI实验室正期待利用Rubin平台训练更大型、更强大的模型。

提前公布产品细节

评论称,英伟达今年比往年更早披露新产品的细节,这是该司保持行业依赖其硬件的举措之一。因为英伟达通常在每年春季加州圣何塞举行的GTC活动上深入介绍产品细节。

对黄仁勋而言,CES只是其马拉松式出席活动的又一站。他要在各类活动中宣布产品、合作和投资,均旨在为AI系统部署增添动力。

英伟达公布的新硬件还包括网络和连接组件,将成为DGX SuperPod超级计算机的一部分,同时也可作为单独产品供客户以更模块化的方式使用。这一性能提升是必需的,因为AI已转向更专业化的模型网络,不仅要筛选海量输入,还需通过多阶段流程解决特定问题。

英伟达正在推动面向整个经济领域的AI应用,包括机器人、医疗保健和重工业。作为这一努力的一部分,英伟达宣布了一系列旨在加速自动驾驶汽车和机器人开发的工具。目前,基于英伟达的计算机支出大部分来自少数客户的资本支出预算,包括微软、Alphabet旗下的谷歌云和亚马逊旗下的AWS。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

德约领衔ATP阿德莱德站正赛名单

体坛周报 浏览 1347

谁说了算?泰伦-卢赛前说哈登可以出战,快船官方说卢说错了

懂球帝 浏览 1366

省委书记暗访次日 市委书记赴现场办公要求加快整改

新京报政事儿 浏览 8216

蔚来多款车型推出电池月租付一赠一限时优惠

网易汽车 浏览 1178

新款狮铂拓界暂定明年3月份上市!若12万能火吗?

汽车网评 浏览 1347

连爆2大行业瓜!大花回应只字不提影帝

大龄女一晓彤 浏览 1602

国米取胜后距榜首1分,罗马如果能客胜米兰将独自领跑积分榜

懂球帝 浏览 1711

特朗普命令2028年登月 在月球部署核反应堆

财联社 浏览 4663

这届双十一,充满了“AI味”与“本地生活味”

连线Insight 浏览 1916

双巴大战来了!萨巴伦卡、莱巴金娜会师WTA总决赛争冠

懂球帝 浏览 1564

汪小菲接俩娃回北京过春节!玥儿和奶奶逛公园

地理三体说 浏览 908

43天内两度被约谈引关注,携程的奔跑与隐忧

天下财道社 浏览 2041

墨西哥总统宣布将向古巴提供援助并推动恢复石油供应

上观新闻 浏览 856

古巴外交部谴责美国蓄意制造借口对委内瑞拉动武

上观新闻 浏览 2025

“食安AI博士”智能体首秀进博会!

文汇报 浏览 1719

利物浦女足前主帅比尔德的葬礼举行,超过六百人参加

懂球帝 浏览 1917

更运动 阿尔法·罗密欧Junior运动特别版发布

车质网 浏览 1799

2025 FT年度人物:黄仁勋

新智元 浏览 1410

委内瑞拉总统:美国编造荒诞借口以便入侵加勒比

国际在线 浏览 1567

地平线苏箐:3年后 准L4级系统大概率已经量产

网易汽车 浏览 1405

《玉茗茶骨》张慧雯啊,是最可惜的谋女郎

温柔娱公子 浏览 1105
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1