花旗称,英伟达推出专为长语境推理设计的Rubin CPX GPU,承诺为客户带来50倍投资回报率,远超GB200 NVL72的10倍回报率。该芯片在注意力机制方面性能较GB300 NVL72提升3倍。英伟达GB300 NVL72系统在MLPerf推理基准测试中创下新纪录。这些发布表明推理时代已经到来。
英伟达重磅推出专为长语境推理设计的全新Rubin CPX GPU,承诺为客户带来前所未有的投资回报率! 9月9日,花旗在最新研报中称,英伟达在AI基础设施峰会上推出专为长语境推理设计的全新Rubin CPX GPU,承诺为客户带来前所未有的投资回报率——每投入1亿美元可 ...
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! Rubin CPX通过硬件层面的优化,实现了效率与成本的再平衡。Rubin CPX是英伟达发布的一款专为处理超长上下文AI推理任务设计的GPU,其采用了创新的解耦式推理架构,从算力性能上 ...
本文来自“HotChips 2025合集”,本文所有资料都已上传至“智能计算芯知识”星球对应的AI+芯片技术峰会专栏。 下载链接: 105+份GPU技术报告合集 100+份AI Agent技术报告合集 清华大学:DeepSeek报告13部曲合集 浙江大学:DeepSeek技术20篇(合集) 330+份DeepSeek技术报告 ...
英伟达推新产品的速度,是很快的,特别是现在需要不断证明自己领先的位置。 英伟达Rubin CPX 是 GPU 设计新的思路,采用了解耦推理的方式,把长上下文处理和生成任务拆分开来,还搭配大容量 GDDR7 显存打造了新的 GPU。 这种设计考虑到了算力和内存需求的差异 ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果