在 GPU 计算领域,CUDA 曾是无可替代的 "武林秘籍"—— 掌握它,就意味着手握 GPU 加速计算的钥匙。但 2025 年末,英伟达用 CUDA Toolkit 13.1 掀起了一场颠覆性变革,Tile 编程模型横空出世,让 GPU 编程从专业开发者的 "专属特权",变成了普通开发者触手可及的工具,堪称自 2006 年 CUDA 诞生以来最彻底的范式升级。
多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。在近期的 GTC 大会上,英伟达宣布其 CUDA 工具包将为 Python 提供原生支持并全面与之集成。也就是说,开发人员能够使用 Python 直接在 GPU 上执行算法式计算。 据悉,2025 年被英伟达视为“CUDA Python ...
NVIDIA 在2025年GTC大会上宣布了一项具有里程碑意义的技术更新:CUDA并行计算平台正式支持原生Python编程。这一突破性进展将 ...
长期以来,英伟达公司作为GPU领域的绝对霸主,就像顶级厨师一样,精心优化着这些核心计算代码,他们的cuBLAS和cuBLASLt库被全世界的开发者广泛使用。这些库经过了无数工程师多年的精心调优,性能已经达到了极高的水准。然而,DeepReinforc ...
尽管春节假期已经过半,但是“来自东方的神秘力量的 DeepSeek”仍在引起全世界热议,各路业内人士也仍在从不同角度分析 DeepSeek 的模型和技术文章。 韩国 Mirae Asset Securities Research 的一名分析师在 X 撰写长文分析称:“这一突破是通过实施大量细粒度优化和 ...
近日,一则有关英伟达试图在其CUDA软件中封杀第三方GPU公司的消息,正引起国内外人工智能及芯片行业的关注。在CUDA 11.6版本开始,安装的时候会在EULA(最终用户许可协议)中看到相关警告条款:“你不能逆向工程、反编译或反汇编使用此SKD生成的任何结果 ...
【新智元导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。 试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰? 又有多少开发者曾因为频频闪烁的警报「 ...
加利福尼亚州,圣克拉拉市 – 2006年11月8日 – 图形处理器技术的全球领先者NVIDIA公司(纳斯达克代码:NVDA)今天宣布推出NVIDIA CUDA技术,一种用于在NVIDIA图形处理器(GPU)上进行计算的全新体系架构,这是业界首个GPU用的C-编译器开发环境。 GPU采用CUDA技术进行 ...
快科技2月5日消息,DeepSeek全球爆火,再一次引发外界对GPU算力限制话题的关注。 据报道,DeepSeek开发的大语言模型绕过了英伟达的CUDA框架,正为未来兼容国产GPU芯片做准备。 众所周知,英伟达的CUDA(Compute Unified Device Architecture,统一运算架构)能大幅降低研发 ...
英伟达发布最新版CUDA 13.1,官方直接定性:这是自2006年诞生以来最大的进步。 核心变化是推出全新的CUDA Tile编程模型,让开发者可以用Python写GPU内核,15行代码就能达到200行CUDA C++代码的性能。 英伟达是不是亲手终结了CUDA的“护城河”?如果英伟达也转向Tile ...
在AI市场爆发式需求的带动下,国产GPU企业业绩实现跨越式增长,2025年国产GPU市场规模预计突破800亿元,年增速超60%。其中,云端AI训练推理GPU成为增长核心引擎,但云端GPU快速发展的背后,消费级GPU领域仍是国产GPU的一大短板。
至顶头条 on MSN
AMD发布Instinct GPU新品挑战英伟达数据中心霸主地位
AMD在CES 2026上发布了下一代Instinct MI500 GPU和MI400X芯片,专为企业AI工作负载设计。公司还展示了Helios机架级系统,可在单个机架中提供3 AI exaflops性能。面对英伟达超过90%的数据中心市场份额,AMD将重点瞄准寻求性价比平衡的中小企业客户,通过开源ROCm软件对抗CUDA。MI500 GPU计划2027年推出,声称AI性能较MI300X提升100 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈