parallelism - 搜索 News

23 小时

OpenAI 推桌面版 CodeX，多智能体并行，硬刚 Claude Code

Anthropic 的 Claude Code 凭借出色的代码能力和原生集成体验，赢得了大量开发者口碑。OpenAI ...

1 天

Soul App开源实时数字人模型SoulX-FlashTalk：0.87秒低延时、32fps支持超长 ...

Soul App开源实时数字人模型SoulX-FlashTalk：0.87秒低延时、32fps支持超长视频稳定生成,延时,soulx,flashtalk,fps,数字人,引擎 ...

一点资讯 on MSN

谷歌Alpha家族再登Nature封面，刷新基因组预测SOTA，精准定位远端致病 ...

谷歌Alpha家族，再登Nature封面！这次推出的全新成员AlphaGenome，将AI的预测疆域拓展到了最为宏大且神秘的人类基因组图谱。 AlphaGenome能够同时对11种不同的基因调控过程进行综合预测，准确捕捉基因深处的复杂互动。

6 天

曦望，死磕AI推理成本｜甲子光年

1月27日，国产GPU厂商曦望（Sunrise）在杭州发布新一代推理GPU芯片启望S3，并同步推出面向大模型推理的超节点方案及推理云计划。这是曦望在近一年累计完成约30亿元战略融资后的首次系统性技术亮相。

7 天on MSN

曦望启望S3推理GPU亮相：聚焦单位Token成本，国产GPU开启新征程

国产GPU厂商曦望（Sunrise）在杭州举办的首届Sunrise GPU ...

10 天

全网疯转，Claude Code之父神级代码首次公开！10亿美金秘密来了

另外，今天的另一个重磅消息，是Claude Code之父Boris Cherny上了知名科技播客主持人Greg Isenberg的访谈节目。

IT之家

一文看懂 AI 大模型的并行训练方式（DP、PP、TP、EP）

大家都知道，AI 计算（尤其是模型训练和推理），主要以并行计算为主。 AI 计算中涉及到的很多具体算法（例如矩阵相乘、卷积、循环层、梯度运算等），都需要基于成千上万的 GPU，以并行任务的方式去完成。这样才能有效缩短计算时间。接下来，我们逐一 ...

51CTO

阿里ROLL Flash：异步技术加速强化学习后训练，突破资源瓶颈的革命性 ...

随着ChatGPT、Claude等大语言模型在推理、数学和代码生成等复杂任务上展现惊人能力，强化学习后训练（RL Post-Training）已成为提升模型性能的关键环节。然而，传统的同步训练架构面临着严峻的资源利用率和可扩展性挑战。就在2025年初，Meta发布的Llama 3 RLHF版和 ...

生物通

TWILIGHT：基于GPU加速的超大规模多序列比对工具实现百万级基因组 ...

研究人员针对现有多序列比对(MSA)工具无法应对海量基因组数据的问题，开发了支持GPU加速的TWILIGHT工具。该研究通过创新并行化策略和内存优化技术，实现了对800万条SARS-CoV-2基因组的高效对齐，在保持<16GB内存占用的同时将百万级RNA序列比对时间缩短至30分钟 ...

腾讯网

英伟达发布全球首款长上下文AI引擎，实时服务用户量提升32倍

专为Blackwell架构设计的Helix技术重塑长上下文解码能力，为高速多用户AI交互树立新标杆。英伟达近日公布一项突破性并行处理技术，有望彻底改变AI模型处理海量上下文的方式。这项名为"螺旋并行技术"（Helix Parallelism）的创新，使AI智能体能同步处理数百万单词 ...

csdn

MindSpeed细粒度DualPipe通信掩盖，实现AllToAll和EP通信双掩盖，内存优化40%

当前DeepSeek等MoE（Mixture of Experts）混合专家模型已逐步成为LLM（大语言模型）领域的主流架构，但MoE模型训练面临几个关键问题，如内存占用大、通信时延高、负载不均衡、算力利用率低等，其中All2All通信耗时占比高和显存开销大是显著瓶颈。MindSpeed基于昇腾 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果