Anthropic 的 Claude Code 凭借出色的代码能力和原生集成体验,赢得了大量开发者口碑。OpenAI ...
Soul App开源实时数字人模型SoulX-FlashTalk:0.87秒低延时、32fps支持超长视频稳定生成,延时,soulx,flashtalk,fps,数字人,引擎 ...
一点资讯 on MSN
谷歌Alpha家族再登Nature封面,刷新基因组预测SOTA,精准定位远端致病 ...
谷歌Alpha家族,再登Nature封面! 这次推出的全新成员AlphaGenome,将AI的预测疆域拓展到了最为宏大且神秘的人类基因组图谱。 AlphaGenome能够同时对11种不同的基因调控过程进行综合预测,准确捕捉基因深处的复杂互动。
1月27日,国产GPU厂商曦望(Sunrise)在杭州发布新一代推理GPU芯片启望S3,并同步推出面向大模型推理的超节点方案及推理云计划。这是曦望在近一年累计完成约30亿元战略融资后的首次系统性技术亮相。
7 天on MSN
曦望启望S3推理GPU亮相:聚焦单位Token成本,国产GPU开启新征程
国产GPU厂商曦望(Sunrise)在杭州举办的首届Sunrise GPU ...
另外,今天的另一个重磅消息,是Claude Code之父Boris Cherny上了知名科技播客主持人Greg Isenberg的访谈节目。
大家都知道,AI 计算(尤其是模型训练和推理),主要以并行计算为主。 AI 计算中涉及到的很多具体算法(例如矩阵相乘、卷积、循环层、梯度运算等),都需要基于成千上万的 GPU,以并行任务的方式去完成。这样才能有效缩短计算时间。 接下来,我们逐一 ...
随着ChatGPT、Claude等大语言模型在推理、数学和代码生成等复杂任务上展现惊人能力,强化学习后训练(RL Post-Training)已成为提升模型性能的关键环节。然而,传统的同步训练架构面临着严峻的资源利用率和可扩展性挑战。就在2025年初,Meta发布的Llama 3 RLHF版和 ...
研究人员针对现有多序列比对(MSA)工具无法应对海量基因组数据的问题,开发了支持GPU加速的TWILIGHT工具。该研究通过创新并行化策略和内存优化技术,实现了对800万条SARS-CoV-2基因组的高效对齐,在保持<16GB内存占用的同时将百万级RNA序列比对时间缩短至30分钟 ...
专为Blackwell架构设计的Helix技术重塑长上下文解码能力,为高速多用户AI交互树立新标杆。 英伟达近日公布一项突破性并行处理技术,有望彻底改变AI模型处理海量上下文的方式。这项名为"螺旋并行技术"(Helix Parallelism)的创新,使AI智能体能同步处理数百万单词 ...
当前DeepSeek等MoE(Mixture of Experts)混合专家模型已逐步成为LLM(大语言模型)领域的主流架构,但MoE模型训练面临几个关键问题,如内存占用大、通信时延高、负载不均衡、算力利用率低等,其中All2All通信耗时占比高和显存开销大是显著瓶颈。MindSpeed基于昇腾 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果