Transformer Encoder 图

覆盖天体物理/地球科学/流变学/声学等19种场景，Polymathic AI构建1.3B ...

作者：梅菜编辑：李宝珠转载请联系本公众号获得授权，并标明来源Polymathic AI 联合研究团队提出了一个以 Transformer 为核心架构、主要面向类流体连续介质动力学的基础模型 Walrus。Walrus 在预训练阶段覆盖了 19 ...

2 天

AAAI 2026 杰出论文 | 同济&微软等提出 LLM2CLIP：补足 CLIP 难以处理长 ...

过去我们试图通过堆视觉数据来提升 CLIP，但 LLM2CLIP 证明了，通过引入一个已经“读过万卷书”的 LLM，并辅以少量的、高质量的描述数据，就能让视觉表征产生质的飞跃。这种“低成本、高收益”的方案，很可能会成为未来多模态预训练的新范式。目前 ...

腾讯网

Transformer如何让自动驾驶大模型获得思考能力？

编者语：后台回复“入群”，加入「智驾最前沿」微信交流群在谈及自动驾驶时，Transformer一直是非常关键的技术，为何Transformer在自动驾驶行业一直被提及？先说结论，Transformer之所以在自动驾驶领域被频繁提到，并被广泛推崇，主要是因为这种架构在处理多源、高维、长时序的数据时，天然具备很多有利属性，它能高效建模 ...

10 天

【科技前沿】谷歌4D世界模型来了，比SOTA快300倍！

【新智元导读】谷歌 DeepMind 发布 D4RT，彻底颠覆了动态 4D 重建范式。它抛弃了复杂的传统流水线，用一个统一的「时空查询」接口，同时搞定全像素追踪、深度估计与相机位姿。不仅精度屠榜，速度更比现有 SOTA 快出 300 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果