作者:梅菜编辑:李宝珠转载请联系本公众号获得授权,并标明来源Polymathic AI 联合研究团队提出了一个以 Transformer 为核心架构、主要面向类流体连续介质动力学的基础模型 Walrus。Walrus 在预训练阶段覆盖了 19 ...
过去我们试图通过堆视觉数据来提升 CLIP,但 LLM2CLIP 证明了,通过引入一个已经“读过万卷书”的 LLM,并辅以少量的、高质量的描述数据,就能让视觉表征产生质的飞跃。这种“低成本、高收益”的方案,很可能会成为未来多模态预训练的新范式。 目前 ...
编者语:后台回复“入群”,加入「智驾最前沿」微信交流群在谈及自动驾驶时,Transformer一直是非常关键的技术,为何Transformer在自动驾驶行业一直被提及?先说结论,Transformer之所以在自动驾驶领域被频繁提到,并被广泛推崇,主要是因为这种架构在处理多源、高维、长时序的数据时,天然具备很多有利属性,它能高效建模 ...
【新智元导读】谷歌 DeepMind 发布 D4RT,彻底颠覆了动态 4D 重建范式。它抛弃了复杂的传统流水线,用一个统一的「时空查询」接口,同时搞定全像素追踪、深度估计与相机位姿。不仅精度屠榜,速度更比现有 SOTA 快出 300 ...