传统基础模型在S-NIAH单针大海捞针等简单检索任务中尚能维持表现,但在信息密度更高的复杂任务中,其推理性能随输入长度增加而下降。相比之下,RLM在输入长度超过特定阈值区间后,依然保持得分稳定性。
说到底,MIT这项关于递归语言模型的研究为我们展示了一种全新的AI工作方式。不再是让AI硬记所有信息,而是教会AI如何聪明地利用外部资源,如何分解复杂问题,如何进行有效的信息管理。这种方式不仅更加高效,也更加接近人类的思维模式。
新年伊始,MIT CSAIL 的一纸论文在学术圈引发了不小的讨论。Alex L. Zhang 、 Tim Kraska 与 Omar Khattab 三位研究者在 arXiv 上发布了一篇题为《Recursive Language ...
在此期间,他获得了清华大学综合优秀奖学金(2019)、全国大学生数学建模竞赛(CUMCM)一等奖(2020)、国家奖学金(2020)、清华大学「未来学者」奖学金(2021)等多项奖项。
麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究团队提出了一种突破性方法,旨在解决大型语言模型处理超长文本时面临的“上下文腐烂”难题。这项发表于arXiv平台的研究(编号:2512.24601v1)显示,通过引入递归语言模型(RLM),AI系统处理长文本的能力实现了两个数量级的跨越,同时保持成本可控甚至更低。 传统语言模型在面对长文本输入时,性能会随文本长度增加而急剧下降。研究团队将其类 ...
《MIT科技评论》发布对2026年人工智能领域的五大趋势预测:其一,中国开源大模型因开放权重和高度可定制性,将在美国硅谷获得更广泛采用;其二,美国将陷入联邦与州之间的监管拉锯战;其三,AI购物助手将改变零售业,预计到2030年代理商务规模可达数万亿美元;其四,大语言模型将辅助人类做出重要科学发现,有望在数学、材料学等领域催生新突破;其五,针对AI公司的法律诉讼将升级,相关审判将逐步厘清法律责任边界 ...
十轮网科技资讯 on MSN
MIT科研团队发明“一拉即成”可变形材料,实现平面快速折叠成3D结构
MIT的研究人员发现了一种只需拉动一根线就能把平面薄片转变为功能性三维物体的方法。这就像一本立体书,但要复杂得多。奇妙的是,操作却异常简便。该工作来自MIT计算机科学与人工智能实验室,已在《ACM Transactions on ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈