Llama - 搜索 News

知乎专栏 on MSN2 天

为什么Qwen能自我改进推理，Llama却不行？斯坦福找到了原理

机器之心报道，编辑：张倩、泽南。给到额外的计算资源和「思考」时间，为什么有的模型能好好利用，把性能提升一大截，而有的模型就不行？当遇到困难问题时，人类会花时间深入思考以找到解决方案。在 AI ...

2 天

科学家提出模型编辑新算法，实现Llama 3在知识编辑任务表现提升35%

“虽然只加入一行代码听起来很简单，但它将原本算法目标的两部分简化为一部分，通过零空间投影矩阵将结果投影到原始知识的零空间中。这种简化使得它具有很强的泛化性，并且其适用于目前大部分基于定位的模型编辑算法。”方俊峰说。

5 天

Meta Llama 4大模型来袭，语音交互能否成其AI商业化新引擎？

社交媒体巨头me ta正加速推进其人工智能语音功能的研发进程，据内部消息透露，公司计划在不久的将来推出最新的开源大语言模型——Llama 4，并将语音交互功能置于其核心位置。 me ta的这一举动，旨在通过AI技术推动商业化进程，据可靠信息，me ...

腾讯网5 天

Meta发力AI Agent，Llama 4将实现直接语音对话

Meta正发力AI Agent，尤其是在端侧AI和语音交互方面。公司计划将在未来几周内推出的Llama 4中引入更强大的语音功能。据英国《金融时报》报7日报道，Meta首席产品官Chris Cox在摩根士丹利技术、媒体和电信会议上透露，Llama ...

5 天

Meta Llama 4：解锁语音功能3大突破与深度解析

Llama 4模型在语音功能上的突破是其技术参数中的一大亮点。这款产品集成了先进的自然语言处理（NLP）算法，预计将支持实时语音识别和合成，自然流畅的交互将使得用户体验大幅提升。根据最新的数据，Llama 4的语言理解能力相比前代产品提升了30%以上，同时在多语种支持方面的优化也达到前所未有的高度。这使得Llama ...

2 天

鸿海富士康推出旗下首款 AI 推理大模型 FoxBrain ，基于 Meta Llama 3.1 打造

IT之家 3 月 10 日消息，鸿海富士康宣布推出旗下首款 AI 推理大模型“FoxBrain”，同时号称是台湾地区首款 AI 推理大模型，涵盖数据分析、数学、推理和代码生成等一系列功能，未来还将进行开源。

5 天on MSN

消息称 Meta 的 Llama 4 模型将聚焦语音交互，全力开拓 AI 商业版图

IT之家 3 月 7 日消息，据英国金融时报报道，社交媒体巨头 Meta 正在加速其人工智能的语音功能开发，计划在未来几周内推出其最新开源大语言模型 Llama 4，并将语音交互作为核心功能之一。据知情人士透露，Meta 希望借此推动 AI 技术的商业化发展，并在 2025 年实现其 AI 产品的重要突破。

腾讯网12 天

LLM模型添加自定义Token代码示例：为Llama 3.2模型添加思考与回答标记

点击上方“Deephub Imba”,关注公众号,好文章不错过 !本文将介绍如何为大型语言模型(LLM)添加自定义token并进行训练，使模型能够有效地利用这些新增token。以Llama 3.2模型为基础，实现了类似DeepSeek ...

搜狐22 天

树莓派Zero“逆袭”！八年老机也能玩转本地大语言模型？

Pham的这一项目得益于llama.cpp和llamafile的支持，这两者结合指令集和一系列轻量级软件包，为用户提供了一种离线的、轻量级的聊天机器人体验。

来自MSN5 个月

英伟达发布Llama-3.1-Nemotron-51B AI 模型

Llama-3.1-Nemotron-51B 实现了令人印象深刻的精度与效率权衡，减少了内存带宽，降低了每秒浮点运算次数 (FLOP)，并减少了总体内存占用，同时不影响 ...

来自MSN3 个月

Meta今年压轴模型Llama 3.3登场：700亿参数，性能比肩4050亿

Meta 强调 Llama 3.3 模型效率更高、成本更低，可以在标准工作站上运行，降低运营成本的同时，提供高质量文本 AI 解决方案。 Llama 3.3 模型重点优化了 ...

腾讯网20 天

首都在线(300846.SZ)：大模型平台已成功将国内的DeepSeek，及国外的Llama ...

格隆汇2月20日丨首都在线(300846.SZ)于近期投资者关系活动表示，公司大模型平台已成功将国内的DeepSeek，及国外的Llama、Bloom等主流大模型全面部署至云平台。基于前期模型部署积累的技术与经验，后续公司将持续关注行业动态，一旦出现优秀大模型，便能迅速实现部署。不仅如此，随着各类行业应用模型蓬勃发展，公司会以行业 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果