近期,专注于人工智能研究的技术团队Thinking Machines ...
10月23日,夸克上线了AI对话助手。夸克这次用的是Qwen最新最强的闭源模型。众所周知阿里前段时间发布的闭源模型Qwen3-Max的性能已经站在全球第一梯队。而夸克AI助手这次用到的最新闭源模型,可想而知会比Max更加Max。这个对话助手最大的特点 ...
作者|周一笑邮箱|zhouyixiao@pingwest.com最近,科技圈和币圈的吃瓜群众们,都围在了一个名为Alpha ...
Thinking Machines Lab(TML)近期发布了一篇技术博客,详细介绍了其“在策略蒸馏”训练方法,这项成果引发了业界对轻量级模型潜力的广泛关注。该方法的核心在于融合强化学习的纠错机制与监督微调的密集反馈,尤其在数学推理和个性化助手场景中展现出显著优势。TML的这一突破,无疑为轻量级大模型的训练与应用,提供了新的思路。 “在策略蒸馏”:高效训练的秘密 TML的“在策略蒸馏”方法,将训练 ...
外媒的关注正映射出这场“入口之争”的全球意义。本周,彭博社、路透社先后聚焦夸克正在推进代号为“C计划”的AI新业务;近日,《巴伦周刊》更发文指出:阿里正同步进军Meta主导的AI眼镜赛道与ChatGPT所在的智能对话领域,股价应声上涨。
由美国研究实验室nof1.ai发起的“Alpha Arena”AI投资实战竞赛,吸引多家全球主流大模型参赛,正成为观察AI自主交易能力的一场“公开测试”。 参赛的六大主流AI模型包括DeepSeek、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4与阿里的Qwen 3 Max。每个模型以1万美元初始资金,在去中心化交易所Hyperliquid上进行永续合约 ...
在策略蒸馏(on-policy distillation) 是一种将强化学习 (RL) 的纠错相关性与 SFT 的奖励密度相结合的训练方法。在将其用于数学推理和内部聊天助手时,TML 发现在策略蒸馏可以极低的成本超越其他方法。
阿里首款自研AI眼镜夸克AI眼镜在天猫开启预售仅10小时,便成功登顶双11智能眼镜品类销量榜首。这款被市场视为“下半年最具期待值的AI硬件”的产品,不仅标志着阿里在AI硬件领域的大规模试水,更意味着其AI生态战略进入实质性落地阶段。有分析指出,阿里正通过算力、模型、硬件与应用的深度整合,构建起覆盖全场景的AI生态闭环,这一布局已对国际科技巨头形成战略级挑战。 在底层技术层面,阿里通义千问(Qwen ...
Qwen版深度研究加速进化,一觉起来增加了听觉和视觉输出: 确实从评测结果上看,32B版本性能已经超越上代Qwen2.5-VL的72B版本,以及OpenAI和Anthropic的闭源方案,也没有什么必要再堆参数了。
在这个时点上,大模型团队如何确定自己的发展主线,不只是个技术问题,更是对不同产品路线和商业判断的策略问题。 4月28日,AI圈子内的从业者们都在等待一件事:Qwen 3。 从中午开始,Qwen 3即将发布的小道消息,已经满天飞舞。Qwen团队负责人林俊旸也在X上 ...
IT之家 10 月 16 日消息,今天下午,通义千问 Qwen 通过公众号宣布:Qwen Chat Memory 正式上线,标志着 Qwen 拥有“长记忆” ,能理解用户的上下文、保留重要信息、回忆过往对话。具体来看,其能够存下与用户相关的记忆,并在对话中主动关联上下文。
本文将深入探讨这些AI工具如何通过显式记忆和隐式记忆来更好地理解和响应用户需求。通过实际案例和用户体验,文章展示了记忆功能如何让AI从简单的回应者转变为真正的陪伴者,从而实现从功能智能到关系智能的转变。 最近,闲来无事,问了很多AI同一个问题: ...