生成式AI领域的竞争从未停歇,各家企业轮番登场。年初,DeepSeek的突然崛起吸引了大量关注,而字节跳动的豆包大模型当时并未急于发声。然而,随着6月新版模型的推出,豆包迅速反弹,重新跻身国内AI大模型的第一梯队。
近日,谷歌DeepMind团队在《自然》杂志上发表重磅研究,宣布其开发的 DiscoRL 算法取得了突破性进展,实现了**强化学习 (RL) 规则的自主发现。这一成果不仅在Atari游戏基准测试中超越了MuZero等主流算法,更在未见过的环境中展现出强大的泛化能力,标志着 人工智能 (AI)**领域从人工设计向自动发现的范式转变。
近日,谷歌DeepMind团队在《自然》杂志上发表了一项重磅研究,宣布其开发的 DiscoRL 算法取得了突破性进展,实现了**强化学习(RL)**算法的自主设计。这一成果不仅在多个基准测试中超越了人类专家设计的算法,更预示着人工智能领域正经历着从人工设计向自动发现的范式转变。
据统计,1月14日至2月10日,深圳铁路累计到达旅客721万人今晚新澳门开什么号码次,同比增幅10.1%。其中,深圳北站到达旅客496.9万人次,同比增幅15.8%;深圳站到达旅客100万人次,同比增幅8.5%;深圳东站到达旅客57.9万人次,同比增幅17.1%。
然而两种主流后训练模式都各有致命缺陷:SFT和蒸馏虽然简单可并行,但这种填鸭式教育让模型在完美数据中变得僵化,无法应对自己犯错时的未知局面;RL赋予了模型探索能力,但稀疏奖励导致的大规模试错让成本激增。
豆包大模型还是当下字节高层布局和关注的焦点,这可能有利于内部信息对齐。公开信息称,从2024年下半年开始,张一鸣每月会参加一次字节跳动“Seed”核心技术团队的复盘和讨论会。另外一个值得注意的细节是,新调任豆包产品的负责人赵祺,曾担任AI条线人力资源负责人,有分析认为这可加强跨团队协同与组织整合。
很快,吴永辉在Seed就有了技术成果产出。今年4月,字节方面公开大模型论文“Seed-Thinking-v1.5”,作者名单中吴永辉的名字赫然在列。业内普遍认为该模型在推理能力与参数效率之间取得了较好平衡——用较少的激活参数却在重要任务上逼近或达到大 ...
本次宣讲会定于10月28日晚19时在博一教学楼A102教室举行。作为人工智能领域的领军企业,科大讯飞此次招聘将聚焦技术研发、产品管理等核心岗位,为优秀人才提供具有竞争力的职业发展平台。
当人工智能(AI)开始具备自主“进化”能力,人类在技术发展中的角色或将被重新定义。近日,Google ...
机器之心报道编辑:+0、Panda强化学习是近来 AI 领域最热门的话题之一,新算法也在不断涌现。那么,问题来了:AI 能不能自己发现强大的强化学习算法呢?近日,谷歌 DeepMind 团队在 Nature ...
材料科学正迎来 AI 驱动的范式革命。从谷歌 GNoME 到微软 MatterGen,全球科技巨头都在加速布局这个万亿美元级赛道。传统材料研发动辄 10-20 年的周期,已成为制约产业创新的最大瓶颈。鼎犀智创团队兼具材料科学底蕴和 AI 技术实力的 " 双核 " 优势,其构建的 " 设计 - 模拟 - 制备 - 表征 "AI ...