此前,业界对AI 能力的评价往往基于“会不会做题”,比如能不能在高考试题上击败人类考生、在奥数竞赛中斩获几块金牌,又或者写出的代码够不够格通过互联网大厂的笔试…… 但在这些看似“人类一败涂地,AI大获全胜”的测试背后,科学界一直存在一种冷静甚至审慎的看法:AI 确实很会“做题”,但它能解决那些人类尚未解决的“真问题”吗?毕竟,背诵教科书是一回事,拓展人类知识的边界则是完全不同的另一回事。 许多科学 ...
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!阿里刚刚开源了极强的小型 MoE 代码模型 Qwen3-Coder-Next。Qwen3-Coder-Next 以 800 亿总参数量和仅 30 ...