GAIA测试非常权威。它是由数个来自Meta、HuggingFace和AutoGPT的大佬共同完成,模拟了真实世界的复杂问题,要求AI展现推理、多模态处理、网页浏览和工具使用等多维能力。之前,GPT-4+工具调用在这个测试中仅获得了15%的成绩。
几乎在昨晚苹果发布新品的同时,整个科技圈却被一个名为 Manus 的产品刷屏了。 这是全球首款真正意义上的通用 AI Agent,从官网展示的案例可以看到,它能够独立思考、规划并执行复杂任务,直接交付完整成果。