文|量子位热点评论组 当全网还在争论「哪个大模型更强」时,一位刚卖掉公司、躺平三年的德国极客,用一台顶配Mac Mini+开源模型+半夜三点的脑洞,悄悄重构了人与技术的关系。 他没融资,没KPI,没PR团队——只有一句玩笑式的GitHub简介:「告别退休,玩转AI」。 结果呢?Ins上不追科技的素人冲进苹果店抢Mac ...
看下来,我觉得 Kimi 做到了 30% 的复刻效果。别看底部的3D画面不太漂亮,但是它把交互是完全吃透了的,这块如果单独生成更炫酷的3D画面,然后在替换上去,整体效果就会更好了。
昨天,Kimi 重磅发布了 K2.5 ,看到朋友圈和X上一水的好评,第一次感觉国产模型,也能在视觉编程这件事上,跟国际顶尖水平掰掰手腕了。 根据官方介绍,K2.5 是 Kimi 目前最全能的基座模型,最大的特点就是三个关键词:视觉、编程、Agent。
今天真是国产大模型打架的一天!昨晚千问上新模型,今天 DeepSeek 开源 OCR 2。 中午,Kimi 也开卷,网站、App、API 开放平台和编程助手产品 Kimi Code 模型版本全面更新,Kimi K2.5 来了。
英伟达GPU产品供不应求的局面已经持续了两年,即便是OpenAI和Meta这样的大客户,也经常面临交付延迟的问题。通过与谷歌的合作,Anthropic打破了对英伟达生态的单边依赖,获得了谷歌的供应保障。
当价格下降、能力趋同、每个创业公司都能调用同样的API时,什么才能让你的AI产品与众不同?答案就藏在你的业务知识、用户洞察、踩过的坑和积累的经验里——这些无法下载的语境,才是真正的护城河。
AI Agent的能力边界正在被彻底打破。近日,前端开发平台Vercel正式推出Agent Browser——一款专为AI代理设计的浏览器自动化命令行工具(CLI),首次赋予大模型“不仅看得懂网页,还能亲手操作”的能力。这意味着,未来的AI将不再局限于分析与回答,而是能像人类一样点击、填写、提交甚至完成整套在线任务。
在真实工程项目中,不使用 LangChain、LangGraph、CrewAI 等框架,纯用 Python + LLM API 手动实现 AI Agent 不仅完全可行,而且在许多场景下是更优选择。 Anthropic 官方明确建议开发者”从直接使用 LLM API 开始” (当然,各有各的立场),而非框架。Octomind ...