今天真是国产大模型打架的一天!昨晚千问上新模型,今天 DeepSeek 开源 OCR 2。 中午,Kimi 也开卷,网站、App、API 开放平台和编程助手产品 Kimi Code 模型版本全面更新,Kimi K2.5 来了。 月之暗面创始人杨植麟还首次出镜,向大家分享了新模型的能力。 Kimi K2.5 是一个拥有 1 万亿参数(1 trillion)的 MoE 基础模型。相较前代,K2.5 的 ...
所以昨晚大半夜看到阿里 Qwen3-Max-Thinking 更新,说“会想能干,比强更强”,而且思考模式大变,忍不住起来第一时间测了一下.. 官方给到的数据很猛:总参数量超 1T,预训练数据量 36T tokens,并强调它在 19 ...
本文介绍了如何构建可靠、可观测且成本可控的智能体AI系统。文章提供了一个实用的生产级部署蓝图,包含基于LangChain/LangGraph的推理循环、RAG向量搜索和重排序、模式验证等护栏机制、令牌计量和追踪、异步执行和超时控制,以及可容器化部署的FastAPI接口。涵盖了从推理循环、RAG到护栏、遥测和成本控制的完整生产工作流。