最近Openrouter上出现了一匹黑马,就是阶跃的Step 3.5 Flash,各方评价都是好用,且非常适配各种agent,尤其是大火的openclaw,看了下技术参数,是一个轻量化的模型,特意在agent上进行了强化,看了下openrouter上的表现,低延迟和高吞吐,的确很符合Agent的调性。我看了下使用量前五的应用,里面有3个编程的,分别是Roo ...
新浪科技讯 1月20日上午消息,智谱GLM-4.7-Flash将于今日发布并开源。GLM-4.7-Flash是一个混合思考模型,总参数量为30B,激活参数量为3B,作为同级别SOTA模型,为轻量化部署提供了一个兼顾性能与效率的选择。 据悉,GLM-4.7-Flash将替代GLM-4.5-Flash,在智谱开放平台 ...
IT之家 2 月 6 日消息,美团今日(2 月 6 日)发布 LongCat-Flash-Lite 模型,这是一款拥有 685 亿参数, 每次推理仅激活 29 亿 ~45 亿参数的轻量化 MoE 模型 。
MiMo - V2 - Flash的API定价为输入0.7元/百万tokens,输出2.1元/百万tokens。 小米称,模型权重和推理代码已全面开源,API限时免费,体验WebDemo已上线。 本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担 ...
IT之家 2 月 6 日消息,美团今日(2 月 6 日)发布 LongCat-Flash-Lite 模型,这是一款拥有 685 亿参数,每次推理仅激活 29 亿 ~45 亿参数的轻量化 MoE 模型。通过将超过 300 亿参数用于嵌入层,LongCat-Flash-Lite 宣称不仅超越了参数量等效的 MoE ...
IT之家 5 月 10 日消息,科技媒体 WinBuzzer 昨日(5 月 9 日)发布博文,报道称谷歌为其 Gemini 2.5 API,推出了“隐式缓存”(Implicit Caching)功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低 75%。 该功能适用于 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果