Flash API - 搜索 News

Step 3.5 Flash 限免实测：5 个应用跑通，免费也能当通用 Agent 底座

最近Openrouter上出现了一匹黑马，就是阶跃的Step 3.5 Flash，各方评价都是好用，且非常适配各种agent，尤其是大火的openclaw，看了下技术参数，是一个轻量化的模型，特意在agent上进行了强化，看了下openrouter上的表现，低延迟和高吞吐，的确很符合Agent的调性。我看了下使用量前五的应用，里面有3个编程的，分别是Roo ...

新浪网

智谱将开源GLM-4.7-Flash，API免费调用

新浪科技讯 1月20日上午消息，智谱GLM-4.7-Flash将于今日发布并开源。GLM-4.7-Flash是一个混合思考模型，总参数量为30B，激活参数量为3B，作为同级别SOTA模型，为轻量化部署提供了一个兼顾性能与效率的选择。据悉，GLM-4.7-Flash将替代GLM-4.5-Flash，在智谱开放平台 ...

16 天

美团发布 LongCat-Flash-Lite 轻量化 MoE 模型，智能体与代码表现突出

IT之家 2 月 6 日消息，美团今日（2 月 6 日）发布 LongCat-Flash-Lite 模型，这是一款拥有 685 亿参数，每次推理仅激活 29 亿 ~45 亿参数的轻量化 MoE 模型。

来自MSN

小米XiaomiMiMo-V2-Flash：309B模型开源，API限时免费

MiMo - V2 - Flash的API定价为输入0.7元/百万tokens，输出2.1元/百万tokens。小米称，模型权重和推理代码已全面开源，API限时免费，体验WebDemo已上线。本文由 AI 算法生成，仅作参考，不涉投资建议，使用风险自担 ...

腾讯网

美团发布 LongCat-Flash-Lite 轻量化 MoE 模型

IT之家 2 月 6 日消息，美团今日（2 月 6 日）发布 LongCat-Flash-Lite 模型，这是一款拥有 685 亿参数，每次推理仅激活 29 亿 ~45 亿参数的轻量化 MoE 模型。通过将超过 300 亿参数用于嵌入层，LongCat-Flash-Lite 宣称不仅超越了参数量等效的 MoE ...

来自MSN

谷歌 Gemini 2.5 API 推“隐式缓存”，开发者成本最高降低 75%

IT之家 5 月 10 日消息，科技媒体 WinBuzzer 昨日（5 月 9 日）发布博文，报道称谷歌为其 Gemini 2.5 API，推出了“隐式缓存”（Implicit Caching）功能，自动识别并重用 API 请求中的常见前缀，开发者的成本最高可以降低 75%。该功能适用于 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果