华尔街见闻 on MSN
Kimi K2.5持续霸榜Openrouter,大幅度领先Gemini 3
据全球知名大模型聚合平台OpenRouter数据,国产开源大模型Kimi K2.5发布近两周后,在OpenRouter一周总榜、编程项目榜、工具调用榜、Python项目榜及OpenClaw调用榜等多个榜单中持续排名第一。特别在最能反映模型使用量的一周总榜中,以1.16万亿token,超过Gemini 3 Flash Preview和Claude Sonnet4.5两个闭源模型,成为最受欢迎的大模型 ...
作者 | Daniel Dominguez译者 | 田橙Vercel 最近发布了开源项目 Skills.sh,想要给 AI 智能体(Agents)配上一套“标准动作库”。简单来说,它让智能体能通过命令行执行各种可复用的操作,也就是所谓的“技能”(Skills)。Vercel 将其定义为一个 ...
厉害了,安徽国资在新能源领域又出手了,这次是豪掷近72亿元,投资新能源上游材料。2月8日,据多家媒体报道,杉杉股份晚间发布公告,杉杉集团及其全资子公司宁波朋泽贸易有限公司(简称“朋泽贸易”)、管理人与重整投资人皖维集团、宁波金资已于2026年2月6日签署了《重整投资协若重整成功,杉杉股份的控股股东将变更为皖维集团,实际控制人将变更为安徽省人民政府国有资产监督管理委员会 (下称安徽省国资委)。
AI表格更应该交由Agent使用,由AI最后交付结果,供人类审核。 文|邓咏仪 编辑|苏建勋 一句话介绍 Univer将电子表格从复杂低效的工具转化为AI原生的通用计算引擎,实现路径完全依靠自研的电子表格SDK(软件开发工具包)。 融资进展 ...
英国纯电动市场表现很尴尬,销量为2.97 万辆,同比增长+0.1%,几乎没动,市占率:20.6%,不升反降,而且是 2025 年 3 月以来最低。英国消费者对纯电动车明显没那么积极了。
至顶头条 on MSN
逻辑与搜索分离如何提升AI智能体可扩展性
将逻辑与推理分离可通过解耦核心工作流程与执行策略来提升AI代理可扩展性。研究人员提出概率天使非确定性编程模型和ENCOMPASS框架,允许开发者编写代理的主要工作流程,同时将推理策略委托给独立的运行时引擎。这种关注点分离方法可减少技术债务并改善自动化任务性能,为企业级代理工作流程扩展提供新的架构标准。
一直以来,神经网络的 激活函数 就像是 AI 引擎中的火花塞。从早期的 Sigmoid、Tanh,到后来统治业界的 ReLU,再到近年来的 GELU 和 ...
日前,数据巨头Snowflake宣布计划斥资高达2亿美元与OpenAI合作,将其模型和聊天机器人引入数据库供应商的沙盒及工具集,Cortex AI和Snowflake Intelligence等功能将获得Altman团队的强力支持。
《人工智能与Python程序设计》《人工智能原理》《AI大模型全场景实战课》成为播放量最高的人工智能公开课。2025年,抖音发布“AI时代前沿学科共建计划”,该项目重点聚焦计算机专业,联合清华大学、北京大学、南京大学等十余所高校,共发布国家一流计算机 ...
在知识工作能力的评测GDPval-AA 上,Opus 4.6比OpenAI的GPT-5.2高出约144Elo分,比自己的前代Opus 4.5高出190分。这个测试涵盖了金融、法律等领域的实际工作任务,比如制作财务分析报告、起草法律文件、做市场调研等。
若是采用传统方法,就需要人工编写风格文档,但这样做很容易遗漏细节。其实,现代AI相关论文的视觉规范就隐藏在大量的公开出版论文中。因此,PaperBanana让设计师遍历整个参考图库,自动归纳出一份涵盖配色方案、箭头样式、字体层级、图标风格的“美学指南 ...
科研人的深夜噩梦,终于有人来终结了!刚刚,北大联合Google CloudAI发布PaperBanana,直接把论文配图变成了全自动流水线。5个智能体组团干活,生成的架构图对标NeurIPS顶会标准。以后写论文,你只管敲字,画图这事儿,AI包了。 你有没有过这样的经历:论文写好了,但架构图却让你焦头烂额。 不是配色太土,就是线歪了,要么就是模块大小不协调,简直比写论文还要难。 别担心,有这样焦虑的 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果