deepseek - 搜索 News

3 天on MSN

DeepSeek-OCR以图载文：30亿参数小模型解锁AI智能记忆与遗忘新路径

AI领域近期因DeepSeek推出的新型小模型引发广泛关注。这款仅含30亿参数的DeepSeek-OCR模型，虽然参数规模远小于主流大模型，却在信息处理效率上展现出突破性成果。研究团队通过实验证明，AI在处理文档信息时，采用视觉理解方式比传统文本处理 ...

12 小时

【新智元导读】DeepSeek在港大「AI-Trader」项目中以9.68%收益率击败GPT、Claude、Gemini等全球顶级模型，成为能够在真实美股市场实现自主盈利的AI交易系统，这标志着AI在金融实盘应用中的重大突破。

朋友们告诉我，OCR 是 DeepSeek 团队近半年最重要的研究方向之一，他们在这上面花了很多心血。好像这两天大家都在集中讨论 DeepSeek 提出来的上下文光学压缩的新思路，很少有人测评 DeepSeek-OCR 的真实表现。

5 天

DeepSeek推出革命性OCR模型，用“一图胜千言”的巧妙思路解决AI处理长文档的算力难题。这个仅30亿参数的小模型，通过把文字压缩成图片的方式大幅提升处理效率。其单块显卡日生成20万页训练数据的高效能力，获卡帕西等专家称赞并被比作“AI的JPEG ...

2 天

DeepSeek 入选全球十大工程成就，本质上是中国 AI 从 “技术跟跑” 向 “生态领跑” 转变的缩影。与南水北调等重大工程不同，它的价值不在于物理基建的延伸，而在于通过开源模式构建了全球共享的技术基础设施 —— 这种 ...

1 天

接下来登场的是 DeepSeek-3B-MoE 解码器，这是一个 3 亿激活参数规模的稀疏专家模型（总参数 3B，但每次只激活部分专家）。它就像图中的“大脑”，负责把 DeepEncoder 输出的视觉 token 序列翻译回文本。MoE ...

2 天

最近，开源工具Datasette创建者、Django 框架联合创始人 Simon Willison 做了一个疯狂实验：他让 Claude Code 全权接管，把 DeepSeek-OCR 在 NVIDIA Spark 上跑了起来。听起来像是“让 AI ...

【TechWeb】10月24日消息，DeepSeek在10月20日发布的3B参数开源OCR模型，迅速在AI领域获得了广泛关注和讨论。DeepSeek-OCR模型创新性地提出“上下文光学压缩”技术，将长文本转换为图像进行高效压缩处理，大幅降低大模型输入 ...

4 天

这场由初创公司Nof1发起的“Alpha Arena”基准测试，并非模拟交易。主办方为了衡量AI投资能力，给每个模型账户发放了一万美元的启动资金，让它们在真实市场自主交易数字货币。Alpha ...

这是周杰伦最近遇上的麻烦。魔术师好友蔡威泽帮他代持比特币账户，结果一年前就声称账号被锁，至今人间蒸发，钱也没了影。直到前几天，终于忍不住的周董直接在社交媒体上公开寻人，放话说「再不出现你就完了」，并随后取关了蔡威泽。

1 天

光学字符识别（OCR）是计算机视觉最古老也最实用的任务之一。早期OCR只负责“识别文字”；而如今，随着视觉语言模型（VLM）的兴起，它已经变成能“理解文档”的智能系统。

一些您可能无法访问的结果已被隐去。