AI领域近期因DeepSeek推出的新型小模型引发广泛关注。这款仅含30亿参数的DeepSeek-OCR模型,虽然参数规模远小于主流大模型,却在信息处理效率上展现出突破性成果。研究团队通过实验证明,AI在处理文档信息时,采用视觉理解方式比传统文本处理 ...
【新智元导读】DeepSeek在港大「AI-Trader」项目中以9.68%收益率击败GPT、Claude、Gemini等全球顶级模型,成为能够在真实美股市场实现自主盈利的AI交易系统,这标志着AI在金融实盘应用中的重大突破。
朋友们告诉我,OCR 是 DeepSeek 团队近半年最重要的研究方向之一,他们在这上面花了很多心血。 好像这两天大家都在集中讨论 DeepSeek 提出来的上下文光学压缩的新思路,很少有人测评 DeepSeek-OCR 的真实表现。
DeepSeek推出革命性OCR模型,用“一图胜千言”的巧妙思路解决AI处理长文档的算力难题。这个仅30亿参数的小模型,通过把文字压缩成图片的方式大幅提升处理效率。其单块显卡日生成20万页训练数据的高效能力,获卡帕西等专家称赞并被比作“AI的JPEG ...
DeepSeek 入选全球十大工程成就,本质上是中国 AI 从 “技术跟跑” 向 “生态领跑” 转变的缩影。与南水北调等重大工程不同,它的价值不在于物理基建的延伸,而在于通过开源模式构建了全球共享的技术基础设施 —— 这种 ...
接下来登场的是 DeepSeek-3B-MoE 解码器,这是一个 3 亿激活参数规模的稀疏专家模型(总参数 3B,但每次只激活部分专家)。它就像图中的“大脑”,负责把 DeepEncoder 输出的视觉 token 序列翻译回文本。MoE ...
最近,开源工具Datasette创建者、Django 框架联合创始人 Simon Willison 做了一个疯狂实验:他让 Claude Code 全权接管,把 DeepSeek-OCR 在 NVIDIA Spark 上跑了起来。听起来像是“让 AI ...
【TechWeb】10月24日消息,DeepSeek在10月20日发布的3B参数开源OCR模型,迅速在AI领域获得了广泛关注和讨论。DeepSeek-OCR模型创新性地提出“上下文光学压缩”技术,将长文本转换为图像进行高效压缩处理,大幅降低大模型输入 ...
这场由初创公司Nof1发起的“Alpha Arena”基准测试,并非模拟交易。主办方为了衡量AI投资能力,给每个模型账户发放了一万美元的启动资金,让它们在真实市场自主交易数字货币。Alpha ...
这是周杰伦最近遇上的麻烦。魔术师好友蔡威泽帮他代持比特币账户, 结果一年前就声称账号被锁, 至今人间蒸发, 钱也没了影。 直到前几天,终于忍不住的周董直接在社交媒体上公开寻人, 放话说「再不出现你就完了」,并随后取关了蔡威泽。
光学字符识别(OCR)是计算机视觉最古老也最实用的任务之一。早期OCR只负责“识别文字”;而如今,随着视觉语言模型(VLM)的兴起,它已经变成能“理解文档”的智能系统。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈