【新智元导读】DeepSeek在港大「AI-Trader」项目中以9.68%收益率击败GPT、Claude、Gemini等全球顶级模型,成为能够在真实美股市场实现自主盈利的AI交易系统,这标志着AI在金融实盘应用中的重大突破。
当全球AI巨头还在为算力军备竞赛耗尽资源时,中国AI团队用“大道至简”改写行业规则——DeepSeek开源的DeepSeek-OCR模型,仅凭3B参数便实现实现了“10 ...
【TechWeb】10月24日消息,DeepSeek在10月20日发布的3B参数开源OCR模型,迅速在AI领域获得了广泛关注和讨论。DeepSeek-OCR模型创新性地提出“上下文光学压缩”技术,将长文本转换为图像进行高效压缩处理,大幅降低大模型输入 ...
接下来登场的是 DeepSeek-3B-MoE 解码器,这是一个 3 亿激活参数规模的稀疏专家模型(总参数 3B,但每次只激活部分专家)。它就像图中的“大脑”,负责把 DeepEncoder 输出的视觉 token 序列翻译回文本。MoE ...
朋友们告诉我,OCR 是 DeepSeek 团队近半年最重要的研究方向之一,他们在这上面花了很多心血。 好像这两天大家都在集中讨论 DeepSeek 提出来的上下文光学压缩的新思路,很少有人测评 DeepSeek-OCR 的真实表现。
最近 AI 圈又出新花活儿了,DeepSeek 团队悄咪咪地开源了一个 30 亿参数的小模型,名叫DeepSeek-OCR。 别看体量不大,想法可是够炸的:他们居然打算让 AI用看图的方式去读文本。
DeepSeek来了!非洲用上“白菜价”大模型,deepseek,机器人,人工智能,应用程序,非洲,东非 ...
海内外AI投资大战打响,胜负未定。 这几天,各大AI社群被一场“投资直播”刷屏。网友们实时追踪六大AI模型的交易表现,讨论的热情程度甚至超过研究自己炒股,这是一场用真金白银进行的AI投资对决。 这场由初创公司Nof1发起的“Alpha ...
实际上 DeepSeek 也是这么想的,在论文里还特意提了一嘴,说这个新模型在一张 A100 上,一天可以给大模型采集出 20 万页以上的训练数据。 而随着时间的推移,这件事的重要性也会逐渐降低,存储它的格式也会从*的 Gundam 一路降级,从 ...
最近,开源工具Datasette创建者、Django 框架联合创始人 Simon Willison 做了一个疯狂实验:他让 Claude Code 全权接管,把 DeepSeek-OCR 在 NVIDIA Spark 上跑了起来。听起来像是“让 AI ...
然而,最近两个月,这家火爆2025的AI独角兽,在C端用户规模上遭遇了头号竞争对手——豆包的反超。根据QuestMobile此前披露的数据,中国消费级AI助手的榜首在近期易位,8月数据显示,“豆包”月活(MAU)约为1.57亿,环比增长6.6%,反超 ...