deepseek - 搜索 News

3 小时

AI量化交易：DeepSeek狂赚36%引爆讨论，普通人如何应对？

近日，备受瞩目的AlphaArena测试在加密货币市场掀起波澜，引发了关于 AI量化交易能力的热烈讨论。这场测试将多个顶尖 AI模型置于真实市场环境中，进行实盘交易，并实时公开收益与策略，为我们揭示了 AI 在交易领域的真实表现。测试结果令人瞩目。来自国内的 DeepSeek ...

1 天

AI杀入美股，DeepSeek又是第一！港大90后开源，AI股神人人都能造

【新智元导读】DeepSeek在港大「AI-Trader」项目中以9.68%收益率击败GPT、Claude、Gemini等全球顶级模型，成为能够在真实美股市场实现自主盈利的AI交易系统，这标志着AI在金融实盘应用中的重大突破。

中华网新闻频道

DeepSeek新突破能否打破大模型瓶颈光学压缩引领变革

在当今的AI领域，大语言模型（LLM）已成为研究和应用的焦点，展现出强大的语言理解和生成能力，广泛应用于智能聊天、文本创作、知识问答等诸多场景。然而，随着应用的深入，处理长文本时遇到的算力困境日益凸显，成为阻碍其进一步发展的关键瓶颈。主流的Transformer架构在处理长文本时，自注意力机制的计算复杂度与输入序列长度呈二次方关系，导致计算量和内存需求随文本长度急剧增加。例如，处理一篇包含数千个 ...

2 天

自媒体误读了 DeepSeek-OCR：一图胜千言

接下来登场的是 DeepSeek-3B-MoE 解码器，这是一个 3 亿激活参数规模的稀疏专家模型（总参数 3B，但每次只激活部分专家）。它就像图中的“大脑”，负责把 DeepEncoder 输出的视觉 token 序列翻译回文本。MoE ...

在NAS上利用OpenWebUI+Ollama部署DeepSeek、通义千问等AI大模型

一、前言一直想尝试在NAS上部署AI大语言模型，可无奈之前NAS设备的硬件配置比较落后，运行最低参数的模型也比较吃力。不久前，我升级了家里的主力NAS，换上了威联通新品NAS——威联通Qu405，硬件配置有了质的提升，能支撑流畅运行文本系列大模型，而 ...

DeepSeek 和百度，把 OCR 推到了新水准

朋友们告诉我，OCR 是 DeepSeek 团队近半年最重要的研究方向之一，他们在这上面花了很多心血。好像这两天大家都在集中讨论 DeepSeek 提出来的上下文光学压缩的新思路，很少有人测评 DeepSeek-OCR 的真实表现。

3 天

DeepSeek来了！非洲用上“白菜价”大模型

DeepSeek来了！非洲用上“白菜价”大模型,deepseek,机器人,人工智能,应用程序,非洲,东非 ...

ZAKER on MSN

AI 又进化了，DeepSeek 再推 “ 王炸 ” 新功能

最近 AI 圈又出新花活儿了，DeepSeek 团队悄咪咪地开源了一个 30 亿参数的小模型，名叫DeepSeek-OCR。别看体量不大，想法可是够炸的：他们居然打算让 AI用看图的方式去读文本。

3 天

DeepSeek-OCR：大模型技术，正站在一个新的十字路口

DeepSeek-OCR证明了视觉标记的可行性，但纯视觉基础模型的训练仍是谜题。传统大模型靠“预测下一词”这个清晰目标成功，而图像文字的预测目标模糊不清——预测下一个图像片段？评估太难；转为文本，又回到了老路。

6 天

DeepSeek开源新模型！单张A100日处理可超20万页数据

DeepSeek ...

5 天

谁家AI用一万美元赚翻了？DeepSeek第一，GPT 5垫底

海内外AI投资大战打响，胜负未定。这几天，各大AI社群被一场“投资直播”刷屏。网友们实时追踪六大AI模型的交易表现，讨论的热情程度甚至超过研究自己炒股，这是一场用真金白银进行的AI投资对决。这场由初创公司Nof1发起的“Alpha ...

4 天

DeepSeek昨天开源的新模型，有点邪门

实际上 DeepSeek 也是这么想的，在论文里还特意提了一嘴，说这个新模型在一张 A100 上，一天可以给大模型采集出 20 万页以上的训练数据。而随着时间的推移，这件事的重要性也会逐渐降低，存储它的格式也会从*的 Gundam 一路降级，从 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果