Python GPU - 搜索 News

什么值得买社区频道 on MSN

第三弹！听听博主讲NVIDIA DGX Spark好评还是差评？

以下是各位博主对 NVIDIA DGX Spark (GB10) 的实测性能数据和关键比较的整理： DGX Spark 的核心优势在于其 128 GB 的 LPDDR5X 统一内存，使其能够加载和运行比大多数高端消费级 GPU 更大的模型，例如需要 ...

2 天

2025年9月30日, 腾讯AI开源项目Angel正式发布3.3.0版本。Angel 是腾讯研发并开源的面向企业级应用的高性能分布式机器学习平台,功能特性涵盖了特征工程、模型构建、参数训练、AutoML、模型服务Serving等全栈机器学习 ...

4 天on MSN

项目基于Rust语言开发，代码总量约8000行，涵盖了从分词器训练到模型预训练、中期训练、监督微调及强化学习的完整流程。用户只需启动云GPU服务器，运行脚本，最快4小时即可在网页界面与训练的大模型对话。开发过程中，卡帕西摒弃了Hugging ...

4 天on MSN

该项目以"极简主义"和"全流程整合"为核心特色，将构建类ChatGPT模型所需的完整技术链浓缩在8300行代码中。从数据预处理、模型预训练、微调优化，到最终的Web交互界面部署，所有环节均实现无缝衔接。开发者仅需配备云端GPU服务器，运行单一脚本即可 ...

4 天

智东西10月14日消息，昨夜，前特斯拉人工智能与自动驾驶视觉总监、OpenAI研究员安德烈·卡帕西（Andrej Karpathy）开源 nanochat，号称可以只用不到 100美元 ...

4 天

需要注意的是，由于目前对强化学习（RL）的支持还不太完善，在计算总耗时时把它排除了。到监督微调（SFT）阶段为止，整个过程运行了3小时51分钟，总成本为（3+51/60）×24=92.4美元（如果加上强化学习，现在总时间会更接近5小时）。

5 天

快科技10月13日消息，当汽车遇上电脑，会碰撞出怎样的火花？NVIDIA在最新一期的GeForce Garage节目中给出了令人惊叹的答案。他们与改装大师JCustom（Justin Chu）合作，将一台完整的RTX 5080游 ...

在2025年国庆节前夕，当人们的注意力逐渐转向假期时，中国的人工智能领域却迎来了一场“秋收”的喜悦。AI独角兽企业深度求索DeepSeek正式推出了其最新的实验性大模型—— DeepSeek-V3.2-Exp。

面对各地的“引才大战”，湖南举全省之力，组织511家企事业单位、带着近1.8万个岗位来到黄浦江畔，试图回答一个关键命题：如何应对发达地区强势的“人才虹吸”，让年轻人愿意将目光投向湖南这一中部省份？

13 天on MSN

人工智能研究领域迎来新突破，Thinking Machines Lab正式推出首款产品Tinker，这款工具将语言模型微调的复杂度大幅降低，让研究人员能够像修改Python代码一样轻松调整模型参数。

14 天

知名数学家陶哲轩近日在数学研究领域完成了一项突破性实践——他借助ChatGPT的协助，成功攻克了MathOverflow平台上的一道复杂难题。这一成果不仅验证了人工智能在数学研究中的实用性，更展现了人机协作在科研领域的创新可能。

一些您可能无法访问的结果已被隐去。