智东西(公众号:zhidxcom)作者 | 李水青编辑 | 心缘智东西10月16日报道,昨日晚间,基于苹果全新M5芯片的14英寸MacBook Pro终于来了,一同发布的还有搭载M5芯片的平板产品iPad Pro和空间计算设备苹果Vision Pro ...
什么值得买社区频道 on MSN

第三弹!听听博主讲NVIDIA DGX Spark好评还是差评?

以下是各位博主对 NVIDIA DGX Spark (GB10) 的实测性能数据和关键比较的整理: DGX Spark 的核心优势在于其 128 GB 的 LPDDR5X 统一内存,使其能够加载和运行比大多数高端消费级 GPU 更大的模型,例如需要 ...
项目基于Rust语言开发,代码总量约8000行,涵盖了从分词器训练到模型预训练、中期训练、监督微调及强化学习的完整流程。用户只需启动云GPU服务器,运行脚本,最快4小时即可在网页界面与训练的大模型对话。 开发过程中,卡帕西摒弃了Hugging ...
该项目以"极简主义"和"全流程整合"为核心特色,将构建类ChatGPT模型所需的完整技术链浓缩在8300行代码中。从数据预处理、模型预训练、微调优化,到最终的Web交互界面部署,所有环节均实现无缝衔接。开发者仅需配备云端GPU服务器,运行单一脚本即可 ...
智东西10月14日消息,昨夜,前特斯拉人工智能与自动驾驶视觉总监、OpenAI研究员安德烈·卡帕西(Andrej Karpathy)开源 nanochat, 号称可以只用不到 100美元 ...
需要注意的是,由于目前对强化学习(RL)的支持还不太完善,在计算总耗时时把它排除了。到监督微调(SFT)阶段为止,整个过程运行了3小时51分钟, 总成本为(3+51/60)×24=92.4美元 (如果加上强化学习,现在总时间会更接近5小时)。
快科技10月13日消息,当汽车遇上电脑,会碰撞出怎样的火花?NVIDIA在最新一期的GeForce Garage节目中给出了令人惊叹的答案。他们与改装大师JCustom(Justin Chu)合作,将一台完整的RTX 5080游 ...
作为 “买买买”狂魔,高通最近也收购了 Edge Impulse 和 Foundries.io ,旨在提供涵盖硬件、软件和云服务的全栈边缘平台。有人猜测,高通瞄准 Arduino 是要重点布局机器人和物联网了, Arduino ...
在2025年国庆节前夕,当人们的注意力逐渐转向假期时,中国的人工智能领域却迎来了一场“秋收”的喜悦。AI独角兽企业深度求索DeepSeek正式推出了其最新的实验性大模型—— DeepSeek-V3.2-Exp。
面对各地的“引才大战”,湖南举全省之力,组织511家企事业单位、带着近1.8万个岗位来到黄浦江畔,试图回答一个关键命题:如何应对发达地区强势的“人才虹吸”,让年轻人愿意将目光投向湖南这一中部省份?
人工智能研究领域迎来新突破,Thinking Machines Lab正式推出首款产品Tinker,这款工具将语言模型微调的复杂度大幅降低,让研究人员能够像修改Python代码一样轻松调整模型参数。