DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注,其日活用户数在短时间内突破2000万,成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业,外部算力(主要是GPU)限制逐渐成为制约其进一步发展的瓶颈,如今他们正致力于通过优 ...
根据DeepSeek 研究人员的测试数据显示,在执行基于DeepSeek模型的推理任务中,昇腾910C性能可达到英伟达H100的60%。
这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。 假如它之后使用国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达GPU硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。
快科技2月5日消息,华为(昇腾+CANN)+Deepseek,能解决英伟达GPU+CUDA的“卡脖子”吗? 据tomshardware等多家媒体报道,华为最新的AI处理器昇腾910C(Ascend 910C)的推理性能已达NVIDIA H100 ...
河北省文物与古建筑保护研究院原副院长孙荣芬是九层神庙修复项目团队的重要成员。在长达八年的时间里,她和同事们在尼泊尔坚守,不辞辛劳,与尼泊尔同行密切合作,圆满完成了这项充满挑战、意义重大的任务。在尼工作生活期间,有一件小事在她记忆中尤其深刻。
这个内容已经在X上讨论过了, 很火热的问题 我先翻译一下国外教授的详细回答,再讲清楚CUDA、PTX的关系。 中文翻译: 人们说“Deepseek 使用了 PTX,它打破了 CUDA 的护城河!”从根本上误解了这里发生的事情,以及 CUDA ...
1月13日,信创市场龙头海光信息披露2024年年度业绩预告,预计全年实现营业收入87.2亿元到95.3亿元,同比增长45.04%到58.52%。预计实现归属于母公司所有者的净利润18.1亿元到20.1亿元,同比增长43.29%到59.12%。公司营收和净利润中值涨幅皆超过50%。