开云官网登录入口 开云app官网入口-开yun体育网Llama 3 405B使用了3080万GPU小时-开云官网登录入口 开云app官网入口

开yun体育网Llama 3 405B使用了3080万GPU小时-开云官网登录入口 开云app官网入口

发布日期:2025-07-26 11:02  点击次数:177

专题:DeepSeek为何能升沉人人AI圈

  【#DeepSeek正冲突算力为王行业持法#】#AI算力股下挫# 中国AI大模子DeepSeek得胜出圈让行业产生了关于大限度AI算力投资逻辑的怀疑。

  算作当今人人AI大模子的领头羊OpenAI提倡Scaling Law,即野心限度越大,检会数据量越多,模子越智能。Scaling Law则成为了人人AI大模子厂商所信奉的尺度。这促使英伟达等算力束缚研发领有愈加宏大算力的家具,微软等云厂商束缚加大对AI算力的本钱参预。

  近期,微软CEO萨蒂亚·纳德拉(Satya Nadella)示意,微软将在2025年参预800亿好意思元建树AI智算中心,以赈济AI大模子的设备和干系办事。现任好意思国总统特朗普也公布了“星际之门”筹画,旨在改日4年内参预5000亿好意思元,在好意思国建树AI基础措施。

  但是,近期中国AI大模子DeepSeek却让行业看到了不同的发展旅途。DeepSeek是国内大模子公司深度求索设备,深度求索的母公司是一家名为量化幻方的量化金融公司,在2024年12月推出的DeepSeek-V3,并于近期公布了DeepSeek-R1。

  据了解,DeepSeek-V3完好检会只需2.788M H800 GPU小时,其检会成本仅为557万好意思元,却取得了比好意思OpenAI的开端进模子GPT-4o的性能。那时知名东说念主工智能科学家卡帕西(Andrej Karpathy)就发文示意,这个模子是在一个相等有限的预算下检会的(2048个GPU开端2个月,滥用600万好意思元)。 算作参考,这种级别的才气持续需要接近16000个GPU的集群,而今天正在启动的集群则更接近100000个GPU。举例,Llama 3 405B使用了3080万GPU小时,而DeepSeek-V3看起来仅使用了280万GPU小时。

  此外,DeepSeek-R1的检会成本还未公布。不外,从API订价可看出,订价是GPT o1的三十分之一。按照每输出一百万Token的价钱来看,DeepSeek-R1为2.19好意思元,而GPT-o1为60好意思元。不错说,DeepSeek使用Open AI的一小部分的检会成本,却达到了和Open访佛的性能。据了解,R1在数学、编程等测试中的获利和o1尽头。

  这也激发了一种怀疑,要杀青更好性能的AI大模子是否需要堆算力,堆投资才能达到?通过软件架构及算法的改良,可能亦然一条通往更高性能AI大模子的念念路。

  关于DeepSeek的火爆是否意味着利空AI算力,韦豪创芯结伴东说念主王智告诉第一财经记者:“短期内,在往复厚谊的影响下,这起事件会利空AI算力。恒久来看,AI算力仍然必不成少,AI大模子的演进,需要更多新的架构和算法,才能杀青长足向上,这些需要AI算力的实足赈济。”他补充说念:“这些算法和架构还不知所以,但是势必会出现。”

海量资讯、精确解读,尽在新浪财经APP

包袱剪辑:凌辰 开yun体育网



相关资讯
热点资讯
  • 友情链接:

Powered by 开云官网登录入口 开云app官网入口 @2013-2022 RSS地图 HTML地图

Powered by365建站