今日特推: 关于抛头露面为什么上热搜?
搜索:
您的位置: 主页 > 国家建造师 > » 正文

花智曲喜真的还是假的?

浏览: 1365 次 来源:网友供稿

  然而,在海外社交媒体,乃至于华尔街上, DeepSeek-R1 的热度竟然才刚刚开始螺旋式上升。

  1月24日,在国外大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。

  就在 Arena 放榜之后,全球关于 DeepSeek 的讨论再次升级。惊叹,溢美,甚至阴谋论都层出不穷。与此同时,美股市场 AI经济的狂欢,也开始在 DeepSeek 的影响下颤动。

  就在 DeepSeek-R1 获得风格控制类模型得分第一之后,鲜有发声的图灵奖得主,Meta AI 首席科学家 Yann LeCun 24日在社交媒体上表示:“当人们看到 DeepSeek 的表现,惊呼‘中国AI正在赶超美国’,但这种解读有误。更准确的结论是:开源模型正在超越闭源系统。DeepSeek的成功得益于开放生态,其创新基于前人成果的持续迭代。

  DeepSeek-R1 的发布,宛如一颗沉重的石子打入AI行业与AI投资的湖水之中,甚至开始令越来越多人警觉 AI 投资可能存在的泡沫。

  美股大V “THE SHORT BEAR”在社交媒体上表示,DeepSeek 创造了一个 AI 巨头们的痛苦时刻,而投资者必须对此敲响警钟。

  “如果击败 OpenAI 所需要的金额是 5500万美元(包括5000个 H800 GPU和500万预训练费用),那么这个行业的商业化会比很多人预想的要快很多。”

  该博客还指出:“根据红杉,美国AI公司每年必须产生约6000亿美元收入来支付其AI硬件费用。如果不跟进(投资支出)就会被淘汰,那么大额资本支出以保持竞争力就是必要的——但现在看来,这种冒险行为变得越来越无利可图。”

  海外知名财经博客 Zerohedge 24日撰文,称 DeepSeek 的出现和其廉价的训练成本,正在对美国此前宣布的5000亿美元AI基建计划形成巨大的打击。

  1月24日,英伟达股价大跌3.12%,报142.62美元/股,创下公司在年初 CES 展产品不及预期表现后的最大跌幅。

  DeepSeek 火到什么程度?海外社交媒体已经对其进行“花式赞美”,称其不仅成本便宜,甚至只不过是一家对冲基金(幻方量化)的副产品。

  当然,人红是非多——一个侧写来自于关于DeepSeek阴谋论的不断出现:一部分北美AI从业者普遍不相信 DeepSeek 的预训练费用只有区区不到 550 万美元。

  一个极端例子是 AI 科技初创公司 Scale AI 创始人 Alexandr Wang——其在2025年达沃斯论坛上接受采访时,在未经任何证实的情况下声称 DeepSeek 囤有五万张英伟达 H100 GPU,但因为芯片禁运并未对外公布。

  也有AI行业人士怀疑,DeepSeek可能存在过度拟合基准测试,在实际使用中可能会表现不佳。

  “让硅谷的AI模型创业者相信这些数字是不现实的,许多人一年的工资都比 DeepSeek 的训练费用高。”有人对此评论道。

  好在,DeepSeek 选择了最为开放的 MIT 标准作为开源协议。训练成本是否真的如此之低,有待公论。

  近期,一则来自 Meta 匿名员工的消息称,Meta 内部近日启动了一项通过 DeepSeek 开源论文复现其大模型的工作,试图挖掘其是否真的只需要极低的预训练成本。

关键词:

关于我们 - 友情链接 - 广告合作 - 网站留言 - 联系我们 -