美股震撼、科技巨头恐慌,95后成群的DeepSeek如何就一夜“破圈”?
2025-01-28 06:38 红星新闻
去年12月26日,DeepSeek发布的V3模型就初露锋芒,以大约Open AI二十分之一的训练成本获得了比肩世界顶级性能的大模型。紧接着在今年1月20日,DeepSeek再度发布R1模型。美国加州的Scale AI公司致力于测评各种AI模型的实际性能,其创始人亚历山大·王在接受采访时表示:“老实说,我觉得DeepSeek在很多项指标上都达到了美国最先进模型的水平”。
除了性能优异,DeepSeek作为一个开源模型,对终端用户始终免费开放,而它对于开发者调用API的收费定价水平几乎为Open AI的百分之一。此前DeepSeek曾公开回应“价格战”的指控,表示在这样的定价之下自己仍有合理的利润结构。低廉的价格来源于该公司在软件算法层面的创新,改变了美国科技巨头们囤积GPU显卡“堆算力”的惯性思维。据悉R1的训练只调用了2000余块显卡,为期53天,总的训练成本仅为558万美元,不到其他世界顶级大模型一次训练成本的十分之一。
这样的极致性价比,让在AI热潮下被炒高了两年的美国科技股感到巨大的“寒意”。豪尔格·查皮兹25日写道:“这家中国公司以极端低廉的成本,在缺少最顶尖芯片供应的情况下打造出一个震动世界的模型,这是对美股泡沫构成的最大威胁。”美国经济学家亚德尼表示,“DeepSeek的成功可能会给美股财报季带来压力,尤其是在谷歌、Meta和微软等公司加大AI资本投入的情况下。尤其是微软,它是OpenAI的最大投资者。”