DeepSeek的“修炼”之路，还要闯几关？

　　以小博大、逆袭吊打，曾是修仙爽文、微短剧里让人上头却略显荒诞的剧情，而今，DeepSeek（深度求索）让它在真实世界里发生了。

　　火爆全球超过一个月，DeepSeek掀起的风暴还在持续，随之而来的还有一波三折的戏码，同行的围剿、跨界的争议……正如影视作品中每一位“爽文大女主”升级打怪时所面对的关卡一样。

　　誉满天下，谤亦随之，DeepSeek的“修炼”之路，还要闯几关？

　　“爽文大女主”出三招

　　悄悄推出两款模型，即引发硅谷与华尔街的剧烈震荡，让OpenAI接连推出竞争产品并免费开放搜索，谷歌一股脑儿发布“满血版全家桶”，国内大厂的旗舰模型也开始免费开放。

　　深有“天上掉馅饼”之感的万千普通用户，倒是想给DeepSeek送锦旗了，不过，大家也想知道，凭一己之力就把曾经高不可攀的全球最顶级大模型的价格打下来了，究竟用了什么招？

　　——“乱”拳打伤老师傅。从架构到工程，从算法到部署，DeepSeek悟透的是“四两拨千斤”的中国武术古训，不理会“参数规模决定论”，反倒是秀出了数据质量优化与算法架构创新的乘数效应，在看似不可能的壁垒中突围。

　　——拆掉半壁卫城墙。一般来说，大模型开发者用了英伟达的GPU，也就得用他家的运算平台CUDA搞研发。毕竟CUDA已经封装好一些函数，后来者使用时直接调用接口搞加工就行，这样的低门槛当然方便资源有限的开发者，但是，这也意味着深度研发执行效率的折扣。

12 3 4 下一页