DeepSeek的“修炼”之路，还要闯几关？

　　绕过CUDA，直接基于GPU的驱动函数开发，行不行？DeepSeek给出了肯定的答案。凭借独到软件算法优化，拆掉英伟达“卫城墙”，也就是不必仰赖其CUDA生态行事，DeepSeek走出了一条中国AI技术创新的新路子。

　　——小力也能出奇迹。自从OpenAI的ChatGPT发布以来，微软、谷歌、Meta等科技巨头一直在增加与人工智能相关的算力支出。“军备竞赛”式的投入，也催动了美国AI芯片股价一路攀升。

　　就当行业仍困囿于“算力军备竞赛”的思维定式之际，DeepSeek凭借区区558万美元训练成本就让V3模型达到了GPT-4o九成功力，R1模型更实现以纯强化学习突破推理能力边界，向世界证明，AI大模型的革命，不一定要靠算力堆出来。

　　是幻觉还是“真香”

　　DeepSeek的小而精、强且美，是炒作出来的“幻觉”，还是厚积薄发而得的“真香”？

　　自从在AI江湖中亮出名号，DeepSeek就不满足于追随者，这可以从其开发的一系列原创技术获得证明。MLA、GRPO、R1-Zero……门外汉对着这些字母大概会如坠五里雾中，但是，这些技术合力激发的“聚变”，恐怕是DeepSeek获得140多个国家用户认可的根本原因。

　　北京白领小游说，DeepSeek的回答不像GPT的回答那么干巴巴，像个只会写材料的书呆子，按部就班安排任务步骤，而像个鬼马精灵，只要你说明目的，她就能拆解和揣摩你的弦外之音、思考怎么实现你想要的：“甚至你可以问她一些你都没有答案的大问题。”

　　当然，DeepSeek依然在蓬勃的成长期。以最新的DeepSeek-R1为例，虽然其突破鼓舞人心，但学术界用起来还不免有点头疼——面对悠远文明时间中的复杂因果，现代学术论述的复杂规范，DeepSeek的回答还不免左支右绌。

1 23 4 下一页