返回首页 >

搅动纳斯达克!为什么是DeepSeek?

2025-01-28 11:15   央广网

  与OpenAI开发的ChatGPT相比,DeepSeek不仅率先实现了媲美OpenAI-o1模型的效果,还大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本达到了GPT-o1级别的表现,引发海外AI圈的广泛讨论。

  北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟介绍,DeepSeek最大的优势在于算法的改进和优化,节省了算力和数据量。以前如果说OpenAI是“大力出奇迹”,如今DeepSeek则是“小力也可以出奇迹”——小的算力用新的方法也能创造奇迹。

△DeepSeek R1 API价格,图源:DeepSeek

  南京大学人工智能学院教授俞扬表示,DeepSeek在算法上进行了相应的优化,使得训练成本大幅降低。

  俞扬:OpenAI最初在做 ChatGPT的时候,用了强化学习的技术,但是强化学习的技术是很通用的强化学习的工具,那么这个工具它的要求非常多,所以会导致它的机器要用得很多。但是后来的研究者们就发现其实不需要这么复杂的算法,我们可以针对语言模型来设计出简单的算法出来,这样我们大概可以节省3/4的机器去训练强化学习的过程。在DeepSeek的公布的技术方案中,它的强化学习也使用了这种简化的方案,那么就使得从技术上面来说是可以有很多改进的地方。

  开源:未来的发展方向?

  DeepSeek采用了完全开源策略,不仅降低了用户的使用门槛,还促进了AI开发者社区的协作生态。通过开源,DeepSeek吸引了大量开发者和研究人员的关注,推动了AI技术的发展。英伟达AI科学家Jim Fan称赞DeepSeek是“真正开放的前沿研究,赋能所有人”。

猜你喜欢

热点新闻

{$loop_num=0}