登顶!“神秘的东方力量”震动硅谷
2025-01-27 14:21 北京日报微信公众号
据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。与OpenAI的o1相比,DeepSeek模型的百万token输入成本从15美元锐减到0.55美元,输出成本则从60美元降低到2美元。
有人提出,DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。
Meta生成式AI团队
正疯狂分析DeepSeek
1月24日,美国消费者新闻与商业频道CNBC发文称,DeepSeek的AI模型“威胁美国在AI领域的主导地位”。同日,华尔街顶级风投A16Z创始人马克·安德森在社交媒体发言称,DeepSeek R1是其见过的最令人惊叹、最令人印象深刻的突破之一,并且是开源的,是给世界的礼物。英伟达资深科学家、AI智能体业务负责人Jim Fan也对其给予了高度评价。
另据媒体报道,Meta(前身为 Facebook)员工在美国匿名职场社区teamblind上发帖提到,DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,工程师正在疯狂地分析DeepSeek,试图从中复制任何可能的东西。
锐评:给封锁者一记耳光!
“中国的AI不可能永远跟随”
众所周知,为确保技术霸权、遏制他国发展,美国在芯片领域对中国的制裁力度近乎疯狂。就在今年开年,还将中国列入“Tier 3级管控”,几乎切断高端AI芯片的供应链。可以说,国内AI产业上下游的公司面临供应链受阻、研发受限、发展成本增加等重重挑战。