登顶！“神秘的东方力量”震动硅谷

2025-01-27 14:21 北京日报微信公众号

　　据了解，DeepSeek R1没有使用业内普遍使用的监督微调（SFT）训练范式，而是直接通过强化学习让模型自主进化出复杂的推理能力，包括反思和长链思考等能力。这种方法不仅提高了训练效率，还减少了对昂贵计算资源的依赖。与OpenAI的o1相比，DeepSeek模型的百万token输入成本从15美元锐减到0.55美元，输出成本则从60美元降低到2美元。

　　有人提出，DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。

　　Meta生成式AI团队

　　正疯狂分析DeepSeek

　　1月24日，美国消费者新闻与商业频道CNBC发文称，DeepSeek的AI模型“威胁美国在AI领域的主导地位”。同日，华尔街顶级风投A16Z创始人马克·安德森在社交媒体发言称，DeepSeek R1是其见过的最令人惊叹、最令人印象深刻的突破之一，并且是开源的，是给世界的礼物。英伟达资深科学家、AI智能体业务负责人Jim Fan也对其给予了高度评价。

　　另据媒体报道，Meta（前身为 Facebook）员工在美国匿名职场社区teamblind上发帖提到，DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌，工程师正在疯狂地分析DeepSeek，试图从中复制任何可能的东西。

　　锐评：给封锁者一记耳光！

　　“中国的AI不可能永远跟随”

　　众所周知，为确保技术霸权、遏制他国发展，美国在芯片领域对中国的制裁力度近乎疯狂。就在今年开年，还将中国列入“Tier 3级管控”，几乎切断高端AI芯片的供应链。可以说，国内AI产业上下游的公司面临供应链受阻、研发受限、发展成本增加等重重挑战。

1 23 4 下一页

登顶！“神秘的东方力量”震动硅谷

猜你喜欢

热点新闻

登顶！“神秘的东方力量”震动硅谷

猜你喜欢

热点新闻

国产AI引发外网热议，DeepSeek下载热度仅次于ChatGPT

DeepSeek登顶苹果中国区免费榜第一，“黑神话悟空”创始人冯骥：震撼的突破

美股震撼、科技巨头恐慌，95后成群的DeepSeek如何就一夜“破圈”？

搅动纳斯达克！为什么是DeepSeek？

玉渊谭天丨热解读：为何DeepSeek引发美国恐慌