DeepSeek开源周才第二天，有些公司就已经坐不住了

差评·2025-02-26

AI开源潮涌现，推理模型成主流。

编者按：本文来自微信公众号差评X.PIN，作者：西西，编辑：江江&面线，创业邦经授权转载。

哥几个，走过路过别错过，今天的 AI 圈可以说是格外热闹了。

真正 “Open” 的 DeepSeek ，打出开源周的第二发炮弹，短短几个小时就已经在 GitHub 上，收获了 3k 多星。

“ 开源老兵 ”阿里通义千问也没闲着，推出了 QwQ-Max-Preview 深度思考模型，展示思维链，还支持联网搜索。

还有凌晨两点多，大伙儿可能还在做梦的时候，大洋彼岸的 Anthropic 也给模型升级换代了。号称他们迄今为止最聪明的 Claude 3.7 Sonnet ，还是个推理模型和传统模型的 “ 混血 ” 。

我估计今天那些专门做模型测评的博主，都快要忙不过来了吧。。。

再加上 Grok 3 、 DeepSeek R1 、 o3 mini ，世超猜到了今年推理模型必有一战，但没想到，来得这么快。

光这么说大伙儿估计也没感受，今天咱们就挨个来看看， AI 圈子到底是怎么个热闹法。

先把视线，放在新一代 “ 开源战神 ” DeepSeek 身上。

用 R1 教育了一遍市场之后， DeepSeek 这两天，干脆开源了个彻底， 5 天时间，每天发一个代码库。

第一天，整了个 FlashMLA ，这玩意儿专门针对英伟达的 Hoppers GPU （比如 H100 、 H800 ），进行了效率优化，通俗点说就是榨干 GPU 的最后一滴性能。

今天开源的，则是 DeepEP 通信库。

根据官方的介绍，这是一个专门为专家混合（ MoE ）和专家并行（ EP ）设计的通信库。太复杂的咱也不去深究，大白话就是通信库可以让 “ 专家们 ” 的交流更快速、高效。

盲猜一波，国内那些个手里有 Hoppers GPU ，还是研究 MOE 模型的 AI 公司，可能已经冲了。

不知道明天 DeepSeek 又会开源哪个代码库，但光凭他们这敞亮、真诚的态度，圈粉就是分分钟的事儿，在 DeepSeek 的评论区底下，世超已经看到不只一位老哥，对着 OpenAI 贴脸开大了。

不过说到这，可能会有差友疑惑，网上整天嚷嚷着开源，这跟咱到底有啥关系？

这么说吧， DeepSeek R1 开源以后，大大小小的私企、国企都吻了上来，还有高校甚至政府机关，不是已经接入 DeepSeek ，就是在接入的路上。

经过大规模的模型部署后，下一步就是生态的构建、产业的融合，就像当年的 “ 互联网 +” ， AI 同样也可以成为基础设施，融入到咱们生活的方方面面。

很难说，闭源模型在构建生态这一步，能不能在短时间内达到像 DeepSeek 这样的效果。

所以这一切，我们可能都得感谢开源。

再来看阿里通义千问的 QwQ-Max-Preview ，是个推理模型。阿里也算是国内第一个，推出推理模型的头部大厂。

根据官方的说法，这是一个基于 Qwen2.5-Max 的推理模型，有很强的数学理解、编码能力，但目前还只是预览版。

世超在第一时间简单试了试， QwQ 也有思维链的展示。（不得不说，QwQ这名字有点可爱。。）

问它一道数学竞赛真题，最后的答案倒是对了，就是思考时间稍微久了些，我粗略估计思考了得有两分钟出头。

这道题问 DeepSeek R1 ，它的思考过程跟 QwQ 很相似，也是分析了多种可能性，但 R1 胜在推理的速度稍微快一些（ 112 秒）。

而同样的题目，我又问了今天的另外一位主角 Claude 3.7 Sonnet 。

只能说，又快又准。

但值得注意的是， Claude 3.7 Sonnet 是个混合模型，一个模型有标准和扩展两种模式。

如果你想看到大模型的推理步骤、思考过程，那就得选扩展模式。

如大伙儿所见，体验 Claude 3.7 Sonnet 的推理能力，是另外的价格。

世超还找了几个外网的实测案例，发现 Claude 的代码能力依然强得可怕。

同一组提示词喂给 Claude 3.7 Sonnet 和 Grok 3 ，这是 Claude 3.7 Sonnet 的结果。

再来看 Grok 3 的，直接被碾压。

即使 DeepSeek 加入战斗，也被秒了。。。

反正看下来， AI 发展到今天，已经有点超乎世超的想象了。

虽说今天这三则新闻放一起，打眼一看，好像没啥特别大的关联。

但稍微一提炼你就会发现，它们恰好体现了当前人工智能发展的趋势：开源阵营不断壮大，推理模型成为主流。

模型的开源和闭源之争， DeepSeek 一出手，即便是奥特曼，也不得不亲口承认， OpenAI 的闭源策略 “ 站在了历史错误的一边 ” 。

像 Llama 家族这种具有里程碑意义的模型，对于开源社区的重要性无需多言。

而除了 DeepSeek 和 Meta ，阿里通义千问、 xAI ，还有陆续拥抱开源的百度、 Minimax 和阶跃星辰，开源阵营肉眼可见在壮大。

另外一边，前两年大模型是不是老强调自己的长文本能力，慢慢的开始卷文生图、文生视频还有语音交互这些多模态，再到最近，模型跑分全是数学、代码。

真就应了那句话，AI 一天，人间一年。

照这么下去，可能哪天 OpenAI 宣布开源，又或者谁家突然宣布把 AGI 整出来了，我都不会觉得惊讶了。

本文为专栏作者授权创业邦发表，版权归原作者所有。文章系作者个人观点，不代表创业邦立场，转载请联系原作者。如有任何疑问，请联系editor@cyzone.cn。

0

关于我们

订阅服务

特别推荐

法律相关

Copyright 2007-2023 cyzone.cn All rights reserved 京ICP证070362号京ICP备08103950-1号京ICP备08103950-9号京ICP备08103950-10号新出发京零字第朝140005号

爱奇清科（北京）信息科技有限公司地址：北京市朝阳区丽泽西街东湖国际中心A座7层 | 网络文化经营许可证（京网文[2018]2153-213号）

违法和不良信息举报电话：010-53391121 举报邮箱：db@cyzone.cn

京公网安备 11010502035114号

营业执照出版物经营许可证

反馈

联系我们

推荐订阅