一城之力反超美国巨头们，杭州这几家企业火了

锌财经·2024-12-31

何以是杭州？

编者按：本文来自微信公众号锌财经（ID：xincaijing），作者：孙鹏越，编辑：大风，创业邦经授权转载。

杭州AI一夜火了。

有网友调侃道，很有意思啊！我们小小的杭州，干掉美国三大科技巨头。

一家名叫幻方量化（Deepseek）的AI公司，干出来拼多多式的伟业，让全世界为之震撼，把AI训练成本直接打下来99%，打破了OpenAl的霸权；
一家名叫宇树（Unitree）的机器人公司，干掉了美国最知名的工程与机器人设计公司波士顿动力，秒杀原本的液压技术路线，反超波士顿动力的机器狗；
一家名叫毫微（Nano Labs）的无晶圆厂IC设计公司，刚刚推出FPU3.0 AI ASIC设计架构，同类产品已超英伟达的五倍以上。

在科技圈，一直流传着“AI四小龙”商汤、旷视、云从、依图科技；“大模型六小虎”智谱、MiniMax、月之暗面、百川、零一万物、阶跃星辰。

现在，杭州也有了自己的AI三支柱。

1 改变AI时代的底层逻辑

众所周知，AI大模型越智能，支持的场景越多，就意味着它需要的芯片和算力就越多。

全世界的算力需求，让英伟达从一家显卡厂商，硬生生蜕变成一家三万亿美元市值的巨无霸。

但哪怕是英伟达、AMD、英特尔等全部半导体公司加起来，也满足不了AI市场逐年上扬的算力需求。

就在所有AI公司都苦于算力缺口之际，来自中国杭州的一家AI创企幻方量化，发布了一个参数量高达671B的大模型：DeepSeek-V3。

更让人惊讶的是，DeepSeek-V3仅仅只用了2048块GPU训练了2个月，且只花费557.6万美元。

对比OpenAI的GPT-4o，它的训练成本约为1亿美元，至少在10000个GPU的计算集群上训练。

也就是说，幻方量化只用了五分之一的芯片，二十分之一的成本，就训练出一个参数量第一梯队的大模型。

DeepSeekMoE

这样的成绩瞬间引爆了整个AI市场。

前OpenAI联合创始人、Tesla AI团队负责人Andrej Karpathy在社交平台发文赞叹道：”Llama 3 405B使用了3080万GPU小时，而DeepSeek-V3看起来是一个更强大的模型，仅使用了280万GPU小时（计算量约为十分之一）。“

“如果DeepSeek-V3的优良表现能够得到广泛验证，这一模型将是在资源受限的情况下，在研究和工程方面让人印象深刻的一次展示。”

据DeepSeek-V3研发团队表示，之所以能用较低的价格完成高难度大模型训练，主要是采用了高效推理的多头潜在注意力（MLA）和用于经济训练的DeepSeekMoE。

多Token预测目标（Multi-Token Prediction，MTP）有利于提高模型性能，可以用于推理加速的推测解码。并采用一种创新方法，将推理能力从长思维链模型（DeepSeek R1）中，蒸馏到标准模型上。

这种“分布式推理”的方式早有人提出，例如OpenAI联合创始人兼前首席科学家Ilya Sutskever就曾经说过：“我们已经达到了数据峰值，AI预训练时代无疑将终结。”

但没想到的是，一直将中国大模型视为“廉价替代品”的美国企业，在“分布式推理”领域上，被一家中国杭州的企业先拔头筹，用技术给他们好好上了一课。

可以说，DeepSeek-V3让AI世界享受到了拼多多式的快乐。

2 从机器人到半导体设计

如果说DeepSeek-V3的出现，让硅谷巨头们真切意识到中国AI产业的进步速度，而宇树（Unitree）和毫微（Nano Labs）则继续让他们处于“持续应激”之中。

前不久，宇树发布了旗下行业级机器狗B2-W（B2机器狗的进阶版）的炫技视频，在视频中，B2-W机器狗演示了如何爬山、涉水、越障，克服崎岖地形、颠簸路面流畅行走。

宇树B2-W机器狗

除此之外，B2-W机器狗还能完成高难度的杂技动作：原地旋转稳停、两足倒立旋转、2.8米高楼飞跃。另外，该机器人可负载40千克行走，一个成年男性的重量不在话下。

宇树B2-W机器狗视频引发了全网热议，就连太平洋彼岸的马斯克，也忍不住转发并评论称赞。

B2-W机器狗不仅仅是一个“高价宠物”，它最适合的场景是专业领域，比如安防巡检、勘测探索、公共救援、医疗防疫陪护等危险厂家，让人员避免事故风险。

据新华社12月14日报道，警用机器狗加入成都市公安局高新区分局巡逻大队，开展安全巡逻和宣防工作。

值得一提的是，机械狗原本是美国高科企业的代表，就比如波士顿动力，从2005年就开始研发出第一款“大狗机器人”。

彼时，宇树基本上只是波士顿动力的跟班，跟着大佬的脚步一点点“照猫画虎”，从产品形态再到商业生态位，宇树一直走的是波士顿动力“平替版”路线。

然而仅仅只过了数年时间，宇树就成功研发出运动性更高、平衡性更强的动轮方案，取代了波士顿动力的四足方案，一年时间里完成了能在户外环境里跋山涉水的训练。

不少波士顿动力的死忠粉纷纷破防，还觉得宇树B2-W机器狗的视频一定是AI生成的CGI画面。

宇树B2-W机器狗

除了大模型和机器人，在半导体领域，也有一家杭州公司，对“巨人”英伟达发起了冲锋。

那就是毫微（Nano Labs）。

12月26日，Nano Labs正式推出FPU3.0，采用ASIC架构，在能效上实现了五倍的提升，树立了能源高效、高性能ASIC的新标准。能广泛应用于AI推理、边缘AI计算、5G数据传输处理和网络加速等领域。

作为AI与区块链技术的老玩家，Nano Labs是国内领先的无晶圆厂IC设计公司，从2022年就陆续推出多款HTC和HPC芯片设计的全新基础构架芯片。

目前来说，ASIC架构芯片已经成为AI世界的主流选择。

在执行大规模特定的AI任务时，ASIC可以针对特定应用设计的专用芯片，进一步提高计算的效率、降低功耗并提高性能。

摩根士丹利在12月15日发布研报《AI ASIC 2.0：潜在赢家》认为ASIC凭借针对性优化和成本优势，有望逐步从英伟达GPU手中争取更多市场份额。

预计AI ASIC市场规模将从2024年的120亿美元增长至2027年的300亿美元，年复合增长率达到34%。

目前，ASIC芯片朋友圈逐步扩大，谷歌、Meta、微软、亚马逊等大厂都将推出自家AI ASIC芯片。

3 为什么是杭州？

“中美贸易战里最大矛盾，是华盛顿市宾夕法尼亚大街1600号临时居民与深圳市南山区粤海街道企业之间的纠纷。”

这是前几年最火热的段子，而“华盛顿市宾夕法尼亚大街1600号”是指美国白宫；

“深圳市南山区粤海街道企业”则是指华为、大疆、中兴、腾讯等坐落在深圳南山区粤海街道的中国科技大厂们。

如今中美贸易战热度降低，科技斗争的矛盾点逐渐转移到了当下互联网的核心：AI。

同样，和美国科技巨头的对抗前线，也从深圳南山区转移到杭州。

很多人不知道，早在AI浪潮之前，杭州就已经被称为人工智能的“东方硅谷”，更是国内第一座“人工智能之城”。

杭州城市大脑

2016年10月，杭州成为全世界第一个启动“城市大脑”基础建设。

杭州将安装一个人工智能中枢：杭州城市数据大脑。让数据帮助城市来做思考和决策，将杭州打造成一座能够自我调节、与人类良性互动的城市。

美国著名城市理论家、社会哲学家Lewis Mumford在著作《技术与文明》中提及，人类城市发展分成三个阶段：古希腊城市（初始文明），中世纪基督教城市（商业文明），近代和现代工业城市（工业文明）。

全世界第一个启动城市大脑的杭州，将对城市文明发起第四次浪潮，一个基于互联网、数据和人工智能的“科技之城”。

如果你问我，为何是杭州？为何是他们？为何是今年？

那么这就是答案。

本文为专栏作者授权创业邦发表，版权归原作者所有。文章系作者个人观点，不代表创业邦立场，转载请联系原作者。如有任何疑问，请联系editor@cyzone.cn。

锌财经

关于我们

订阅服务

特别推荐

法律相关

爱奇清科（北京）信息科技有限公司地址：北京市朝阳区丽泽西街东湖国际中心A座7层 | 网络文化经营许可证（京网文[2018]2153-213号）

违法和不良信息举报电话：010-53391121 举报邮箱：db@cyzone.cn

京公网安备 11010502035114号

营业执照出版物经营许可证

反馈

联系我们

推荐订阅