编者按:本文来自微信公众号 华商韬略(ID:hstl8888),作者:刘柏铖,创业邦经授权转载。
DeepSeek之后,中国AI加速。
国内一、二线城市们的焦虑也进一步加深。
但北京,有些不一样。
AI,离不开北京
北京似乎不担心“会不会错过DeepSeek”,因为DeepSeek更担心自己错过北京。
尤其是错过这里的人。
先后爆火的DeepSeek和Manus,明面上是分别起家于杭州和武汉,但其核心团队却均身处北京,甚至其各自的北京分公司比本地分公司成立还要早。
曾有创业者调侃“只要人不走(出北京),事儿就不走(出北京)了”。
21世纪最贵的人才,北京就是有人才。
做AI,更离不开人才,北京是中国AI人才第一城。
2018年,距离ChatGPT席卷全球还有4年,一场有关AI的顶级会议已在北京召开,会议的重点只有一个:“如何提升当下的科研水平”。
彼时,谷歌刚刚提出突破性的Transformer架构——此后的多年,不论是ChatGPT还是DeepSeek均是在此基础上诞生。
而事实上,Transformer架构的相关理念,早在谷歌之前就已被中国AI奠基人、中科院院士张钹提出。
为什么北京没有把张院士的理念变成现实,把Transformer架构做出来?往后如何不再有这样的遗憾?
会议上各种方案争论很久,期间前微软亚洲研究院创始人CEO张宏江站了起来:“美国有个OpenAI,是一个非盈利民间机构,这种形式很新颖”。
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。而张宏江接下来提出的想法更加新颖,甚至过于理想化,以至于对国内的科研体系都是一种挑战。
他提议成立一个机构,把人工智能相关的优秀科研工作者都联合起来。
从清华、北大、中科院等知名高校到百度、字节、小米、美团等知名企业,都是他联合的对象。
他认为,有必要突破性地跳脱出传统的权利体系,做一个独立于政府、商业、高校之外,彻底定位为一所民间、非营利、新型科研机构。
就连张宏江自己也知道其中难度,毕竟企业投钱,想追求金钱回报,政府投钱,同样需要对其有一定的要求。
结果,北京市政府竟然展现出惊人的魄力,当即拍板,亲自出面牵头,联合科技部成立了北京智源人工智能研究院(BAAI),并将其作为北京最重要的三所研发机构之一建设。
甚至,一不做二不休,北京市还几乎拿出了所有的资源,将政府、企业和社会数据集合到这一平台上,建设新的开源AI工具,同时整合大学和大企业的计算能力,向各类AI研发机构开放,欢迎全球的人工智能研究人员参与使用。
仅仅三个月后,清华东南门外,快门闪过,智源正式成立了。
这是中国AI发展史中浓墨重彩的一笔。
几乎所有人都怀揣着理想主义,没有论资排辈,不看“帽子”,只看其是否有取得标杆性成就的潜力。
至今,面壁智能联合创始人刘知远仍对智源念念不忘。
彼时,刘知远还未评上清华大学副教授,在AI领域也算不上什么有话语权的人。
只是抱着“试一试”的态度,他向智源申请了大模型训练的立项,没想到立即获得上千万人民币的资源投入。
“如果没有智源,以我当时的学术职称很难调度这么大的资源。”
就在这样的理想主义中,智源研究院拿出了仅次于OpenAI、谷歌的大型AI研究项目——“悟道”,成为了AI届的“黄埔军校”。
智谱创立发起人唐杰、面壁智能联合创始人刘知远、月之暗面创始人杨植麟……这些响当当的大模型明星创业企业发起人、创始人,都曾在智源深度参与大模型研究。
如今,北京汇聚了全国最顶尖的大学和科研机构,90多所知名高校、1000多家科研院所、120个国家重点实验室,全国60%的人工智能人才集中在北京,庞大的人才宝库,为北京的AI发展打下基础,也吸引来其他城市的目光。
北京,反哺全国
DeepSeek、Manus接连刺激着中国各大城市的神经。
上海遭吐槽“被‘小弟’偷家”、深圳被怼“只懂拿来主义”、南京更是连续被省委机关报“敲打”……
反思的文章一篇接一篇,政策也紧锣密鼓,接连被推出。
事实上,2023年初,ChatGPT风靡全球,AI被突然加速,各大城市的AI争夺战就已打响。
北京提供算力补贴和场景测试支持,降低企业研发成本。上海、广东除了政策上的绿灯,还直接给予最高500万元、2000万元的资助。
城市在争夺相关企业,企业在争夺人才。
远在美国的张宏江也接到了一位智源骨干焦急的电话。
“怎么办,他们一定会挖我们的人。”
“慌什么。”
张宏江已经有所预料,只是没想到,这种挖角持续了很久。
一次,张宏江在同行的交流会中,当着某知名创业者的面狠狠夸奖了一位很受智源重视的年轻人。而过了没多久,这位年轻人就被那位知名创业者挖走。
这件事,让张宏江忧郁很久。
同样的故事,在北京各处上演。
2024年3月,上海在知名地标西岸艺术中心召开了2024年全球开发者先锋大会。
这个位置可不是随意选择的,距离此地1公里的模速空间,有着“AI超级工厂”之称,也被定位为“全球最大的人工智能孵化器”,其聚集的大模型企业之多,“上下楼就是上下游”。
而其中,竟有一半企业来自北京。
原来,在2023年8月模速空间启动建设时,上海相关负责人就专门跑去北京,挨家挨户敲门访问AI企业。
企业外迁,北京不会睁只眼闭只眼。
就在模速空间启动一个月后,北京专门设立了北京市人工智能产业投资基金,基金总规模达100亿元,其中一个最大的投资诉求就是:
只投资北京本土AI企业,并且被投后必须长期扎根北京,不然就会触发回购操作。
眼见“争夺战”愈演愈烈,国家也开始出手。
2024年8月,《公平竞争审查条例》正式实施,综合整治地区“扫楼式”抢挖企业和不正常的“内卷式”竞争,规范地方政府和企业行为。
一盆水泼下,大家的脑子都冷静不少。
北京上下,也从混乱中找回初心。
张宏江更加淡然:“如果智源的一些人到了某些公司成为了核心骨干,把公司做成了,我会非常开心。我们的代码、我们的系统被别人用来做他们的产品,做得很好我也会非常开心,这本来就应该是一家非营利研究机构的价值所在。”
海淀区也逐渐大度:“企业根据自身的发展需求,走向全国市场,对全国的产业发展是有带动作用的”“如果只是盯着数据,那是很传统的“看摊”思维”。
目前,北京已经拥有AI相关企业数量约为2200家,占全国的40%左右;规模在10亿参数以上的大模型厂商约有一半在北京,数量达到122家。
显然,对于北京,视野已经不能仅仅停留于国内,理应站上更高的高度。
“建成世界主要科学中心和创新高地”“致力于发展未来产业,建设具有全球影响力的创新策源地和产业高地”。
相关言论不断出现在北京的各种政策目标中。
目标,是全世界!
目标,唯有登顶
“小心陷入‘无源之水’的困境!”
整个2023年,中国工程院院士戴琼海四处奔波,不断警醒着人们。
彼时,以美国方案为主的大模型技术已经对我国形成了严峻的知识产权壁垒。而截至2023年5月,大模型和Transformer相关的知识产权总数有2899项,美国占据71%,可我国仅占据25%。
时至今日,国内外发布的不少大模型,仍有不少基于谷歌的Transformer方案。
面对日益复杂的国际关系,依附性创新模式风险不小,甚至有专家警告:“人工智能产业将沦为技术殖民地的装配车间。”
作为中国AI的发源地、中国AI人才的大本营,北京有义务也有实力去做一些不一样的事。
就在DeepSeek爆火之后的这波反思潮中,不少媒体也指向这一个关键节点:
Transformer架构出世后,北京在迅速跟进有自主知识产权的变体模型,而不是基于Transformer训练出更多相对同质化的大模型。
智谱创立发起人、清华教授唐杰高呼“打破西方的路径垄断”,坚决选择不够成熟的GLM路径,打造中国自己的预训练模型框架,并公开表态:“如果成功了,那至少证明中国的大模型公司,技术能力也能达到世界级水平。”
彩云科技创始人袁行远,同样投身于挑战Transformer架构的事业。
彼时,很多投资人无法理解智谱和彩云科技做的事,“大部分人不相信作为一个中国初创公司能做出什么技术创新,所以你就去抄美国就完了。”
就连袁行远自己都遭受不小的刺激,看到周边一家家公司拿到巨额融资,开始“怀疑自己到底在干什么”。
但最后,大家还是坚定,要走自己的路。
北京的AI学者,从业者,创业者在前方背水一战。
北京则在发展规划中不断明确自身的道路。
2023年一年,北京连续发布《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》和《北京市促进通用人工智能创新发展的若干措施》《人工智能算力券实施方案(2023-2025年)》。
尤其在北京市人工智能产业投资基金成立后,北京仅一个月间就接连举办多场关于AI技术的闭门活动,不断强调将重点投向底层技术领域、新技术创新等关键领域,要“攻坚突破”“布局前沿技术”“弯道超车”“换道超车”……
如今,位于北京的彩云科技和智谱已经各自拿出足以挑战Transformer架构的底层架构。
其中彩云科技提出的DCFormer架构,不但可以让原本基于Transformer的大模型无缝嵌套和应用DCFormer,甚至还能比Transformer的性能提升1.7-2倍。
而业内对各个城市的AI产业分析也逐渐统一:
北京用领先的技术辐射全国,带动中国AI产业发展,其余城市则各自“因地制宜”,将领先的技术赋能到相关应用产业。
北京已经找到自身的优势。
在2025年的新春第一会上,北京海淀发布《中关村科学城加快建设具有全球影响力人工智能产业高地的若干措施》,每年10亿元,拿出空间、资金和场景,致力于发展未来产业,建设具有全球影响力的创新策源地和产业高地。
未来,北京的优势只会越来越强大。
三次问鼎计算机视觉领域国际最高奖项马尔奖的朱松纯教授、“计算机图形学超级新星”胡渊鸣、曾提出LAMB优化器的潞晨科技创始人尤洋等顶级学者……
国际顶级学者接连来到北京,或坐镇院校,或创办企业。
然而来到北京的又何止国际顶级学者。
一直到DeepSeek爆火,人们惊讶地发现:
就在DeepSeek的北京办公地融科资讯中心,竟汇聚着Google、英伟达、AMD、苹果、intel、华为、ARM、百度风投、襄禾资本(月之暗面投资方)等国际知名巨头。
而以融科资讯中心画圆,则是清华大学、北京大学、北京航空航天大学等41所高校,206家中国科学院为代表的国家(市)科研院所,67个国家重点实验室,27个国家工程研究中心,28个国家工程技术研究中心,是中国人才和智力资源最密集的区域。
因此有人感叹,中国城市AI大战,北京只出一栋楼就已经赢了。