具身智能在2024年成为了距离上最接近AI大模型的概念。一时间,业内多家公司竞相宣布推出相关产品,要将AI机器人赋能日常生活。
作为机器人行业的老兵,王斌深谙AI算力对机器人的重要性,“算力已经发展到了这么高的阶段,其实还有大量的需求。因为物理世界的数字化还远远没有完成,目前只是语音、图片、生成式视频,但是机器人服务所需要的是真正物理世界实时的数字孪生。这才是未来的AI。”
具身智能的发展前景、云端机器人如何搭建架构体系、AI大模型的驱动作用,以及个性化智能与情感服务对机器人的重要性等等,在星际营25期“新锐AI之星融资加速计划”上,达闼科技副总裁王斌就上述话题,进行了一场信息量拉满的分享。
以下基于标题为《AI创业的技术和商业化场景突破及具身智能的未来》的演讲,经创业邦整理后发布。
机器人的“大脑、小脑、肢体”要协同工作
今后的机器人更多的应该是工作、生活场景中为人提供服务,但是机器人自己去服务,有AI的驱动还不够,一定要有一个运营的平台,很好地让机器人安全地工作,能力不断提升,保证我们人类对机器人的可控,包括伦理方面的东西,所以我们现在做机器人一定是有一个运营平台的。就像搞移动通信,有中国移动、中国联通。没有网络运营,机器人直接给到用户就不管了可以吗?不可以。我们做机器人,不光是机器人的问题,还有AI的部分,这是个全栈的技术,这个就不讲了。简单补充一下,机器人的“大脑、小脑、肢体”,是去年提出来的发展人形机器人指导意见,这个概念就是我在工信部开会的时候提出来的,我们是工信部人形机器人专家组的,以前大家注重机器人本体的东西,跟AI结合怎么结合?我们大模型的技术如何结合起来?机器人是不是像人一样有一个超级大脑,同时还有个机器人的小脑,本体的这些算力,再加上机器人控制的问题,我们提出来这样一个概念,具体从云端机器人架构里可以给大家做一个分析。
机器人的发展大家已经接触了很多,传统的机器人是工业机器人,实际上就是一个重复地完成固定的动作。进一步有一些感知的协作机器人,后面有移动能力,从植物到动物的发展,到爬行动物,这些都是大自然进化,生物体越来越有智能、智力和行动能力,AGV小车,也包括无人驾驶技术和汽车结合,未来肯定是一种像人一样的有各种各样的感知设备,感知器官,以及各种各样的行动能力的机器人。当然人形机器人,我们希望未来成为通用的平台。这样架构的发展,无论是我们之前做的机器人,可能在某一领域可以做,完成固定工作继续使用,随着通用性的提高,用户需求的提高,一定是向云端机器人的架构去发展。
简单讲云端机器人,机器人大脑肯定在云端,现在的技术不太可能把通用大模型放在机器人的设备里面,需要太大的算力以及能量的消耗,也不科学,也不经济。所以这个大脑在云端,通过网络连接到机器人的本体,构成了“云、网、端”架构,简称就是云端机器人。我们公司2015年成立开始就按照这样的架构去打造未来的智能机器人,好在我们现在的网络通信技术已经非常厉害了,在几千公里之内可以达到像人一样的时延反应速度,人的眼睛看到物体,到视网膜,到大脑的处理,30毫秒就可以完成。这些在4G、5G情况下,通过网络传输也可以达到几十毫秒的反应,跟我们人一样的反应速度,够用了,对我们机器人来讲,代替我们人类工作基本够用了。
人形机器人:人类的第三台智能设备
我们知道做机器人,一直要构建一个产业的生态,我们把机器人定义成人类的第三台计算设备,PC、智能手机,未来机器人就是第三个智能设备。这个智能设备能干什么?不是我们一家公司能够全开发出来的,一定是生态来做的。手机能干什么?做硬件的,一批厂家做,做芯片的,做器件的。手机的应用是靠手机的App,有大量的App开发商,让我们时时刻刻离不开手机,覆盖了衣食住行、工作,分分钟都离不开它。未来机器人也一样,我们打造未来开放的平台,在这个平台下所有机器人厂商硬件都可以接上来,所有机器人应用的开发者都可以在上面开发应用,一个机器人有众多的应用开发者在上面开发应用,买回去一个家里的机器人帮我干活,你跟机器人说我今天想吃水煮牛肉,帮我做一个水煮牛肉的菜。谁会做水煮牛肉?你不会我也不会,我去编这个程序肯定不行的,是专门做水煮牛肉的厨师们来做这个App,他也不会写代码怎么做App?我们这个平台给他提供工具,不用你写代码,你就把你做水煮牛肉做就完了,我们机器人在这儿看着。从备料开始,到切,到热锅,到下油,全拍下来,拍完以后机器人大模型把任务分解了,形成所有的机器人适配的代码,这个机器人做水煮牛肉程序就生成了,你跟家里机器人说吃水煮牛肉,到我们平台上一找相关的程序,有十多个,就看谁排名高,谁点赞高,就下载它,给一毛钱就完了,机器人下载下来就干,这就是平台的作用。
不光是我们自己在搞机器人,通过这个平台,还要接各种机器人进来,让各种AI的服务提供商,各种应用开发商都接进来,这就是达闼在做的事情。所以投资人投我们投什么?投的是这个。
具体的云网端架构里面我们设计的平台,具体展开机器人大脑、网络,连接各种机器人。我们在机器人大脑里给开发者提供机器人的开发套件RDK,跟SDK是一样的,机器人有机器人训练师、机器人运营,在这里面我们给机器人大脑构建了一个机器人的元宇宙,我们的物理世界一定要变成数字化,机器人的大脑或者AI才能读得懂,这个数字化就是元宇宙,就是我们物理世界的实时数字孪生,今天我在这个会场里面,这个会场能不能数字化?在座的各位能不能够都数字化?这时候机器人进来以后才能够真正跟这个环境产生AI算法的感知,包括服务交互。比如说给一位女士送一杯热茶,它得知道这位女士是谁,这位女士不数字化它也不知道。这个实时的数字孪生怎么获取,保证实时的同步呢?不需要人去采集,更不需要安摄像头,机器人带眼睛,走到哪看到哪,实时传输,实时更新,需要大量的后台算力去处理这些大量的数据。
可想而知,我们说算力已经发展到了这么高的阶段,未来还有需求吗?还有大量的需求,英伟达有可能冲到30万亿。为什么?因为我们物理世界的数字化还远远没有完成呢,我们只看到了一些语音的东西,一些图片的东西,当然现在Sora有一些生成式的视频,但是真正物理世界实时的数字孪生才是未来的AI,机器人服务所需要的,这里面有大量的增长空间,在座各位有做这方面的,坚持做下去。
人形机器人的量产要在两年以后
具身智能和机器人应用方面,想和大家交流一下。这个不用多讲,心灵、手巧是出发点,大家都投这个赛道,投资人进行投资,创业者也在里面做东西了,就是GPT的出现,以及头部大的机构、企业开始玩这些东西,开启了人形机器人的元年。国外不多讲了,国内有这么几家,在媒体上大家都有接触,我们不一个一个去说。
关于人形机器人,最主要的技术有几方面,从硬件本体来讲,包括按机电设计、执行器、各种各样的算法,以及运动控制算法,以及对环境的感知、认知、决策和执行,这样一套机器人相关的任务完成的多模态计算,让人形机器人达到功能上的要求。光有这个还不够,我们需要提高机器人的可靠性,成本的降低,这些还需要一段时间的发展,我个人认为人形机器人还需要两代甚至三代的发展,一代基本上是半年,如果三代的话,人形机器人真正走向客户可以接受,愿意买单,还需要一年半到两年的时间,这段时间大量人形机器人在里面投入,真正的量产可能要两年之后。
当然了马斯克提出来在2026年,希望有一千台在他自己工厂用,我认为在自己工厂不太在意成本,是有可能的,你要是卖给第三方,那就要看这个东西卖多少钱,效率怎么样,是不是总出问题,是不是还要人去伺候它。这是电机,具体技术不讲。很多机器人不一定非是双足,之前我们跟孙正义开会的时候,孙正义就提出来了人形的轮式,跑得慢点的,四轮车往上一坐,想跑哪就跑哪,当时他就画了一个图,人的上半身,底下有个四轮,开会的时候他画的。这些都是强调底盘、腿,只要是高效,只要是节能,能迅速达到移动目标就行了,不一定要双足,当然双足有通用性。最主要的是手,上肢能力,这是业界做的一些手,我们也有自己的。
具身智能依靠的是“机器人学习”
运动控制算法有很多,现在最主要的是通过强化学习来实现,算法有很多进步,很多都是开源的。大模型引领机器人发展,从发展趋势来讲就是这三点,我们之前的人工智能都是基于手机、PC上的,最多有个摄像头监控,我们都叫做互联网AI,这概念都是我在三四年前提出来的,那时候叫互联网AI,现在叫具身智能。具身智能也是我在三年前,当时我们跟李飞飞聊的时候,他也提出来具身智能这个词。
从单模态到多模态,人就是多模态,五官来感知,跟外界进行交互。除了感知还要认知决策执行,这都是趋势。我们都知道机器学习,大家说深度学习、强化学习、机器学习,给了数据以后,通过算力去学习。我提出来机器人学习,不是机器学习,一个字的差别,但是范畴和深度有很大的不同。我们知道艾伦·图灵提出来我们与其建立模拟成人心智的计算机程序,还是人在后面写,不如我们尝试建一个模拟儿童心智的程序,儿童心智程序是自己学习、自己进步、自己进化,这就是大模型,给了它数据以后它不断进步,数据达到一定量的时候,Scaling Law达到一定的时候进行涌现,人就是这样的生物。机器人也按照这种方式,给机器人灌不同的数据,从端水,从做一个事情就开始做,失败了,为什么失败。水的话要拿正了,拿歪了水就洒了,要拿水平,什么叫水平?大模型告诉你了,水平就是在地球引力下的水平,倾斜了水就洒,大模型告诉这个机器人,让它理解了这个物理世界,执行当中自然像小孩一样学会了,孩子就是这样,抓住东西不要掉地上,尖的东西不要碰,碰就扎手,这就要给机器人学习、推理、决策的平台,当然里面还有各种各样的新技术,包括在少样本的情况下怎么学习。
什么叫少样本?不是说什么都没有的情况下就学,而是有大量的基础模型之后可以举一反三,给少量的数据就可以学会少量任务的,不是说单独可以做的,包括迁移学习、学会学习、终身学习。
“6W1H”是机器人感知、认知、决策、执行的关键
RobotGPT玩什么的?怎么玩?就是“6W1H”。如果有人想做机器人智能大脑,把“6W1H”做好,这是我们在业界提出来的。用什么样的技术,还需要让机器人有Memory,有时间问题,有记忆问题,大模型没有这个肯定不行,没有记忆在工作中怎么跟大家交流沟通呢?所以如何做好“6W1H”是把感知、认知、决策、行为这些东西真正形成机器人大脑的关键。
这也是我提出来的,大自然很复杂,各种生物在长,细胞分裂出来这么多复杂的生物体,很多复杂的东西都是由简单的东西组成的,简单的东西如何变成复杂的东西呢?不断地分形复制。分形Fractal,自相似性Self—similarity,这样一套技术用到机器人身上,就是把简单的东西组合成复杂的东西,“6W1H”和分形和自相似性,就是我们在做机器人的感知到决策的一个程序上要跑的东西。一个机器人想去送一瓶水,首先我要知道水在哪,然后要知道把这个水送给谁,我要知道这个水在哪,我又要知道水相关的6W是什么,水是什么,放在哪,水有什么作用。水是给人喝的,这是Why,水为什么给人喝,喝健康的东西,不能喝污水,时时刻刻要问大模型。AI的Agent实时把问题抛给大模型,大模型再反馈过来,看看你能不能完成第一步的工作,也许第一步工作又分成第二小步、第二小步,第一小步又要往大脑去问,又返回来,完成第二小步,这是机器人大脑程序需要实现的。
举个最简单的例子,比如说给人制作咖啡,你首先要理解这个意图,客人来了,要什么咖啡,要冰美式,怎么做,怎么给客人,怎么交互,这一套东西全是由大模型生成代码,不需要人编任何一个代码,这就是大模型牛的地方。只要把AI的Agent做好以后,大模型吐各种各样的代码,然后去训练。
机器人市场将经历一场残酷淘汰赛
未来的机器人,机器人APP这个市场,如果以后有创业者想做这方面的APP,我觉得未来还有很大的发展空间。像手机上有美团、滴滴这样大的独角兽企业,大家可以在机器人APP方面去做。对用户来讲有个机器人APP,对生态开发者有个机器人技能商店,机器人的应用是各种技能的组合,没有基础的技能开发端到端的机器人应用也是非常困难的,只有生态里面做很多模块化的技能,上层的应用开发者才能更好的开发更完整的上层应用,不可能所有从零开始做,所以开发者生态也很重要。
人形机器人,包括通用智能,包括大模型,这是ARK在2022年的预测,左边讲了互联网经济在2024年是13T $,这是产业的规模,预计到2030年AI驱动的新产业规模将是现在互联网经济的6倍。包括基础大模型,AI模型的服务,在此之上是AI的应用。我们作为创业者可以集中在AI方向,这个量也很大,这就是大模型包括通用人工智能未来的预测。
人形机器人基本上从市场趋势上看也越来越清楚了,国内做人形的,我们算了算大概50家可以叫出名字,这50家我们预计明年至少有一半会消失,后年再消失一半,到2030年不超过10家。当然这是预测,挑战性非常大,在这里面先进入到哪个领域,后进入到哪个领域,大家都在尝试,也有初步的预测,不展开了,大家都有自己的看法。
在互动环节,关于初创企业应该聚焦在哪个领域以获得更多机会?王斌认为这取决于初创企业的优势是在软件还是硬件方面。硬件方面,如果企业在传感器或机器人皮肤材料等领域有所突破,将有很好的机会。软件方面,他建议不要再开发手机APP,而是转向开发机器人的应用程序。对于整机制造商,除了电机和机器人关节技术,产业链的整合能力也非常关键。
提到情感服务类机器人,王斌认为是一个很好的发展方向。除了工业机器人,未来的陪伴型和服务型机器人将需要具备情感智能,能够理解人类情绪并提供相应的服务。个性化也将非常重要,机器人需要通过不断的交流来了解服务对象,提供定制化的服务。
在工业场景中,具身智能机器人相比传统工业机器人有哪些优势?王斌认为:具身智能机器人的能力更为全面,它们不仅能完成工业场景中的重复性劳动,还能执行更复杂的任务。与传统工业机器人不同,具身智能机器人可以完成多工序的任务,提高生产效率。目前,许多企业,包括格力,都在寻求通过具身智能机器人来解决剩余的15%难以自动化的工作。
技术迭代,市场重塑,AI时代更多的产业机遇正在释放。创业邦星际营愿始终陪伴在创业者,为优秀的早期创业项目加速赋能,帮助好项目升级创业能力,成为细分赛道的领头羊。在过往的加速历程中,星际营累计从20000+报名项目中甄选1000+优秀创业者进入孵化体系,往期学员单次融资最高金额达9亿,路演项目获得融资比例达64.3%。
长期以来,创业邦星际营作为DEMO CHINA的前哨战,助力创业者们以进阶姿态登上DEMO CHINA,以更完善的技术、产品,更全面的商业思考面向各领域知名投资人、行业专家、产业伙伴展示,拓宽他们的创业之路。
本次星际营25期的创业者们系统加速后,将登上2024 DEMO CHINA的舞台,在AI纪元绽放自己的创新力量。
这些企业都是谁?他们又有哪些非凡的创造力?
让我们相约9月19-20日·成都,一起见证更多超能勇士的崛起。