稚晖君刚挖来的90后机器人大牛:逆袭履历堪比爽文男主

关注
还官宣了和美国明星具身智能公司的合作。

编者按:本文来自微信公众号 “量子位”(ID:QbitAI),作者:一水,创业邦经授权转载。

刚刚,稚晖君旗下创企智元机器人官宣了两个新动向——

一则是关于人事变动。

具身智能领域的国际领军学者罗剑岚博士,已于近日加盟并出任首席科学家

罗剑岚在该领域已深耕10年,曾担任Google X、Google DeepMind研究科学家,是UC伯克利17万引大佬Sergey Levine团队的核心成员。

他曾参与打造世界上首个超人类的机器人真机强化学习系统SERL/HIL-SERL——首次实现将任务成功率提升到100%,在全球范围内被广泛应用。

接下来他将牵头组建「智元具身智能研究中心」,主导前沿算法研发与工程化落地。

图片

另一则是关于公司新合作。

国际顶尖具身智能公司Physical Intelligence(Pi)正式和智元机器人达成合作伙伴关系,双方将围绕动态环境下的长周期复杂任务,在具身智能领域展开深度技术合作。

图片

以及实属罕见的是,在竞逐AI、机器人以及软硬件的最前沿阵地,中美两家明星公司,竟然联手了。

稚晖君挖来具身智能领域大佬

罗剑岚,出生于1993年,本科毕业于武汉理工大学汽车学院。其后在AI和机器人重镇UC伯克利,拿到了博士学位。

从2015年开始,也是在机器人学习领域初步兴起的阶段,他就投身了机器人研究当中。

过程中,他逐渐将目光放在了将强化学习应用到真实机器人这一细分领域。

在积攒了一波学术经验后,2020年他毅然选择踏入工业界,进入谷歌多个机器人部门任职,包括Google X、DeepMind等。

在此期间,他与机器人学习领域的泰斗Stefan Schaal教授进行了一系列合作,主要学习了更多从底层动力学到上层控制的机器人系统知识。

值得一提的是,Stefan Schaal教授是UC伯克利机器人领域的领军专家,曾多次与李飞飞共同发表论文。

两年时间,当他所参与的项目被孵化为工业机器人创企Intrinsic后,他重新回到了伯克利从事博士后研究,师从 Sergey Levine。

Sergey Levine是UC伯克利电气工程和计算机科学系的副教授,专注于能够使Autonomous Agents通过学习获得复杂行为的算法,特别是能够使任何自主系统学习解决任何任务的通用方法。

Sergey Levine因两件事而声名远播。

一是他是领域内的大神,不仅谷歌学术被引用量为超过12.7万,还是不折不扣的顶会狂魔。

此前的不完全统计中,Sergey Levine 2018年在ML和NLP顶会上共发表22篇论文;ICML 2019,他参与论文数量排名第三;NeurIPS 2019、NeurIPS 2020,他均有12篇论文被接收……

其二,他属于UC伯克利的网红教授,此前推出的深度学习课程Deep Reinforcement Learning(课程代号CS 285)非常受欢迎。

图片

回到罗剑岚,正是在回归学术界的这一时间,他参与产出了“强化学习+真机”这条路线上具有代表性的两篇论文:SERL和HiI SERL

SERL/HIL-SERL作为世界上首个超人类的机器人真机强化学习系统,首次实现将任务成功率提升到100%, 在全球范围内被广泛应用。

具体而言,在SERL这项研究中,机器人能用20分钟学会装配电路板,成功率达到了100%。

这一结果真实验证了强化学习的有效性,而在这之前,该方法一直受到行业诟病。

图片

至于HIL-SERL,则是基于SERL的升级版。不过与SERL仅依赖人类的示范不同,HIL-SERL还结合了人类的纠正来训练强化学习策略。

实验结果显示,使用强化学习框架HIL-SERL,研究者可以直接在现实世界中训练基于视觉的通用机器人操作策略。

其中,机器人经过1~2.5小时的训练后,就能完成主板、仪表盘以及正时皮带组装等操作任务。

更重要的是,成功率也是100%。

图片

手握上述重要机器人学习技术,罗剑岚博士这次又选择加入智元投身工业落地。

中美明星具身智能公司,罕见联手

与此同时,智元机器人这次也选择了和一家国外同行开展合作。

Physical Intelligence,去年3月官宣亮相的美国明星创业公司,其团队全是一群机器人和AI大佬,联合创始人就有罗剑岚博士后研究期间的导师Sergey Levine。

据了解,这家公司在去年11月完成了4亿美元的A轮融资,融资后估值为20亿美元,主要投资者包括亚马逊创始人贝索斯、OpenAI、Thrive Capital等知名公司或投资机构。

图片

关于智元为什么会选择这家公司合作的原因,可能还要从Physical Intelligence所推出的产品或技术来追踪。

就在今年2月底,这家公司推出了“分层交互式机器人”(Hi Robot)系统,它能够将视觉-语言-行动(VLA)模型,如π0 ,纳入一个分层推理过程。

划重点,分层推理

面对“如何让机器人能像人类一样执行复杂任务”这个行业难题,Physical Intelligence早已明确给出答案:

让机器人学会以系统 2思维进行思考

图片

合理推测,未来两家可能会在让机器人学会推理方面展开深度合作。

图片

另外,据智元介绍,双方的合作已经初有成效,可以实现一个通用模型根据不同的指令输入执行多个任务。

同时也可以适配多种末端执行器,包括灵巧手、平行夹爪和旋转夹爪,并兼容鱼眼和针孔相机等多种传感器。

官方演示demo如下:

,时长03:15

可以看到,视频中的智元机器人能完成在镜子前戴上围巾、换垃圾袋,将物品从传送带移入物流箱等覆盖家庭和工业场景的多元复杂任务。

整体而言,对行业来说,两家明星具身智能公司的强强联合,不仅蕴藏了大模型推理技术在机器人领域的垂直应用趋势,而且还将进一步加速机器人真实落地家用场景。

One More Thing

当然,对于智元今日的人才大新闻,背后还有一段传奇佳话。

本科毕业于武汉理工的罗剑岚,实际也上演了一段“爽文男主”人生。

因为从中国一所211大学本科,能够拿到UC伯克利竞争激烈的王牌专业offer,并且硕博连读,每年5万美元奖学金!罗剑岚的故事堪称传奇,甚至被专门报道过。

据《长江日报》2015年报道称,当年UC伯克利的机器人方向博士生竞争非常激烈,收到了全球1500份申请,而招生名额仅有30个,最后罗剑岚成功脱颖而出,还打破了纪录——成为唯一一位被机器人和智能机器实验室录取的中国人。

在采访中,罗剑岚坦承自己因为在科研项目中关注到UC伯克利分校卡泽洛尼教授领衔的实验,其后有缘又在天津举办的机器人研究国际会议上,获得了直接向卡泽洛尼教授发问的机会,并进一步在会后递上了自己的简历,向教授明确表达:“我想读您的研究生!”

卡泽洛尼也被年轻本科生的履历吸引。据介绍,罗剑岚从大二开始就跟着武汉理工大学的导师田哲文做项目,发表了4篇核心期刊论文,参加全国和省级重大科研项目有5个,还获得了美国数学建模比赛一等奖。

卡泽洛尼教授给他的回答是:“或许我能有机会让你到伯克利来。”

也正是这句认可,点燃了罗剑岚心底的火苗。

回到武汉后,他又花了大半年时间,利用别人打游戏的时间,啃下了卡泽洛尼教授实验室发表的100多万字的学术资料。

其后2014年8月,罗剑岚更是上演了一段“孤身飞赴韩国追教授”的疯狂。

他查到卡泽洛尼教授将赴韩国参加一场有关机器人的国际会议,随即办好签证就追了过去。并在贵宾室外,等到了卡泽洛尼教授如厕的机会,再次表达了希望跟随读研读博的想法。

卡泽洛尼记得罗剑岚:哦,你住在首尔?

罗剑岚回答:不!我住在中国武汉,我来这里见您,就是希望读您的研究生!

而且也是在这次会议上,罗剑岚的半年苦功也换来了回报,他获得提问机会,把几个月来的思考化成几个刁钻的问题抛给了教授,卡泽洛尼会后再次找到他给出认可:“小伙子,不出意外,我想,我要把你带到伯克利。”

于是回国后,罗剑岚继续与卡泽洛尼教授联系,并附上自己的思考,通过电子邮件给对方发了过去。卡泽洛尼教授告诉他:你写的每篇综述我都看了七八遍,我不敢相信这是一位来自中国的本科生所写。

而也是在卡泽洛尼教授力荐下,罗剑岚在2015年夏天收到了加州大学伯克利分校的offer。

机器人和智能机器实验室,每年5万美元奖学金,从全球1500份简历中脱颖而出,成为了当年唯一一位被该顶级实验室录取的中国人。

参考链接:

[1]http://auto.whut.edu.cn/xyh/xywh/201912/t20191227_429864.shtml

[2]https://x.com/physical_int/status/1894829058883731962

[3]https://agibot-world.cn/collaboration

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。

反馈
联系我们
推荐订阅