揭秘快手可灵背后的「关键7人」

量子位·2024-07-16

关注

来自清华港中文中科大浙大交大等，还有14000+被引大神

编者按：本文来自微信公众号量子位（ID:QbitAI），作者：衡宇，创业邦经授权转载。

国内风头最盛的AI视频团队是哪家？

毫无疑问，快手可灵。

发布一个月，体验用户超30万，生成700+万条短视频，开放网页Web端。哪怕这样，可灵还是一号难求，想上手体验的急得嗷嗷的。

而比可灵本身更神秘、更令人好奇的，是缔造出这款中国版Sora的背后团队。

量子位全网搜索，根据公开资料，发现了可灵团队来自清华、中科大、港科大、浙大、港中文、上海交大、南京大学等的“关键七人”。

整合梳理后，与可灵团队强相关的关键七人阵容大体如下：

盖坤（于越）：快手高级副总裁、快手主站业务和社区科学负责人；清华博士，第一批“阿里星”。
张迪：快手副总裁、快手大模型团队负责人。
万鹏飞：快手视觉生成与互动中心负责人；中国科学技术大学和香港科技大学校友。
王鑫涛：快手视觉生成与互动中心高级研究员，领导视觉内容生成，特别是视频生成方面的工作；浙江大学和香港中文大学MMLab校友，师从汤晓鸥。
Xin Tao：快手科技视觉生成组（又名可灵团队）高级研究员和技术负责人；上海交大和香港中文大学校友，师从贾佳亚。
Haotian Yang：快手可灵团队成员；南京大学校友。
Yuan Gao：快手可灵团队成员。

若有知情小伙伴愿意提供更多信息，帮助量子位进行更正或补充，请随时在后台与我们联系。

快手可灵背后的ta们

盖坤（于越）

盖坤，博士毕业于清华大学，研究方向是识别与智能系统。

现任快手高级副总裁、快手科技经营管理委员会成员、商业生态委员会成员，担任主站线业务负责人并兼任社区科学线业务负责人。

2011年，盖坤以第一批“阿里星”的身份，加入阿里工作，花名靖世。

阿里星是阿里一直“暗藏”的知名校招技术人才项目，坊间传闻，每年能最终拿下阿里星Offer的不过寥寥数人（约占当年校招总数<0.3%）。

以及在外界的八卦中，最吸引人的还是“阿里星年薪上不封顶”这一条。

盖坤主要是在阿里妈妈做广告算法，负责竞争展示广告技术，以及其他跟AI相关的部分。

进入阿里工作后，盖坤提出了分片线性模型MLR，极大地提高了CTR预估的准确性，被外界称为“算法天才”。

2016年，他搭建出深度兴趣网络，以此对广告点击率进行预测。

2017年，他又和团队推出能预测用户点击偏好的新模型“深层用户网络兴趣分布”，更精准地为用户推荐商品。

离职前，盖坤的最后title为阿里妈妈精准展示广告技术总监，职级P10。

2020年，盖坤悄然跳槽，加入快手。

他以“于越”这个花名亮相，担任高级副总裁，同时也是快手科技经营管理委员会和商业生态委员会的成员。

去年1月旬，快手发布原CTO陈定佳离职的公告，接任者为盖坤和另一高级副总于冰，分别承担此前CTO的相关管理职责，向CEO程一笑负责。

此后，盖坤一并担任主站线业务负责人并兼任社区科学线业务负责人。

今年WAIC上，可灵大模型的新版本新功能，就是由盖坤出席发布。

张迪

张迪，现任快手技术副总裁、快手多媒体与大模型部负责人。

他作为快手多媒体与大模型部负责人的任命发生在去年初。

彼时，快手启动AI新战略，于是作为技术副总裁的张迪披挂上阵，担任大模型研发团队负责人，聚焦大模型、视觉生成模型和多模态模型等方向。

今年5月，张迪和盖坤等参与的《Parrot: Enhancing Multi-Turn Instruction Following for Large Language Models》入选顶会ACL2024。

万鹏飞

万鹏飞，本科毕业于中国科学技术大学EEIS系，后拿下香港科技大学博士。

其专注的技术方向包括图像/视频/3D AIGC、XR与数字人、Mobile/Efficient AI等。

现为快手视觉生成与互动中心负责人，快手可灵视频生成模型负责人，向张迪汇报。

在担任现有职务前，他长期担任快手Y-tech AI技术中心负责人，牵头了快手数字人系列解决方案。

致力于通过计算机视觉、图形学、机器学习、人机交互等领域的交叉，为各业务线提供智能化的多模态内容创作和互动体验解决方案。

今年1月，他参与外界活动的title仍然是这个；但刚结束的WAIC上，他以可灵视频生成模型负责人身份亮相。

公开资料显示，在2020年加入快手前，万鹏飞曾任美图影像实验室MTlab负责人。

王鑫涛

王鑫涛，本科毕业于浙江大学，后在香港中文大学MMLab（多媒体实验室）攻读博士学位，师从汤晓鸥。

Google Scholar页面显示，王鑫涛的论文被引次数为14406。

2020年博士毕业后，王鑫涛的第一站来到了腾讯，做视觉生成（图像、视频、3D）相关的研究工作

具体来说，他分别在腾讯AI实验室和腾讯ARC实验室担任高级研究员。

5月，王鑫涛在知乎发布文章，表示自己“最近来到了快手”，目前是快手科技KwaiVGI的高级研究员，部门隶属于快手多模型与AIGC部门。

现在，王鑫涛负责领导视觉内容生成，特别是视频生成方面的工作。

Xin Tao

Xin Tao，毕业于上海交通大学，后来又在香港中文大学计算机科学与工程系拿下博士学位，是港中文终身教授、IEEE会士贾佳亚的学生。

现在是快手科技视觉生成组（即可灵团队）的高级研究员和技术负责人。

他的研究兴趣包括视觉修复和生成。

读博前，他先后在Adobe创意技术实验室、腾讯优图实验室当过研究实习生。

2018年博士毕业后，他正式加入腾讯优图实验室，任高级研究员。

2020年年底，Xin Tao加入快手，在视频处理和分析组、Y-tech混合现实团队都呆过一段时间，负责牵头实用视频编辑算法的研究和技术转让，以及用于直播的2D数字人综合系统。

加入可灵团队后，Xin Tao专注于高效视频生成和编辑系统的研究和部署。

Haotian Yang

Haotian Yang，快手可灵团队成员。

毕业于南京大学，曾在IEEE、AAAI等顶会上发布论文。

2023年前后，Haotian Yang加入快手。

One More Thing

眼尖的小伙伴们应该已经发现了，还有一位叫Yuan Gao的同学没有进行详细介绍。

真相只有一个：

除合著论文外，暂时未能收集到Yuan Gao同学的更多信息。

要不大家老说呢，技术人才们总是喜欢蛰伏水下，默默搞个大新闻……

就挺遗憾的！

希望了解相关情况的朋友们来后台留言，量子位会一直关注Yuan Gao和可灵团队的新动态新进展，及时与大家共享学习。

另外，梳理过程中挂一漏万，如果有其它可灵团队同学的信息，欢迎大家补充~

参考链接：
[1]https://arxiv.org/abs/2406.04277
[2]https://scholar.google.com.hk/citations?user=FQgZpQoAAAAJ&hl=en
[3]https://scholar.google.com/citations?user=PXO4ygEAAAAJ&hl=zh-CN
[4]https://www.xtao.website/
[5]https://scholar.google.com/citations?user=LH71RGkAAAAJ&hl=en

本文为专栏作者授权创业邦发表，版权归原作者所有。文章系作者个人观点，不代表创业邦立场，转载请联系原作者。如有任何疑问，请联系editor@cyzone.cn。