编者按:本文来自微信公众号 峰瑞资本(ID:freesvc),创业邦经授权发布。
最近,AIGC(AI-generated content,AI生产内容)这股洪流涌入了我们的生活以及商业世界。
OpenAI发布多模态GPT-4模型,让GPT能理解图片的内涵。Midjourney发布第五版商业AI图像生成服务,解决了以往AI工具无法正确渲染手部的难题。百度发布文心一言,包含文学创作、商业文案创作、数理逻辑推算、中文理解与多模态生成这几大能力。
与AIGC相关的技术问题已经被比较充分地讨论。我们好奇的是,这股洪流可能会产生哪些分支?流入哪些小径?置身其中的创业者们会选择奔赴哪个方向?
目前已经有不少团队选择在模型层创业,做语言模型或者图像生成模型。除此之外,创业者或许还可以立足垂直行业,往行业的纵深方向发展。
在「趋势2023——峰瑞中美创投峰会」,峰瑞资本投资合伙人陈石与AI科技运动公司BodyPark型动公园(以下简称BodyPark)创始人兼CEO阿立Alex,阁楼创始人兼CEO刘秋阳、特看科技创始人兼CEO吴春松(乐乘)一起深入探讨了AIGC如何影响垂直行业。
主持人陈石拥有15+年连续创业经历,作为核心管理团队成员深度参与UC浏览器和第三方支付公司拉卡拉的创业过程,分别担任副总裁和CTO。他曾担任阿里大文娱、移动事业群高管,深度参与UC、高德、优酷、土豆、神马搜索、UC国际等产品线的业务决策和管理执行。
嘉宾阿立创立的BodyPark结合了「AI算法+真人私教+游戏化」等关键要素,推出「AI+真人」在线私教课。嘉宾刘秋阳硕士毕业于南加州大学计算机科学系。他创办了深圳谨启科技有限公司,旗下的“阁楼”是一款线上心理服务 App。嘉宾吴春松是特看科技创始人&CEO,前阿里智能设计实验室负责人,阿里鲁班创始人。特看科技切入的是短视频及直播SAAS服务领域。
我们将他们的部分讨论编辑成文,期待能提供新的思考角度。
分析式AI与生成式AI 在场景使用上有什么区别?
陈石:这几年AI有两波浪潮,第一波叫分析式AI,第二波叫生成式AI。你们是怎么感受这两波创业热潮的?这两波创业热潮针对的使用场景有什么区别?
吴春松:我经历过这两波不同轮次的高潮。2015年到2016年那一波AI浪潮时,刚好那时我在阿里内部做了“阿里鲁班”(后改名为“鹿班”)这款产品。这款产品借助AI来生成海报,能够实现自动排版、自动更改图片尺寸。
当时我们大多还是通过限定范围内的小模型的方式去做。我们做海报,还要人工去准备好大量的设计的基础元素和物料,生成的图像是元素级的组合。现在这一波的大模型,已经能真正实现像素级生成,这在图像领域是一次重大的变化。
▲ Midjourney生成的图片,
关键词为90年代的中国情侣。
另外在控制生成的过程中,上一波我们要给很多元素打好标签,用专家支持的方式去组合后做优化。
现在这一波Midjourney或者Stable Diffusion这些模型,已经改成prompt(输入关键词)这种接近人类自然语言的方式,去生成图片。所以这一波AI产品在交互方式上也发生了很大的变化。
我感觉这一波生成式AI站在了巨人的肩膀上,它把人类历史已经沉淀的过往信息聚集在一起,用深层次AI大模型的方法做了组装升级。所以我觉得这一波AI热潮带来的变化比上一次影响更深。
陈石:阿立是AI行业的一名“老兵”。 之前在AI独角兽公司出门问问,做产品的VP,刚好经历了这两波AI热潮。
阿立:上一波的语音助手类AI以及视觉类AI更多是偏向被动式的分析,预置任务场景下的简单问答,更多是为了在特定任务上提高搜索交互效率。
过去一两年,尤其是最近生成式AI这一波,让AI从被动式的分析或者响应,变成了可以更主动地去生成内容,能够在很多垂直的应用场景上给出很多新可能,结构性地改变用户体验和行业生态。
我们确实也看到了这一波新的基础设施,或者说底层技术的突破,能够给很多垂直的应用场景带来新的可能。
陈石:确实,原先我们觉得AI好像只能做一些比较局部的技术性工作,现在生成式AI让我们打开了脑洞,发现它能做更多事情。
刘秋阳:我没有经历过完整的两拨AI浪潮,但我们一直在用AI 相关的产品。现在的语言模型更加通用,我们可以不用像以前那样,只在一个细分领域中用一个产品去生成。现在你可以用GPT去生成任何你想要的内容。我觉得它会变成每个人工作的基础设施,而不是仅仅是科学家或者工程师的基础设施。
AIGC如何赋能心理咨询行业?
陈石:现在我们进入垂直行业赛道的讨论。三位嘉宾来自三个垂直行业,秋阳是心理咨询服务赛道,春松是内容营销的赛道,阿立是在线健身赛道,都不太一样。刚好借这个机会,请大家介绍一下各自的赛道。
先从秋阳开始,我比较关心一个问题,当前心理咨询服务赛道是什么情况?为什么AIGC可以帮助它?
刘秋阳:心理咨询赛道其实发展了很久,这个赛道不同时期也都有不同的产品涌现。但这个行业一直都没有解决非标性问题,比如咨询师的学派、学习经历各异,不同平台的服务方式各有不同。
这些非标性会造成很多用户痛点,比如预约要很久;可能通勤时间很长;你找的咨询师可能不太适合你,要试错很多次才能找到一个合适的咨询师。
这些问题看起来都是需求端的问题,但最终都要在供应链端寻找解决办法。所以我们做的第一件事就是把咨询和服务的流程标准化。
当我们在思考AIGC怎么帮助我们时,并不是思考如何让它给用户做心理咨询,而是思考它如何在供应链侧,赋能心理咨询师。
如果我们要把一个人从抑郁或者焦虑的状态中治好,本质上是要让这个人和心理咨询师建立新的关系,这是人和人的情感交互。如今ChatGPT虽然在语义和推断领域已做得非常厉害了,但在建立关系,进行情感和人伦层面上的交流上,ChatGPT还比较难实现。
除了咨询之外,心理咨询师还有非常多工作要做,比如写案例报告、工作安排。每个人写得都有自己的风格,但如果用AIGC去写,首先它能保证质量,另外,AI生成的内容格式相对统一。更重要的是,之前供应链端的所有的书面材料都要咨询师做,现在可 AIGC可以直接生成,能让咨询师更专注于业务本身,提升了几倍的工作效率。
在实际应用AIGC的过程中,我们也遇到了一些坎,比如怎么更好地生成prompt(关键词指令)。心理行业和其他行业不同的一个点在于,心理咨询行业有非常多专业的词汇,你需要把这些专业的词汇都尝试一遍,才能生成出你觉得不错的产品。
AIGC如何改变视频营销?
陈石:接下来我们进入第二个赛道,春松你来简单介绍一下,你在做什么样的产品?
吴春松:特看科技把 AI 和数据技术用在视频直播产品里,是内容生产赛道里面的一个典型应用。我们是AIGC 里面的“GC”(生成内容)。
在内容生产赛道,以前的主流方式是PGC(专业生产内容) 或者UGC(用户生产内容)。PGC对应的工具是像 Pr(Adobe Premiere Pro,简称Pr,由Adobe公司开发的一款视频编辑软件。) 这种专业深度的工具。
UGC更多是借助移动端比较轻量的模板化的内容生产工具。如今AIGC改变了内容生产的方式,对我们所处的领域改变很大。
我们切入的是视频及直播工具赛道。视频制作这件事可以被分为三段。第一段,策划、创作环节,要产出内容脚本。第二段是拍摄跟制片环节,产出画面跟素材。第三段是剪辑环节,形成最终的作品。
我们尽可能在每个环节都用上AIGC最新的能力,正在研发一键生成视频的工具。我们内部很关注一个指标,叫AI替代率。可能对于其他行业而言,是否使用AI是可选项,但对我们来说,是必选项。
陈石:当时峰瑞投资特看科技时,它原先定位在短视频制作,特别是在海外短视频赛道里头做内容的创作、编辑、数据归集以及生意参谋。早期特看科技用GAN(对抗生成网络),来给主播换脸,满足跨境电商海外直播的需求。新的语言模型和图像生成模型,比如GPT-3和Stable diffusion等面世并逐步成熟之后,特看科技很快就把新技术用在了业务里。
想问一下你们在运用新技术的过程中,有没有发生过一些有趣的情况?有什么新发现,碰到了什么困难?
吴春松:我们比较意外的是,GPT是一个“抄作业”的高手。比如在撰写直播话术跟策划视频脚本环节,我们给它看了一些样例之后,它很快就学会了。它的通用能力让大家都感觉到了,但它在专业领域里面也学得很快。比如我们在美妆类目下给了它几百条优质的视频脚本后,它可以有模有样地做出来,它的泛化能力跟涌现能力让我们感触深刻。
难点则是我们切入的视频领域天然是多模态的,涉及文本、语音、图像等多方面的内容形态,之前的语言模型大多是单一模态,我们需要自己来“组装”。GPT-4这样的多模态的语言模型,一定是大势所趋。
AIGC如何助力线上健身?
陈石:我们现在进入在线健身赛道,请阿立来分享一下这个行业当前是什么情况?为什么AIGC可以帮助它?
阿立:我聊一下我们创业的一些判断和想法,以及跟 AI 的关系。
很多人会认为线下面对面的交付才能把体验做好。但我们看到,不管是线上还是线下,健身行业存在不少亟待解决的问题,比如续费和用户留存不太好。
我们为什么要做出来创业,切入线上运动健身赛道?
首先,由于5G 、在线音视频、 RTC技术(Real time communication,实时通信,是实时音视频的简称。)以及AI技术加成,线上反而有机会做出不一样的用户体验。
第二,我们看到在很多次技术周期里,因为出现新技术,使得老需求有一个更方便、体验更好的方案,可以解锁大量的新市场。你不能用“历史的眼光”,来看新市场。
从底层逻辑来讲,阁楼、特看科技和BodyPark都在做同一件事,就是降低了人们使用服务的门槛,这是核心。
我们开创性地做了一个“AI+真人”的在线私教课产品,在市面上已经跑了一年多。我们的信心来自于真真切切地看到了消费者愿意去线上,愿意掏钱,并且续费留存显著优于传统方案。
我们还搭建了一套AI Coach Copilot远程授课系统,帮助全国各地的教练,高效率远程授课,让他们在每节课都能收到一笔不错的课时费收入。疫情期间,我们这套系统帮助很多教练解决了生计问题。
我们之所以能做到这些事,就是因为我们利用了最前沿的技术,切入了一个垂直场景,将非常传统的线下健身行业进行线上化和智能化改造,创造了新的服务交付方式。这也是我们相信AI要做垂、做深、做透的逻辑。
陈石:同样的问题,BodyPark在运用新技术的过程中,有没有发生过一些有趣的情况?有什么新发现,碰到了什么困难?
Alex: 难点在于,第一,怎么用AI深度学习的方式来精准捕捉人体的运动。市面上开源的人体姿态识别和动作捕捉系统识别准确度还不够高,我们采用自有模型和算法,做了很多优化,提高识别准确度。
另外,挑战还在于怎么把动作识别、实时音视频互动这套技术,用比较“丝滑”的工程和产品方案,交付给消费者,这里面要解决不少技术难点。
运用新技术的过程里也有不少有趣的发现,AIGC在垂直行业可以找到有意思的应用场景。比如我们用stable diffusion算法模型,上线了AI健身滤镜的功能。用户上完一节课,BodyPark会给用户生成这节课的高光时刻图片,既保护了用户隐私又非常有趣,用户的分享率也非常高。
▲ 图片来源: BodyPark
再比如,我们最新上线的一款 AI互动游戏化健身APP“JustFive”,既能让用户在欢快的音乐节奏中,进行有趣热烈的游戏PK,不知不觉的完成5分钟有氧HIIT锻炼,也能在课后生成非常有趣鬼畜的短视频,便于用户分享。
陈石:BodyPark和阁楼这两家企业都定位在服务行业,它们都在经历我们称之为服务行业的“三化”过程,即线上化、数字化、智能化。表面上看,从线下到线上会有服务体验上的损失,但最终,数字化和智能化的优势能弥补这些损失,实现更好的服务效果,提高服务4效率。
AIGC还有哪些落地场景和机会?
陈石:除了心理咨询、短视频、健身这三个垂直行业之外,你们还看好哪些垂直行业,能让生成式AI有更好的落地场景和机会?
吴春松:我觉得首先是内容创作行业,不管是图片、文本还是视频,应该是最直接被改变的一个领域。如果是站在普通消费者的角度,我现在最期待的换掉手机里的语音助理,改成真正聪明的ChatGPT这种水平的智能交互。比如我拿起手机,点一个按钮,就可以把我的问题全问完,也能及时得到我想要的答案。把交互的“距离”缩短,这是我最迫切的需求。当然可能这种机会可能不在创业公司手里,更像是在巨头手里的机会。
阿立:如果大家考虑创业或者加入创业公司,我觉得有几个大的方向。第一个去做基建和大模型创业。如果你对前沿科技感兴趣,可以选择加入一个大模型的公司。但这个机会可能会在少数巨头手里,或者在资金充裕、技术实力比较强的创业团队。
对于创业公司而言,更多的机会是做中间层或者应用层,或者把中间层和应用层一块做。
此外,可以多从服务业里找找应用层的创业机会,不管是去重构线下,还是把线下的体验搬到线上,或者做一些全球化的事情,出海其实也会有很多机会。在新的增长周期,去观察用户有没有新的需求变化,去观察有没有机会通过最前沿的技术,去做结构性的降本增效或者体验创新。
刘秋阳:我觉得应用层的服务行业会有非常多的机会,比如金融、法律、医疗,其实都会有从线下翻上来的机会。如果未来AIGC应用得越来越广泛,很多内容信息可能需要我们加以甄别。比如,我们怎么判断和自己视频连线的人是不是真人?中间层的数据安全领域也是一个机会。有一部英剧叫作《真相捕捉》,其实就在讲AIGC带来的数据安全、隐私安全以及真实性等方面的问题。
▲ 英剧《真相捕捉》海报。
图片来源:豆瓣
如何建立自己的竞争壁垒?
陈石:还有个话题大家比较关心。现在大模型占主导地位,围绕着大模型的周边应用,其实在某种程度上都是被平等赋能。所以,我们如何建立自己的竞争壁垒?
刘秋阳:今天很多人都在用大模型,其实没有所谓的技术壁垒概念。我觉得比较重要的几个事情,第一是工程。工程本身是一个壁垒,需要大量试错。第二是在早期形成knowhow(专业知识)。knowhow可以节约很多时间,你早做一点,可能突出人家半年。第三,你要想办法去验证模型的有效性,比如提升效率是一个方面,另一个方面可能是改进商业模式。此外,你还需要去验证模型有效性的方法本身,是不是真实有效的。
陈石:AI 确实在平等赋能,大家在同一个起跑线上。所以最后可能还是要把我们的壁垒建设在基于行业的knowhow和场景里。
阿立:我觉得这一轮AI 应用的创业机会里,壁垒可能来自于你的路线选择。如果仅仅是做了一层很薄的基于通用的大模型,来做单一维度的应用创新,壁垒会比较低。就我们自己而言,BodyPark 目前更倾向于做垂直的,端到端的技术和工程的产品整合,会用到不同的技术栈。
对我们而言,人体关键点识别的引擎、虚拟教练跟用户的多模态交互的中间件和应用层,一定要牢牢掌握在我们自己手里。但我们也会主动拥抱新技术,比如像ChatGPT、文心一言这样的一些新的基础设施,我们一定会open地接入。
在一个行业变革的早期,在共识没有形成的时间点,做垂直的整合(Vertical Integration),会相对比较容易交付产品,把现金营收做起来,同时持续构建壁垒。
陈石:总结来看,基于垂直行业的创业,AI 本身可能还形成不了太多的壁垒,真正的壁垒还是在场景、商业模式、用户规模、行业knowhow里头。仍然是:“技术为先,场景为重。”最终还是要有自己的业务纵深和场景壁垒。
垂直赛道有没有必要 自己做AI大模型?
陈石:有个话题不少创业者比较关心,目前市场上有不少大模型,在垂直领域的创业者,未来需要自己做模型吗,还是用已有的模型就好?
刘秋阳:长期看,肯定是要自己做的。对于我们这种应用层的公司来讲,路程其实比较长,需要大量的积累。首先要积累一种方式来验证你模型的有效性,还要再有一个方法,来检验你之前验证的方法本身是不是有效的。走到比较远的时候,才有办法建立自己的大模型。
对于我们来说,大模型是为了应用本身服务的,它不是服务于所有通用的场景。我还是希望它最终能够验证商业价值,而不仅仅是对话价值。但我们也不知道,未来GPT会发展到什么样。
吴春松:短期内我们不会有这层考虑。我们会更聚焦在应用层,做深做透。AI 创业生态里,底层大模型公司跟上层应用公司之间分工跟协作,可能形成新的公约,比如哪些地方应该应用端来做,哪些地方应该底层的巨头或者新兴的公司来做。
在我眼里,大模型是新时代的水电煤。我们可能更关注的是如何用好新基建。以新能源车行业举例,我们可能更像是造车新势力的角色,而不是新能源电池厂商的角色。我们要考虑的是产品服务的是什么样的群体,我们做什么样的产品去服务好客户?我们也尽可能地做到不依赖某一类“电池”,不能被一家大模型全部“锁死”。以后AIGC生态里,可能会形成类似新能源车与电池厂商这样的协作关系。
本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。