编者按:本文来自微信公众号 有新Newin(ID:NewinData),作者: 有新,创业邦经授权转载。
Builders 是由 @Magineer、@有新Newin以及 @深思SenseAI联合推出的人物专栏,旨在发现与分享更多的优秀出海创业团队与独立开发者,我们将定期邀请生态范围内的创始人与团队展开对话。
今天我们邀请到的嘉宾是 00 后创业者凌天格,天格是一位 00 后的年轻创业者,就读 CMU 计算机,当时还没毕业就创立了格子互动,并拿到了源码以及奇绩的投资。
格子互动团队的第一款产品是 “Halo剧本杀”,一款在线剧本杀游戏应用,提供真人声优级别的 DM,而“大饼AI”是在观察到声音与场景、角色之间的关联后产生的想法,格子互动的愿景是实现声音的自由,让每个人都能拥有完美的声音。
有新:请先简单介绍一下自己以及公司?
凌天格:我是凌天格,00 后,本科就读 CMU 计算机系,还没毕业就成立了格子互动,一个少年感十足,平均年龄 95 后的创业团队。我们的愿景是实现声音的自由,人人拥有完美好声音。
目前主要的产品是大饼 ai 变声,海外版叫 Dubbing AI,一个简单好用的实时ai变声器,可以把你的声音变成任何人。
有新:作为一名 00 后创业者,你当时为什么选择创业?
凌天格:我感觉创业就是我应该做的,只是没想好什么时间开始。可能是毕业就开始,也可能读研后,或者在美国工作一段时间再开启。但因为疫情原因本科上了很久网课,闲暇时间开始和同学们搞 Side Project,没想到第一个产品就做到了千万年收入,所以当即就 all in 创业了。
有新:格子互动团队的第一款产品是「Halo剧本杀」,这是一款什么样的产品?
凌天格:简单来说,Halo 剧本杀是首个真人声优级 DM 线上带本的剧本杀 App。我们一比一的将线下的剧本杀体验还原到了线上,无论是剧本,线索卡,还是 DM。
有新:现在为什么选择做 DubbingAI,两者之间有什么样的契机或联系么?
凌天格:在做剧本杀的时候,我们观察到了声音和场景、人物角色很巧妙的关联性。比如说欢乐的场景与角色天然适合小岳岳的音色与口音,抒情暧昧的场景与志林姐姐的声音完美契合。一旦声音与场景匹配,用户的体验是指数级的提升的。所以当时就有了虚拟声音滤镜的想法,慢慢就演变成了现在的大饼 ai。
有新:这款产品主要的功能是什么?较同类产品而言有哪些差异性?
凌天格:声音克隆+实时变声,大饼 ai 可以把你的声音变成任何人,生成的声音逼真自然且极其富有情感。我们在 Win 和 Mac 端都发布了我们的 App。打开大饼 ai 后,我们软件将代理电脑的麦克风,这时你再开启任何社交软件或游戏,在产品内说话就可以实现变声啦~
与其说变声,用换声来定义产品更精准。最大的差异是我们使用了全新的 Transformer 架构实现实时换声,与传统的调音/声卡等技术路径完全不一样。传统方法无法实现声音克隆,大多只能变为非人类声音,例如大黄蜂,小黄人,擎天柱。且只能改变有限的声音参数,例如给声音加混响,调音高等,实现简单的美化。
有新:你们的用户主要是哪几类群体?
凌天格:游戏玩家是我们最大的用户群。在游戏开黑的时候使用我们的产品和队友交流也是最常用的场景,无论是整蛊熟人,还是开变声让自己更加放松的开麦和陌生的队友沟通,变声都是一个很实用的工具。
主播和内容创作者也是我们的核心用户群,固定一个声音来配合虚拟形象直播,或是变声整活节目效果,我们都有和不少主播合作过~内容创作者使用我们的产品不仅可以提高产出的效率,也可以让内容更加多变有意思。
有新:在开发产品过程中,有遇到什么样的挑战么?或者说同类产品还没有解决的?
凌天格:遇到的第一个也是我们觉得最需要攻克的挑战就是要在保证效果的同时还要保证消耗的电脑性能足够低。作为一个工具类产品,我们自然希望使用门槛越低越好,我们也观察到很多用户的电脑可能在配置上没有很好的 CPU 或者压根没有显卡。所以最开始近 30% 的 CPU 占用很难满足他们的需求。所以我们从上线到现在一直都在努力优化性能占用,到现在只需要个位数的 CPU 占用,也是很多同类产品所很难达到的。
有新:未来你们还会上线什么样的产品功能?
凌天格:我们准备再从说话本身出发,推出口音消除和口音增强的两个功能。举例来说就是可以从 Chinglish 转化为 English,同时保留你的音色和情感;也可以从普通话转化为台湾腔~ 再未来就是吧变声,口音,与翻译结合,实现 real time dubbing,也就是能还原情感与声音的实时翻译。
有新:你们也上线了海外版,不同市场的用户习惯和付费情况有什么差异性?
凌天格:国内外的付费模式,客单价都有差异。因为国内主要游戏用户为主,所以国内版本主打游戏化售卖策略,周免音色+音色皮肤买断制。和王者荣耀一样,每周轮换不同的免费音色给用户使用,喜欢就付费买下永久版,单一声音 19/39/59 人民币。
当然,也会运用经典的游戏运营策略比如首充,累充,分享,连续登陆等。海外就简单很多,订阅套餐 9.9 美元/月,声音克隆和一些稀有音色独立收费。
有新:你是如何思考这款产品的商业模式的?
凌天格:目前我们的付费留存,持续付费,月付费 ARPU 数据都还不错,海外更是平均比国内高 30%~40%,同时因为我们变声是端测计算,所以毛利还不错(让我们可以花更多经费迭代产品与算法~)
我们设计商业模式第一步是主观判断,因为我们 Day1 知道主要是谁在用我们的产品,所以直接根据用户画像匹配他们习惯的付费模式。第二就是观察数据,再根据数据微调策略。
有新:在产品早期冷启动和增长中,你们是如何思考 GTM 策略的?
凌天格:我们觉得 GTM 最重要的还是定义清楚你的产品。比如到底有啥用,服务谁,用户为啥用。在细一点就是用户在哪用,用多久,和谁用这些用户行为。这些看清了之后,你大概也明确了你的对手了。作为小创业公司,一般我们的新方案要比之前的方案好至少一倍以上,我们做 GTM 赔率才够高。
这些定好了之后,就是做好曝光和运营收口。曝光的做法不同团队风格差异很大,胆子大一点想做爆,一般我们依赖 kol 和内容营销,这种做法可能亏,也可能大赚。稳一点就去做 SEM,做信息流广告,这些账其实流量大厂都给咱算好了,咱持续优化 ROI 和 LTV就行。
有新:在探索不同市场的过程中,有什么有趣的发现么?
凌天格:我们发现做大多数市场都有一个共性,勇一点胆子大一点,冲就完事了。时间比什么都贵,早一个月,可能啥都不一样了。我们一直维持小步快跑的节奏,每周必须发一个版本,产品迭代的手感得维持。
有新:最近有刷到哪些好玩的 AI 类产品或者相关 AI 生成的内容?
凌天格:最近挺多ai+消费电子的结合我感觉都挺酷的,虽然有点早期,但打开了很多思路
有新:如何看待 GenAI+声音这个赛道?未来的 TAM 会有多大?
凌天格:我们观察现在 GenAI+ 声音主要有两类大玩家,一类是做非实时的 text to voice/music,服务内容创作,比如剪映,11labs;另一类是实时的 Voice Generation,比如我们大饼 ai,或者 Sanas.ai 和 Tomato.ai,主攻实时变声,口音消除与翻译。两类我们觉得未来 TAM 都大到现在很难判断,未来所有的声音都会是 AI 生成的,这里包括了现在的存量市场,还有 VR,Metaverse 等增量市场。
有新:有什么游戏或者影视文学类作品的角色让你印象深刻?这里面有什么你们的产品可以结合的地方?
凌天格:头号玩家!在虚拟世界里你可以成为任何人,当然,那时候大饼也能帮你拥有任何声音,口音,与语言能力。
有新:作为一名 00 后创业者,你会给同龄的年轻创业者哪些建议?
凌天格:早点开始做起来,不要想太多做太少。一般都是边做边想,创业的飞机边造边飞。
有新:你个人在这两段项目创业过程中最大的收获是什么?
凌天格:创业和 CMU 给我留下的 Lesson 很像:创业就像一场游戏,困难就是游戏关卡,都是设计好的,也一定会来。但困难与关卡存在的意义就是留给我们战胜的。莫慌,大不了再来一次,再大不了调整下关卡难度,问题总会解决的。
本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。