AI行业的竞争自Sora发布之后“开挂”般升级,强大的视频生成能力对内容创作和生产效率进行赋能和颠覆性重构。我们见证了AI带来的文生图像、文生音频、图生视频等领域的飞速迭代,文生视频已成为争相竞逐的下一个赛点。
营销被认为是能够最早实现AIGC商业化落地的行业之一,亿欧TE智库认为, 在AI 2.0时代,AIGC将站在数智营销舞台的中央。在近期多家智库及咨询机构发布的AIGC行业报告中,多次出现因赛集团及其自研的营销AIGC应用模型InsightGPT的身影。
作为A股营销行业上市公司及品牌营销龙头企业,因赛集团(300781)近日对外发布已突破文生视频技术路径,正在上线文生视频应用产品【AI营销视频】,InsightGPT的商业化进程正在加快。
图注:36氪研究院丨2024年AIGC行业研究:多模态大模型与商业应用
图注:艾瑞咨询丨2023年中国营销领域AIGC技术应用研究报告
图注:亿欧智库丨2024中国百模大战竞争格局分析报告
图注:赛迪四川丨2024中国人工智能多模态大模型企业综合竞争力20强榜单
定位行业解决方案,提升创作效率与空间
与Sora等文生视频创意类工具的定位不同,InsightGPT「AI营销视频」致力于为品牌提供完整的营销行业应用型文生视频解决方案。在各类营销场景下,大消费行业企业对营销素材的需求更加强烈,视频类脚本、社群运营、“种草标题+笔记”,以及公众号推文撰写是高频使用的环节。InsightGPT「AI营销视频」功能针对这类需求和场景,解决品牌运营方、内容创作者在品牌/服务/产品宣传、内容运营等方面的难题,可生成数十秒甚至1分钟以上视频内容,为AIGC营销领域带来新的数智化解决方案。
此次,InsightGPT能洞察用户输入的文字信息,自动生成多个视频创意主题,并根据用户指定主题先自动生成具有完整故事感的创意脚本,再根据脚本自动生成创意视频,以及同步完成音乐生成、人声生成及字幕生成等子任务,最终输出完整度较高的营销创意视频。
【案例1】
用户输入:
InsightGPT生成脚本大纲:
『深邃的星空下,一只卡通兔眺望着神秘的远方。卡通兔穿着宇航服,驾驶小型太空船探索宇宙。卡通兔走出飞船,惊喜地发现了形态各异的发光植物和梦幻般的荧光森林。卡通兔遇见了几只友善的外星兔,一起种下植物。更多奇异的风景出现,卡通兔眼里充满好奇,它眺望着远处,暮色降临,星球上举行了一场盛大的星际音乐会,卡通兔和朋友们一起欢快地唱歌跳舞。卡通兔戴上VR眼镜,继续探索这个星球的城市风景。最后,结束探险的卡通兔站在高高的山峰上,俯瞰这个奇妙的星球,浩瀚的宇宙继续转动。』
InsightGPT生成视频:
【案例2】
用户输入:
InsightGPT生成脚本大纲:
『镜头穿越色彩斑斓的星云,揭示一颗红色的神秘星球,汽车飞驰在连绵沙丘之上,扬起壮观沙尘。一双脚踏上星球,继而出现一位身穿科技感服饰的亚洲男士背影,镜头多角度展示停在星球上的汽车外观,特写他目光坚定专注,展示车灯及车身线条。随后,汽车悬浮并降落至另一颗蓝绿色星球,镜头特写车内智能屏,驾驶员凝视前方星云变幻,紧握方向盘,继续在星际探索神秘深邃的宇宙。』
InsightGPT生成视频:
【案例3】
用户输入:
InsightGPT生成脚本大纲:
『阳光透过薄雾,洒落在清晨的荷花池畔,荷花盛开,水面泛起涟漪。温柔的双手捧着荷花,荷花上的水珠随之轻轻摇晃。一个年轻的东方女士脸上绽放着自然的光彩,一瓶菡萏护肤品如出水芙蓉般浮在水面。她置身荷花之中,享受自然的美丽滋养。荷花与荷叶的掩映之间,出现菡萏护肤品瓶身。』
InsightGPT生成视频:
文生视频带给行业的震撼不仅在于画面的精美,还在于逼真程度和想象空间,背后恰恰反映出大模型数据与算法融合之后的学习能力及进步速度。通过文字描述自动生成脚本,再生成场景切换流畅、细节呈现清晰、情感表达准确的高清视频内容,AI生成视频的能力在各维度均有了质的提升。
通过因赛集团此次发布的视频生成案例可以看出,AIGC文生视频在营销场景有了更清晰的应用路径,也有了更高效的实现方式。三个案例基于不同行业属性,结合品牌特点及内涵,生成具有营销特色的内容,对品牌方而言不仅带来更多惊喜,也让从业者看到更多可能性。
AIGC多模态加持,助力视频生成打通并赋能营销全链路
InsightGPT「AI营销视频」是一个整合了AIGC多模态的营销应用,其背后蕴含的是因赛集团营销智慧资产以及多模态算法应用,涵盖文本生成、视频镜头生成、视频质量优化、音视频合成等多个子任务,并为每个子任务指派专门的智能体,以完成一系列视频生成任务。
(1)文本生成:
用户输入提示词,通过智能关联自建知识库及大语言模型创作升级等一系列模型和策略结合,丰富化描述,并生成有效提示词。
(2)视频镜头生成:
采用了先进的扩散模型架构,使用时序生成模块和文本控制模块来生成图像元素,并对图像中元素随提示词的描述以及时间的推进进行相应的运动和变化,最终生成动态的视频帧序列。模型训练采用三层训练架构,让模型更好地生成高保真视频,保证了生成内容的品质与美感。
(3)视频质量优化:
1)通过基于深度学习的插帧技术,模型学习和理解视频内容的位置、运动方向、速度,预测并生成中间帧,实现视频流畅度提升。
2)为了增强视频的细节和清晰度,利用视频超分技术,对视频帧的高频信息进行提取与重新合成。
(4)音视频合成:
1)利用音频指纹(分析音乐文件,提取其特征如节奏、旋律、和声等,生成独特的“指纹”)和视频内容分析(分析视频画面的内容、情感和节奏,转换为可比较的嵌入向量)技术,自动为视频选取较匹配的背景音乐,并根据视频内容的关键点(如场景转换、重要动作等)调整音乐的播放节奏,实现音乐与视频内容的协调。
2)关于视频人声,使用先进的VITS(对抗性学习端到端文本到语音条件变分自动编码器)模型技术,使生成的旁白更具逼真的拟人相似度。
因赛集团二十余年沉淀的智慧资产成为InsightGPT坚实的数据基座。通过大量的行业和业务数据、专业方法论以及开源和自研算法的有机融合并持续训练,InsightGPT生成的创作内容已经越来越贴近行业的标准,正在渗透并赋能营销全链路,离真正商业化落地的距离也越来越近。
在过去一年多的时间里,AI正以快速的学习能力和超强的理解能力重构不同行业的服务流程,营销、影视、游戏、教育、医疗、金融、零售、制造等行业一定数量的企业已公开宣布将拥抱AI。从实际应用来看,AIGC在营销行业中的落地较为直观和明显,更高质量、更有创意、更具专业水准的文生视频功能和产品,将开启一个全新的商业时代。
InsightGPT文生视频应用产品发布后,相信商业化的步伐也会越来越快。未来,InsightGPT会继续提升市场洞察力、创意表现多样化、视频角色一致性、文案匹配度以及音乐渲染等方面的产品能力,拓展营销业务场景,满足各类品牌与中小商户多场景下的营销需求,以AIGC的创新驱动力,为用户全面提升营销效率及效果。