编者按:本文来源创业邦专栏作者投稿,文歪道道。
“一个成功的机器人,其实就是一个特别好的'人',它美丽且让人着迷”,Quartz工作室聊天机器人的一位开发人员这样说道,2016年Quartz在FacebookMessenger、企业协作工具 Slack上推出了聊天机器人Quartzy。
不过,2016年Facebook Messenger开放其程序接口后,收到的用户反馈却不及预期,随着2018年年初,Facebook关闭虚拟助手「M」,聊天机器人进入一个消沉期。
但纵观聊天机器人走过的这近70年历程,现阶段的消沉实质上更多的是重新蓄力、找寻方向。去年11月,微软宣布,与聊天机器人创业公司XOXCO达成收购协议,而腾讯依旧加码打造自己的智能客服。据《2019年AI状态报告》显示,目前最流行的AI用例依旧是聊天机器人。
尤其近期,利用全息投影生成的虚拟人物正欲掀起聊天机器人的新热潮。
“虚拟生命+智能语音”,更贴近真实自然的交流?
能像人一样自然聊天的机器人,一直都是研发者所追求的目标之一,但这是一个漫长的过程。
目前我们看到,各大互联网科技巨头和人工智能企业所选择的方向都不尽相同。谷歌、微软、百度等在语音识别处于前沿位置的技术公司,致力于复杂语言的识别,以改变当前尴尬的用户体验,而Facebook、苹果等纷纷投入资金,欲将通讯平台打造为与网络互动的全新方式。
不过殊途同归,尽管选择赛道不同,也存在一些普遍化趋势共同作用于行业进步,比如智能助手的形态,有不少公司在探索智能语音助手的可视化之路。
去年4月,在SXSW 2018展会上,三星推出了一款新型智能音箱原型产品Aurora,采用可放置兼容智能手机的底座,把手机放进去,显示屏能够投影出一个全息式的动画角色。7月,微软在北京召开了第六代微软小冰年度发布会,首次将小冰的外形替换为了全新的3D模型。无独有偶,即时通讯巨头Line也在去年公布了拥有全息形象的智能助手—Gatebox。
这款产品由日本公司Vinclus开发,利用全息投影在玻璃内呈现出一个名为Hikari Azuma的二次元人物,满足了日本宅男和二次元“老婆”一起生活的幻想。
国内公司也很快地察觉到此类市场的发展前景。来自深圳的欧博思智能科技有限公司,近期打造了一款结合智能语音技术的虚拟机器人产品AI BOX,其虚拟形象“小欧”可以帮助用户传输视频、播放媒体、家居控制和聊天交流等,满足用户对智能生活的需求。
为什么智能助手的可视化成为众多语音智能公司的探索方向?一方面,具体的、可视化的虚拟形象,能够让用户与机器的语音交互显得更加自然真实,另一方面,对于聊天机器人而言,虚拟形象也进一步增强了产品的陪伴感。正如欧博思的产品理念:以一种感性视角去改变智能科技带给人类的消极影响,让人与机器的关系变得更加紧密、更加温暖。
当然,我们也必须清楚地认识到,智能助手的可视化,实质上也是为了弥补为技术桎梏所受限的交互体验。
助力语音交互场景化?
可视化虚拟形象带给用户的感性体验不可或缺,但前提也要建立在切实的性能提升之上,从实用性角度出发,虚拟生命与智能语音的融合是一次积极的探索。
首先,虚拟形象除倾听和语言交流之外,其本身的功能也在增多,比如舞蹈、唱歌、写诗等等,这些“能力”在不同场景下以不同形象、不同的表达方式向外传达,不仅带给用户极大的新鲜感,而且增强了用户的感性体验,也更贴近正常人交流的模式。
在这方面,微软小冰可以说是其中的佼佼者。除了演唱以外,在原本专属于人类“创意”的领域,小冰能在短时间内自主产出有声读物,支持定制化声音,还可以与人类协同写出诗歌,甚至自己写词作曲、生产歌曲。微软曾提到,小冰目前拥有6.6亿人类用户、1.2亿月活跃用户,覆盖57种直接用户场景。
其次,相比于一般的智能语音硬件,可视化的虚拟生命通过麦克风阵列、摄像头进行对象捕捉,能够综合感知用户的意图和需求,在此基础,让产品性能在不同场景发挥更佳的体验。
以AI BOX为例,欧博思拥有一套自主研发的视觉、语音及动作合成系统,可通过对象捕捉、人脸识别、生物模仿等方式将自然语言转化为AI语言。这一技术集成到AI BOX上,能够让其更加智能和贴心。
比如,AI BOX拥有非常丰富的表情反馈和角色动作,在与用户倾心交流时,可适应不同的情况。闲暇时,AI BOX通过所掌握的用户使用习惯,推给适合用户口味的音频节目,如音乐、故事、相声等。另外,日程提醒、会议记录、开启智能家电等基础性功能,在可视的虚拟形象的操控下更显人性化,进一步提升了用户的交互体验。
长期来看,欧博思利用虚拟形象和周边世界进行多模态真实互动,未来有可能针对用户行为习惯,形成不同的性格体系,这其实有助于解决聊天机器人的个性化配适之痛。目前,聊天机器人的交互主要基于语音识别的基本架构、声学模型、语言模型并进行解码,而真正通过用户画像来实现个性化适配的少之又少。欧博思或许有机会尝试。
虚拟形象的新玩法
科技公司追求聊天机器人的可视化,不仅仅是出于弥补交互体验或提升产品性能,其实虚拟形象本身的外观、性格设定以及可养成、可进化的超次元属性,对消费者而言就是巨大的吸引力。
在这方面,目前推出虚拟机器人的公司,选择的实现方案或产品定位都有所不同。
比如Line发布的Gatebox,其虚拟形象是标准的二次元少女,女仆造型、软萌的声音都意味着产品的受众主要是单身宅男群体。而欧博思的AIBOX,独特之处在于其虚拟形象的自定义玩法,就是可以根据用户自己的喜好,自由创建属于自己的虚拟人物,可以是二次元人物,也可以是一些经典角色的再造,甚至是创建自我形象。
这一功能的实现,主要得益于AI BOX采用的P2A建模技术生成角色模型,通过提供上千种人物肌理、道具服饰以及100+的人物特征或个性设置,给用户创建角色提供了更多样的选择。而且这种自由度也代表AIBOX的消费群体比Gatebox更加大众化。
可以想象,随着虚拟机器人赛道的入局者增多,虚拟形象的构建和生成也会更贴合用户需求。
“我们可能都希望能生活在这样的世界里:和机器人有着最自然的对话,它将一切任务都执行得完美无瑕”,虽然这种状态还未实现,但我们正在无限接近。
歪道道,独立撰稿人,互联网与科技圈深度观察者。同名微信公众号:歪道道(wddtalk)。谢绝未保留作者相关信息的任何形式的转载。
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。