输入法竞逐AI“新赛道”,旧有认知被颠覆后行业走向何方?

关注
百度
北京人工智能
综合性搜索引擎
最近融资:二次上市|239.40亿港元|2005-06-06
我要联系
大多数人看来已经十分成熟的互联网产品——输入法,躁动还在继续。

416985846417108029.jpg

编者按:本文来源于微信公众号科技向令说(ID:xiangling0815),作者曾响铃,创业邦经授权转载。

大多数人看来已经十分成熟的互联网产品——输入法,躁动还在继续。

1月16日,百度输入法搞了一场名为“AI·新输入 全感官输入2.0”的发布会,发布了其宣称为“国内首款真正意义上的AI输入法”的百度输入法AI探索版,百度高级副总裁王海峰表示,“百度输入法将扮演好沟通桥梁的重要角色,让人机交互进入一个全新的阶段”。

该输入法是一款默认输入方式为全语音输入,并支持表情、肢体等进行所谓“全感官”输入的输入产品。看起来,百度想要凭借一贯的AI技术优势来获得输入法市场的突破,而用“沟通桥梁”来定义,也说明百度尝试在“输入”二字上进行新的玩法探索。

事实上,AI与输入法的结合并非什么新鲜事,闹出过“6亿用户”笑话(吹牛被识破)的科大讯飞就经常把AI技术挂在嘴边,去年12月还推出了由所谓“讯飞超脑计划”加持的讯飞输入法。

被外界认为优化空间越来越小的输入法产品,开始从AI上找突破的机会,也惹得各路豪强争相竞逐。而AI的介入改变的可能不只有“输入”,或还有整个“输入法”的固有认知。

成熟的输入法市场,用户需求带来革新动力

AI被深度应用到输入法,与市场需求剧烈变化而目前多数产品形态仍然老旧有直接关系。

首先,是主体移动互联网人群在语言输入上有典型“混合化”需求:

不同汉语语系的基本的语法不断融合,如北方语系“你先走”,到了广东、香港南方语系,就变成“你走先”,如果是华人,则还有“你先走先”这样的混合用法;

与此同时,包括四川话、长沙话、东北话等特色地区方言逐渐得到大众认可,jio(脚)之类的语音开始混用;

部分走向精英化,或者出于特定社交目的的人群,中英夹杂成为常态,“我不care”、 “Emma,我觉得的这个idea真的很amazing”,诸如此类在输入情境中出现得越来越多。

其次,是移动互联网人群进一步下沉,让产生输入的“需求错配”。

张小龙说55岁以上的中老年人在微信用户中占据了可观的比例,事实上,包括微信在内的需要大量使用输入法的移动互联网产品向低线城市、农村的中老年渗透是不争的事实,这些用户一方面不懂常规输入操作,另一方面作为“新网民”又对输入需求更为迫切,需求产生了错配。不巧的是,这些人当中,方言习惯又占了绝大多数。

最后,就是所有互联网产品都在津津乐道的95后、00后新新人类,他们随着时间的推进逐渐占据移动互联网主舞台,不喜欢陈旧的事物、总是在追求新奇体验。

不是说“老产品”输入法就一定不得他们喜欢,只不过,抓住这些新新人类需求容易形成新的竞争优势。

带来多样性与创新性,AI技术成输入法“香饽饽”

总的来看,变化了的“输入”需求并不一定都需要AI来解决,但AI无疑最具备多样性与创新性可能。

如开篇所言,靠技术发家的科大讯飞对输入法AI应用最为积极,2018年6月其推出的输入法版本号称可针对嘈杂环境进行智能降噪,在主动转换后能支持多种方言输入,且可以中英混合识别。此外,还推出所谓“同音字词智能分辨”,可以判断“他”、”她“、”他“等。

作为输入法领域占据先发优势的玩家,搜狗也不忘在AI上下功夫。CEO王小川2018年开年强调AI赋能输入法与搜索,要“通过AI技术大力发展语音、对话、翻译”,随后,搜狗AI技术的重心放到了可以直接带来营收的翻译机硬件上,翻译宝Pro的42种语言实时互译,在输入端加入了语音识别支持。

而以AI技术立身的百度自然也不会放弃用AI获取输入法竞争优势的机会。只不过,百度的玩法有些不同,这次发布的“AI探索版”干脆把默认输入方式改成了语音输入,表情、肢体的全感官输入很明显是要把AI当做“主业”来搞,而不只是提升准确性的辅助技术。

百度的做法,与AI技术的属性密切相关。原本AI就是要读懂人类的语言、识别人类的命令并做出相应的反馈,而AI获得信息的方式有很多种,它们都可以看作是“输入”,用户原本也有很多对移动终端的“输入”需求,而不只是文字信息。

例如,早期的输入法以字符输入为主(用户敲键盘,如同码代码),到后来语音输入大行其道(用户只需要用口说),现在,百度推出的输入情境下的拍立活(让用户通过自己的动作“驱动”对方做出相同表情)、AR表情(为用户自拍添加背景场景)、凌空手写等AI功能,其实就是沿袭AI技术本身的特性,在输入的方式上进行了某种“维度”提升,用户可以照照自己、照照某些东西就可以进行“输入”。

全感官输入的意义,无非是让用户通过“输入法”输入的信息,在文字之外还有更多选择,从这个意义上说,AI既是输入法们提升产品多样性和创新性的技术手段,反过来它本身的属性也给出了输入法打破旧有“文字信息”桎梏的路径。

也由此,百度输入法这个所谓“AI探索版”,先不论实质内容是否有价值,至少在模式上给出了AI输入法样板。

除了创新,输入法AI竞争还需要抓住用户需求的“细节”

输入法是不太起眼却又让用户离不开的“小产品”,由此,应用AI技术进行竞争除了理念与方向,在具体操作上对细节的关注可能更能俘获用户。

1、准确性提升是永恒的主题

如同手机跑分一样,准确性不论何时都是检验输入法能力的硬指标。时至今日,输入法的准确性提升已经是“高位榨取”的过程,变得越来越极致也越来越难。

例如,讯飞喜好宣传其语音输入的准确率,据称已经提高到98%,并且1分钟可以输入400字,搜狗也有类似的准确性宣传。而百度此次之所以敢推出全语音输入,除了用户需求,更在于其所说的“突出业界的语音技术”。

百度输入法发布了在线语音的“流式截断多层注意力建模”(SMLTA)技术,按其说法,是“世界上首次实现了局部注意力建模识别精度超过全局注意力模型”,以及“世界上第一次大规模部署在线语音交互注意力模型”。该技术可以解决传统模型存在的“时延性”问题,百度方面宣称其“将在线语音识别精度提升了15%,超越行业最高水平15%”。

2、一边是5G时代到来,一边更应关注“没网”的需求

刷短视频、聊微信、打游戏、购物……这些地铁族的标配,其实隐含了输入法的另一个需求:如何解决旺盛的离线识别需求。

5G时代的脚步越来越近,但列车、电梯、隧道、高密度人群(例如春运的火车站)环境下,网慢、无网给语音输入提出了更严峻的挑战。而越是断网的场景,用户对输入法的需求其实越高,在写字楼网络好的场景其使用频率反而降低(工作等原因)。

由此,AI语音离线识别近来成为输入法产品争相打造的技术。搜狗就宣称其可以实现4国语言离线翻译,而百度则盯住Deep Peak 2系统进行优化尝试解决用户多元输入场景的需求。目前,在地铁、电梯、隧道或人流密集等离线场景中,百度输入法仍然可实现精准的语音输入,官方称“高于行业平均水平35%”,从这次发布会的一段各输入法即兴离线语音识别PK来看,百度输入法的确占优。

3、只有一个产品,却必须满足极端多样化的需求

诚如前文所言,在中文环境下,输入法不得不面临多样化的输入需求,方言、英文、不同语法……而输入法不可能为各地、各用户群分别开发,由此,如何更好地同时兼容各语言,成为输入法“体验”的重要环节。

例如,方言识别已经是多数输入法的“标配”,然而,由于技术的限制,用户往往还需要一个“进入”方言的切换动作,一方面这与互联网尽量简洁的产品思维相悖,另一方面对很多对电子产品不熟的下沉用户而言形成了天然阻隔。

这给了百度输入法机会,其“方言与方言、方言与普通话的混合语音输入”技术,目前实现了无缝切换,用户可实现“自由说”。与此类似地,中英文夹杂亦可来回切换。目前为止,百度输入法应当是市面上唯一实现了高精度中英文混合语音输入、方言免切换语音输入的输入法产品。

AI技术PK后,输入法还有你想象不到的“新机会”

客观地说,在AI技术浪潮下,上述技术革新带来的细节体验,相信各大输入法一定会尽快补齐,毕竟产品目标摆在那里,去实现就行了。

然而,从这次发布会来看,百度输入法或还“留了一手”,AI输入法样板的聚焦点可能不只有AI,百度还意图颠覆关于输入法的旧有认知,为输入法应用打开新的应用场景与商业可能。

从百度输入法AI探索版新交互、新表达、新探索三大产品主题来看,其试图结合用户需求、互联网产品理念、AI技术趋势等大环境,颠覆输入法三个固有认知:

1、"输入法只是C端产品“

输入法当然是给普通用户使用的,它是最成功、最普及的C端产品之一。不过,视频维度的信息输入可能为输入法打开了新的商业空间大门。

百度输入法AI探索版的拍立活、秀场,需要平台提供特定的元素配合。百度海外输入法曾经与超级IP《变形金刚》系列首部独立电影《大黄蜂》联手推出“大黄蜂”系列主题贴图和AR表情,此外,还与Hello Kitty、小黄鸭、小王子、格林奇等全球100余个知名IP达成合作,推出IP皮肤和表情。

在此基础上,百度输入法针对海外用户还设计了本地网红合作推广等定制化传播,而这,可能就是搜狗输入法等产品一直梦寐以求的变现路径,有了B端合作的可能。

2、"输入法是工具产品“

用完就扔,召之即来挥之即去,输入法做个最普及的“工具产品”倒也没什么,但是偏偏全感官输入给输入法撕开了一个贴合当前移动互联网内容需求的口子。

不久前,微信力推朋友圈的小视频功能,用户可即时拍摄视频分享。很明显,社交+泛娱乐(尤其是短视频)成为各家都在争抢的潜力领域,头条系、微信都试图往对方领域渗透。

而“全感官输入”一个讨巧的地方就在于,类似AR这种应用,让一对一聊天和群聊环境下,用户可以直接发出类似小视频的内容进行共享,实现小视频社交的目的,这就是大佬们都在追求的社交与视频融合。

不过,目前来看,AR应用只处在增强输入体验阶段,社交泛娱乐产品只是未来的想象空间。

3、"输入法只能用来PC、手机输入“

最早的汉字输入还需要专门的“汉卡”硬件,到后来PC时代开始进入软件化,移动互联网时代更是带来多种便捷输入体验。

现在,这一进程还在继续,输入法或将有脱离于PC、手机的可能。

百度输入法AI探索版的“新探索”推出了凌空手写,用手指在摄像头取景范围内的空中手写,输入法即可识别并生成文字。乍看这是利用手机摄像头和AI技术的一种新奇玩法,而事实上,这意味着输入法有了脱离PC和手机的机会,比如,在目前已有的案例中,百度输入法凌空手写技术已经在小寻手表、小天才电话手表上得到应用。

这意味着,凌空手写或类似的AI技术,有可能将输入法可导入到更多智能终端当中,为输入法打开完全不一样的场景新天地,同时推动智能硬件的体验更新。

拭目以待吧。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。


来源:科技向令说
反馈
联系我们
推荐订阅