对于不是英语或特定语种专业出生的普通大众而言,一篇无一丁点母语的长篇大论甩你面前时,首先想到的是谷歌翻译,百度翻译,然后翻出的句子连不起来啊,还是不懂,接着瞬间满脸蒙哔了是不是?
如今得益于人工智能、深度神经网络学习、大数据等的快速发展,翻译已逐渐被颠覆。机器翻译能模仿人脑“理解语言,生成译文”。
其准确度、流畅度都得到大幅提高,甚至达到“译文流畅,符合语法规范,易于理解”的状态。再拿到一篇陌生语种的文章时,不会出现看不懂的情形。
所以,“未来人工智能解决语言障碍就像水电一样去融入人们的生活,成为生活的一部分,甚至感觉不到它的存在”,Atman的创始人兼CEO马磊这样对创业邦(微信搜索:ichuangyebang)说。
Atman是国内少有关注机器翻译并追求自动化的一家创业公司,2016年6月18日正式运营,目前已获得北极光天使轮投资。
十年机器学习经验,两进两出微软,后创办Atman
在互联网圈做算法的“攻城狮”们是令人佩服的,他们身上也拥有了典型的理科男特质:简单、淳朴。初次见到马磊就是这样,谈话间不会用过多华丽的辞藻形容自己的公司,自己的团队。一个多小时的采访基本被十年多的工作内容和对行业激情占满。
马磊,清华大学计算机系毕业,曾在微软研究院和微软搜索中心供职过,在后者担任Cortana及相关产品构架师,专长是机器学习。曾完整撰写过语音识别、统计机器翻译(SMT)的解码器(Decoder)代码。有丰富的Bing搜索的海量数据做传统和深度机器学习的经验。
第一次离开微软是为了创业,也就是10年前出来做基于内容搜索的在线教育,当时的他想,一个工程背景很强、对算法清楚的人,不会跨越不了研究、产品运营推广等这些阶段,但事实证明,还真没跨越过去。
再次回到微软后,马磊吸取创业教训,来到工程院搜索技术中心,在产品部门待了三年多,潜心学习。也是在这期间,认识了如今一起创业的团队成员,他们之间对彼此的品质了如指掌。
这其中就有Atman的CTO刘炜,毕业于北大电子系,擅长工程实作和团队管理,思维稳定细致。马磊告诉创业邦(微信搜索:ichuangyebang),“其实一开始刘炜是不愿意创业的,被我天天浇水,有天开花了就出来一起干了”。
第二次离开微软后,马磊创办了Atman,已经有着10多年的机器学习经验,带着微软的文化基因,对二次创业可以说做了充分的准备。
Atman的核心:解决翻译的流畅度
生活中我们所熟知的好点的翻译工具无非是谷歌翻译、百度翻译,但当你使用的时候,会发现一个问题:即便你有一定的语言知识,这类工具翻译出的句子依然是晦涩难懂的。它需要我们对句子重新进行组合,以便符合人类的感知行为。这其实超过50%的工作需要我们自己完成。
更别说一些专业领域,比如医药、法律等,都是人工在翻译,因为目前不存在机器翻译可以胜任这样一份工作。
所以,不同于这些做广谱翻译的大公司,Atman的翻译平台目的在于打通翻译的障碍,平台不分语言,只要有数据,机器就能自己学习。机器从0开始进入一个领域(零成本进入)也只需要2周时间。所以,进入哪个领域都能高度垂直的做下去。
比如,财经类文章翻译,世界好的财经网站的文章总和不超过1000万篇,让机器学习一遍这些文章,就可以保证财经类文章的翻译有95%的流畅度,而且能做到实时同步。而这一过程,机器模型自身也会变得越来越好。
马磊很开心地表示,你以前用谷歌的翻译,能把人工降到50%(可能还没一半),加入我们平台后降到10%,不用再疲惫地去看网页翻译,阅读的心情都不是一个量级的。
当然,他也坦言,“我们期望人尽量少去对翻译出的文章进行编辑,但现在完全取代人还不可能,毕竟人类的感情、情绪、隐喻的东西对机器而言还是有难度的,但未来应该可以解决”。
所以,在马磊眼里人工智能时代,商业模式是会被颠覆的。
目前,Atman针对C端用户有一个“量子镜”项目计划。目标是精选国内用户会感兴趣的国外高质量内容网站,通过机器翻译技术,提供翻译后的中文内容给国内用户阅读(按照目前单机的翻译速度,镜像一个百万文章级别的内容网站,需要一个月左右时间)。
而对于B端用户:机器翻译主要对某个垂直领域进行翻译。另外,接下来几个月计划开发智能的CAT软件,以辅助B端客户做最终的人工校对。
为什么是Atman而不是巨头在做这件事
世界上能写成文字的语言大概有300多种,它们就像互联网里面的一个大群,这些群目前还没有沟通,相当于信息孤岛(语言障碍)。而机器翻译能把信息孤岛连接起来,之后整个世界就可以像微信朋友圈那样了。
而10年前,一家公司流畅性地翻译全世界的语言,有人感想但做不到。因为根本没有技术基础可以进行突破。
如今,人工智能的快速发展让这一想法得以实现,但世界的公司都处于这样优越的条件,包括很多世界级的巨头,为什么偏偏是Atman这样的创业公司先发制人?
首先:团队,人才没有区别,但从项目投入的人力资源上反而比大公司好,因为大公司审批机制比较落后。
第二:项目进度,立完项目,创业团队所有人精力都会搭在这个项目上,单点项目上绝对人数比大公司多。
第三:马磊认为创业公司狼性文化更强,这点很重要
第四:资金投入,大公司关注所有项目,单点的投资就不如创业公司。
但马坦言,像Atman这样的创业公司在方向性上的风险更大,对于大公司而言,无非白投了。而对于创业公司,可能意味着人员重组或者更严格的变动等。
但不管怎样,马磊告诉创业邦(微信搜索:ichuangyebang),“至少从技术角度,在垂直领域翻译这块Atman是第一梯队的”。
BLEU评分也证明了这一点:
(政治领域的机器翻译和主要翻译服务提供商的评分)
注:BLEU评分是国际上通用的客观评测机器翻译质量的指标。