互联网的发展让越来越多的用户信息上传到网上,我们在享受便捷的同时,也面临着各种安全隐患,尤其涉及钱财时。
在给用户带来不良体验的同时,创业者们也很困扰。如做社交工具的,需要清理虚假账户;淘宝等电商以及大众点评等点评类工具及平台需要防范刷单、冲冠、刷好评等行为;银行金融类平台需要防范盗卡盗刷、数据泄露等交易行为……
来自微软硅谷研究院的谢映莲和俞舫,在美国期间就一直从事技术安全防范方面的工作。2013年,她们创办了DataVisor,通过人工智能及大数据技术帮助企业提供欺诈行为的安全监测服务。
DataVisor总部位于美国硅谷山景城,2016年,开始进入中国市场。2015年10月,DataVisor宣布获得由GSR(金沙江创投)与New Enterprise Associates领投的A轮融资。2016年5月,获得元生资本的B轮融资。
1
简单来讲,DataVisor通过人工智能技术为各行业创业公司,提供针对可疑用户和各种欺诈行为的安全检测服务,他们的主要客户群体包括各类社交网站、游戏网站、互联网购物及金融平台。
从2016年底,进入中国以来,服务了包括中国阿里巴巴、陌陌科技、猎豹移动、豆瓣等在内的多家大型互联网公司。
其实像阿里巴巴这样的大公司,公司内部本身是有安全部门的,但是谢映莲告诉创业邦,欺诈者的手段是不断进步的,而且总有能绕过防线的欺诈手段。这里边最大的痛点在于,以往的机器学习技术都是需要知道攻击长什么样子,才能去抓那些东西,对于新手段就很难去应对,所以存在滞后性,只能抓过去的攻击和过去的坏人。
与这种技术算法不同,DataVisor基于Spark大数据平台开发了一种“无监督检测算法”,该算法最强的地方就在于它有一些自动应变的能力,可以自动发觉一些潜在的新型攻击,不需要知道它已有标签,对于新型的欺诈行为可以提前预警并自动化解,目前DataVisor团队在这一块已经有很多专利。
2
谢映莲告诉创业邦,以往的监测技术往往都是孤立地从单一用户的具体行为特征进行分析,但是这套“无监督检测算法”的主要工作原理是通过对成千上万的用户行为数据的监测,分析他们之间的关联特征,从而来找出哪些用户最后是欺诈用户。
谢映莲说,基本上所有大的平台的欺诈其实都是批量型的这种行为,地下有一个产业链,它觉得你这有一个什么漏洞,就会发起一波攻击。而在这个情况下,好用户是比较无序的,每个人有不同的行为轨迹和路径,只在某些偶然事件上会相交,但是那些欺诈者他们实际出发点是很近的,所以关联性会更强,更容易监测。
所以,DataVisor需要从几十亿的用户中去寻找这种强关联的用户群,在这个基础上进一步区分它是正常的关联,非正常的关联,把非正常的关联自动挖掘出来。
而这么做的挑战性在于,要把所有用户放在一起看,这个计算复杂量很庞大,需要挖掘用户和用户之间的关系,把成千上万上亿几十亿的用户全部放在一起,因为它计算量大,所以也是近几年才能做到,这也是DataVisor的壁垒所在。
这个运行过程需要既要有非常高效的算法,也要有大数据的框架支撑,而且工程的实施也要很高效,因为有的时候要实时判定,所以最主要的复杂度,这个技术壁垒在于这个东西你要做得很准确,你不能误杀。
3
DataVisor 在运行过程中需要每小时对新发生的10亿数量级的事件进行分析,自动判断并发现潜在的恶意攻击。这一算法并非基于标签或者机器学习的数据,目前正在申请专利。
截止目前,DataVisor全球累计处理超过6千亿的用户事件,检测超过1亿3千万的恶性用户,保护超过20亿全球互联网公司。其中包括中国阿里巴巴、陌陌科技、猎豹移动、豆瓣和美国Yelp点评网、美国游戏公司IGG、图片社交软件Pinterest等。
DataVisorCEO兼联合创始人谢映莲是微软硅谷研究院的资深研究员,曾为微软开发一系列的互联网安全和反欺诈技术,如Hotmail、Xbox和Bing等,均应用于微软的支付平台。此外,DataVisor研发人员大概一半以上是名校的博士生学位。