性能提升100倍,硬件成本降低10倍,Zilliz成立近2年,竞争对手却只有3家国外公司

关注
大数据
广东企业服务
一家大数据信息企业
最近融资:|2014-09-19
我要联系
已获数千万元天使轮融资

Zilliz创始人兼CEO:星爵

创业之前,星爵在数据系统行业巨头甲骨文(Oracle)公司总部工作多年。

星爵负责数据库系统的核心研发工作,他和团队研发的Oracle 12 c多租户数据库(OracleMultitenant),采用多租户管理的理念,通过可插拔式结构实现数据库集群的动态管理,成功实现在公有云或者私有云上提供数据库服务,是Oracle数据库在过去10年里最具颠覆性的创新,迄今已经为公司创造了超过10亿美金的营收。

数年后,随着人工智能第三次浪潮的到来,与数据常年打交道的星爵觉得创业的机会到了,于是辞去令人艳羡的工作,于2016年3月创办Zilliz。2017年12月,Zilliz完成云启资本领投的数千万天使轮融 资。

官方显示,Zilliz专注于人工智能技术和大数据技术,并研发新一代智能数据处理平台,翻译来说就是做基于GPU硬件加速的新一代OLAP(联机分析处理)数据库系统,应用领域包括了金融、游戏、电商、物联网、零售、电信等领域。

第四代数据库顺势诞生

数据库承担的功能是存储和计算,可分为交易型OLTP(On-Line TransactionProcessing)、分析型OLAP(On-Line Analytical Pracessing)两类。而Zilliz做的事属于后者,但Zilliz是第四代数据库。

之所以把Zilliz称之为第四代数据库,是因为在此之前的数十年时间里,数据库已经经历三代迭代发展。

大概在上世纪80年代到2000年之间,以甲骨文、Teradata等为代表的第一代大规模数据库,承载了那个时代的大部分数据业务。以甲骨文为例,其产品既有OLTP,也有OLAP。其能把企业大数据用一种方式存储起来,但缺点是只能存储在EMC这样高端的专用硬件上,服务价格昂贵,每个节点要花费400多万

互联网的兴起带动更多高性价比产品的出现,随之第二代数据库出现,代表产品有Hadoop等,这类数据库为分布式存储数据库,此时数据已经不需要存储在专有硬件上,普通的X86服务器即可。这类数据库的出现大大降低了成本的同时,各个计算节点的数据独立存在本地硬盘上,互相之间不共享,计算时将任务并行分散到多个服务器和节点上,同样,它的缺点在于这样的形式远不能满足大规模扩展下的数据分析性能需求

在2005年左右,市场出现内存数据处理第三代数据库,简单来讲是将数据存储和分析在更高速的内存上进行。这一代数据库的代表包括有HANA和MemSQL等。由于内存的数据访问带宽和速度远超磁盘,内存数据库在性能上有极大的提升,此时计算处理的速度成为了新的瓶颈

而如今,随着大数据爆炸式增长,CPU处理器更新迭代的速度未能呈现如摩尔定律预测的定期翻倍,于是具有数量众多的计算单元和超长流水线、具备强大并行计算能力与浮点计算能力的GPU,成为深度学习模型训练的标配。

从这些发展态势上,在数据行业工作数年的星爵发现,GPU性能改进的速度曲线,跟爆炸式数据增长的曲线非常吻合。而这一时期,市面上存在的数据库解决方案并不能满足用户日益增长的对数据分析的速度和性价比要求。

除此之外,数据的存储和处理与人工智能处理之间相互分离,分析师和数据科学家有将近70%的工作时间被浪费在数据的ETL上。

“这个时间点是时候出现基于GPU硬件加速的新一代OLAP数据库系统。”

之所以如此确定做这件事的价值,星爵回忆了中国2C产品历程,他认为中国2C市场已经超过美国并带动全球2C产品的发展,这一领域出现了像阿里巴巴、腾讯这样的高市值公司。而中国的2B市场足够大,且尚处于等待阶段,将来会和2C市场一定引领全球2B市场的发展。

“有这样的机会,我是中国人,干嘛不回来做这件事?”

工程师文化带来产品的卓越

星爵似乎天生对数据敏感,一路走来几乎都在与数据打交道,其曾就读于美国威斯康星大学麦迪逊分校攻读计算机硕士学位,毕业加入了数据系统行业巨头公司甲骨文工作,从事数据库系统的核心研发工作。

也许正是在美国硅谷多年的工作经历,让星爵在产品的打磨上有更高的要求。

其第一代产品成型,整整花费了团队一年零三个月的时间。到了2017年8月,Zilliz拿到云启资本等资本的天使轮融资后,Zilliz才渐渐进入投资人和媒体视野。作为一个典型技术出身的理工男,把技术和产品做好是他前期一门心思要完成的事。

在星爵心中有一个理念,那就是要做以技术和工程师驱动的团队。

在过去的一年多时间里,星爵称,整个产品的研发都由自己亲自带着团队在做,对技术的要求几乎到达变态的程度,“哪怕是每一行代码,都要求及其严格,”星爵补充。

而对程序员的选择上更是“吹毛求疵”,据其工作人员称,一个岗位的面试一般在100人中选择一个合适的人选,也即录取率为1%。 而目前,公司员工不到20人,大部分为技术人员。

还好,第一代产品并没有让星爵和团队失望。

和内存数据库比,Zilliz的OLAP性能提升了30至100倍,硬件成本降低10倍,能耗降低20倍;和实时人工职能处理系统相比,人工智能处理性能提高5至30倍。

而目前这款产品支持基于英伟达的GPU的解决方案,Zilliz已经选择银行、政府、互联网等领域相关企业进行产品测试。从今年8月开始,Zilliz已经着手第二代产品研发。

“接下来还会结合用户实际需求,做一些快速落地的产品,”星爵补充。

Zilliz成立于2016年3月,于2017年12月完成云启资本领投的数千万元。竞争对手包括了美国的Kinetica、美国的MapD以及以色列的Sqream。

作者:L,关注前沿科技领域,报道有趣的、有商业价值的公司、产品以及相关的人和事。 邮箱:lili.li@cyzone.cn

- END -

MORE | 更多精彩文章

商务合作请加微信:bangcbd

推荐邦哥的好朋友“毒舌科技”, ID:dushekeji

反馈
联系我们
推荐订阅