创业邦获悉,中文少儿分级阅读平台考拉阅读完成2000万美元B轮融资,此轮融资由GGV纪源资本和XVC共同领投、启明创投和CMC华人文化产业基金跟投。据考拉阅读CEO赵梓淳介绍,本轮融资将用于深化底层技术和扩大用户数量。
考拉阅读APP
考拉阅读成立于2016年9月,依托自主研发的中文分级阅读系统ER Framework,将中文文本按照难度进行量化分级,并匹配学生不同的阅读能力,进而提供个性化的阅读内容及语文学习解决方案。
在教育市场,英语和数学教育培训相继成为红海赛道之后,长期不温不火的大语文教育借势新高考改革成为创业者和资本瞄准的下一个教育蓝海。光大证券的一份行业研究报告预测2018年中小学语文培训市场规模可达900亿元。
今年年初,全国17个省市启动了新高考改革,在改革方案中,语文学科被更加重视。阅读理解、写作的广度难度增加,语文核心素养要求提升,也就意味着学生长期的阅读积累将会直接影响语文成绩。
一、什么是分级阅读?为何重要?
分级阅读是指是按照学习者不同年龄段的智力水平、心理发育程度,以及语言水平而专为学习者提供的科学阅读计划,为不同水平的学习者提供有针对性的读物。
在中国,中文分级阅读尚属起步阶段,相比而言,美国等欧美国家已经制定出一套完整的分级阅读标准比如蓝思分级(LEXILE),由此也催生出一系列估值过亿美元的分级教育产品公司,例如Renaissance、LightSail等。
国内也有分级阅读的尝试者,但大都是依照英文阅读分级标准,在英文阅读领域进行实践。2017 年8 月,美式少儿英语分级阅读平台读伴儿宣布完成2400 万元Pre-A 轮融资,由鼎晖投资领投。51Talk、哒哒英语、VIPKID 等在线英语平台也纷纷披露了与英文分级阅读相关的产品计划。
对于中文分级阅读的尝试一直因为中文的复杂性和应用的极大灵活性而困难重重。
首先英文以26个字母基础组成单位,但中文仅常用字就有3500个,复杂构成的稀疏性导致分析时往往需要更大规模的语料。
其次英文和中文的基本表意单元都是分词,但是汉语的分词工作难度更大,英文根据空格就可以很好地确定词语边界,但中文并无这样的句法标志。所以机器在理解汉语的第一步上就遇到了很大的问题,在随后的词性分析、语言模型等方面都会遇到更大的困难。
在句式结构上英文更加严谨,有着明确的语态(单复数、时态、主被动等),而中文的行文风格相对随意,嵌套结构比较混乱。
正是因为这些原因,中文分级阅读在国内一直处于空白阶段,但是能针对这些难点提出解决方案的公司也势必可以建立竞争壁垒。
二、依靠AI和大数据,考拉阅读成为中文分级阅读的先行者
考拉阅读汇集了机器学习、语言学、心理学三方面人才,区别于传统以年龄、年级划分,推荐书籍的简单粗暴标准,考拉阅读从AI和大数据角度做分级阅读,依靠技术解决问题。
- 利用AI技术,特别是深度学习技术,如循环神经网络(Recurrent Neural Networks ,RNN)、长短时记忆网络(Long Short-Term Memory, LSTM)等),从更高维度建立特征(英文分级大都在5个特征以下,而考拉分级标准采用数十维特征向量),从而弥补了中文在字词分析、句法分析、语义理解等方面的劣势。
- 通过互联网平台系统收集用户使用数据,不断地更新ER framework的系统参数,从而可以使难度感知更精确,推荐更符合真实使用场景。
赵梓淳对创业邦说中国的阅读教育的痛点在于:第一、学生们不知道该看什么书,市面出版的童书质量参差不齐,虽然有各种不同的书单,但是缺乏科学的体系指导孩子和家长选择书籍。
第二、学生对阅读兴趣缺乏兴趣,不爱看书,原因是阅读的书籍难度与学生自身水平相去甚远或者内容枯燥乏味,学生难以享受阅读的乐趣,阅读效果欠佳。
针对这样的现实和市场痛点,考拉阅读开发出一套中文阅读分级标准(ER framework)+考拉阅读APP 的产品体系并为公立学校提供阅读整体解决方案,包括教师培训、分级短文材料等
- 阅读能力测评(ER测评):将用户的阅读能力从低到高分为200ER-1300ER,评测从整体感知、获取信息、形成解释、做出评价、实际运用五个维度对学生的阅读能力进行全方位评价,并得出具体分数,帮助发现学生的阅读结构是否合理、阅读能力缺失的维度。
- 考拉阅读APP:在平台上,文本被标上精确的ER值,推荐给能力匹配的学生阅读。图书资源覆盖教育部推荐、新课标推荐、名家名校推荐等。学生在阅读之后也可以完成书后测试题检测阅读效果。
赵梓淳向创业邦介绍,目前考拉阅读主要是和公立学校合作,已经在二、三线城市的近万所小学落地,APP日活量达百万,用户留存率达70%,平均日停留时长30分钟。
他向创业邦表示未来将继续加大在技术和研发上的投入,和高等学院比如北京大学和北京语言大学进行合作,其次将会持续加大市场投入,扩大用户规模,将涵盖0-6岁以及初中阶段的学生。
目前考拉阅读团队有120人,一半以上是技术人员。其核心团队汇集了机器学习、语言学、心理学三方面人才。
考拉阅读CEO&创始人:赵梓淳
创始人&CEO 赵梓淳哥伦比亚大学和芝加哥大学硕士毕业,曾经任职于奥本海默基金和高盛银行,联合创始人任易博士毕业于北京大学数据挖掘方向,曾在IBM中国研发中心Waston for Life Service和微软亚洲研究院工作。
首席阅读测评科学家魏久乔毕业于北京大学和新加坡国立大学应用语言学专业,主要研究方向为认知语言学及自然语言处理;首席数据科学家顾问赵俊博博士曾在 Facebook 从事研究工作,师从于机器学习知名学者、深度学习的奠基人之一 Yann LeCun 教授;首席语言学家李爱萍则为北京大学的应用语言学博士。
对于此次的融资,投资方之一的GGV纪源资本管理合伙人李宏玮认为:“考拉搭建的模式是有门槛的,对社会有价值的。 GGV坚信他们的产品可以通过撬动庞大的用户学习习惯和数据,在深度学习和算法的合力下创造出属于中国AI+教育的新型模式。”
考拉阅读成立于2016年,之前曾获得伽利略资本和真格基金的数百万天使轮融资、清科辰光领投的数千万人民币pre-A轮融资及GGV纪源资本和启明创投共同投资的千万美金A轮融资。