松鼠Ai栗浩洋:大模型如何重塑教育模式

关注
我们的目标不仅仅是提供答案,更重要的是提供教学方法和逻辑,这是教育中更为重要的部分。

8月22日,2024AGI商业趋势大会在深圳成功举办。活动由创业邦主办,南山区科技创新局、西丽湖国际科教城融合创新中心、深圳市“模力营”AI生态社区为支持单位,揽胜运动为大会指定用车,搜狐为战略合作媒体。

本届大会以“AI塑造未来市场”为主题,邀请人工智能领域的行业专家、上市公司、独角兽企业、创新企业、投资机构代表,分享研讨最新的技术、创投、治理热点话题,并围绕产品商业化、人工智能+行业解决方案进行深度交流,共同探寻更广泛的产业合作与创新机遇。

image.gif

会上,松鼠Ai创始人、首席教育技术科学家栗浩洋在主题为“AI教育,重塑学习未来中”的演讲中精彩观点如下:

1. 如果学生是一只鹰,那么跟随猴子的路径将难以前行;如果学生是一匹马,那么他应选择适合自己的道路。每个孩子都有其独特的学习路径。

2. 我们的目标不仅仅是提供答案,更重要的是提供教学方法和逻辑,这是教育中更为重要的部分。

3. 在大模型垂直应用领域,重要的不仅是自夸产品有多好,而是消费者是否真正感受到了产品的优势并认可它。

以下为演讲内容,由创业邦整理:

自2014年起,我们便投身于人工智能教育领域,致力于开发专业领域的智能虚拟教师。值得注意的是,人工智能教育在美国的起源可追溯至1973年,最初以专家系统和IRT(项目反应理论)为代表,随后逐步引入遗传算法和神经网络。到了2011年,斯坦福大学的教授们开创性地应用深度神经网络进行知识追踪,而到了2014年,全球范围内人工智能教师的教学成果已超越了顶尖人类教师。正是受到这一发展趋势的启发,我们开始汇聚欧美的人工智能教育科学家,共同开展研究。

随着人工智能技术的持续进步,我们不断采用最新技术来优化我们的教育系统。关于大模型的价值,许多人曾将其与大语言模型等同起来,尤其是在一年前,这种观点颇为流行。正如出门问问副总裁李维所言,大模型在不同领域有着不同的应用方式。

我们的大模型命名为LAM(Large Adaptive Learning Model),并非传统的大语言模型。我们注意到,ChatGPT4等工具被用于教育领域,但在我看来,这种做法并不恰当。大语言模型主要用于对文字或词汇进行排序,类似于Sora对像素进行排序,而非制作视频;同样,无人驾驶技术也不是依赖大语言模型来实现。同理,教育领域的大模型并非基于大语言模型构建,而是我们经过深入研究的成果。简而言之,我们所开发的LAM专注于生成和排序学生的学习顺序。

以一个例子来说明,传统教育模式中,老师在讲台上引导所有学生沿同一路径学习,就如同在森林中,一只猴子指定了路径,所有动物都必须跟随。然而,如果学生是一只鹰,那么跟随猴子的路径将难以前行;如果学生是一匹马,那么他应选择适合自己的道路。每个孩子都有其独特的学习路径。

即便在高考这样的标准化考试中,我们也能看到像马云这样数学仅得1分,或沈从文数学得0分的个例,但这并不妨碍他们取得巨大成功。我相信,像张一鸣这样的人物,尽管在语文上可能表现不佳——我曾与他一同参与央视的对话节目,导演因剪辑不出有效内容而感到极度痛苦——但这并不影响他成为杰出的企业家。

这些例子表明,每个学生的学习路径都是不同的,传统的教育模式并不适用于所有人。我们的大模型LAM致力于分析每个学生的用户画像,为他们定制个性化的学习路径,确保每个学生都能以最适合自己的方式学习。

在过去的十年中,我们有幸积累了2400万用户,收集了高达100亿条学习行为数据。正是这些庞大的数据资源,使我们得以训练并优化我们的智适应学习的大模型(LAM),以发现最适合孩子的学习路径。

目前,我们的路径训练已取得显著成果。以一个平均成绩约70分的五年级学生为例,若要提升至90分,六年前我们估计需要360个小时的学习时间。三年前,这一时间缩短至120个小时。得益于大模型的优化,如今,同样的提升仅需43个小时。我们的系统如同导航,可以根据学生的当前水平和目标水平,甚至具体到清华北大等高校的入学标准,来规划学习时间和路径。虽然不同个体的学习时间会有所差异,但在我们的系统中,教育的每个阶段都已被解码,能够以时间的形式进行规划和完成。我们实际上是在学习序列中,将数万个知识点和上亿道题库构建成一个学习路径,供学生生成并优化其个人最佳学习路径。

七年前,我们的多模态研究论文已在谷歌学术会议上获得了前五名的荣誉,我们也是最早在教育领域应用多模态技术的团队。

至今,我们持续发展LAM的核心功能——精确定位学生问题并深入理解学生需求。以我个人为例,我曾数学成绩优异,但几何学却非常薄弱,空间能力极差。面对数学奥林匹克竞赛中的复杂几何题目,我感到十分痛苦。尽管我遍访名师,但始终未能找到解决之道。直到我在北京的一家书店中偶然发现了一本尘封三十年的《解析几何》小册子,作者笛卡尔运用函数和三元方程的方法解决了几何问题,这让我豁然开朗,最终赢得了一等奖,并获得了北大、清华、交大、复旦等高校的录取通知。这一经历充分说明,每个学生的学习路径都是不同的,传统的教育路径可能并不适合每个人。我们的大模型致力于分析每个学生的用户画像,为他们规划个性化的学习路径。正如一匹马可能选择绕远路,但最终可能比兔子更早到达目的地,每个学生都有其独特的学习逻辑和应达到的学习效果。

樊登的孩子已经在我们教育体系中学习了六年。整个学习过程中,学生与系统直接互动,实现了完全的“无人驾驶”式学习。从小学升入初中,再从初中升入高中,他一直就读于北京顶尖的四大名校之一。起初,他担心自己在班级中的表现可能会处于下游,因为班级里的同学都来自知名的初中。然而,在经过一个暑假的系统训练后,他的成绩在开学后的九月份考试中跃升至班级第一。

我们还帮助了许多原本成绩只有9分的孩子提升至90分,实现了从班级倒数第三名到正数前两名的转变,这在教育行业中堪称奇迹。我的父亲是一位拥有三十年教龄的特级教师,他能够提升优秀学生的成绩,却难以将成绩不佳的学生提升至班级前列。然而,我们的系统已经找到了适合每个孩子的个性化学习路径。

我们的系统中包含了多种方法,可以说,这是人类历史上首个具备视觉、听觉、语言和智能的多模态人工智能教师。以一个具体的细节为例,在我们的AI搜索系统中,学生在解题过程中会留下各种草稿。我们的系统能够识别并发现学生的问题所在。例如,在解决关于时钟敲击次数的问题时,系统通过分析学生的回答发现,学生没有理解到敲击11下实际上包含了10个时间间隔。通过这样的分析,我们不仅能够看到学生的书写,更能深入理解他们的思维过程,并提供针对性的解答。

这种深度的个性化教学,使得我们的系统能够根据每个学生的特点,提供最合适的指导和帮助,从而显著提高学习效率和成绩。

在我们的计算教学过程中,可以清晰地识别学生在哪些方面出现了错误。例如,学生可能错误地将梯形视为等腰梯形,而实际上并非如此。这类错误并不只是简单的识别问题,而是表面的。通过这些识别,我们能够调整学生的学习路径和方向,找出他们的弱点和瓶颈,并提供针对性的解决方案。我们甚至能够发现学生在图形绘制上的不准确之处,并给予相应的指导,从而显著提高学习效率。

相较于一位老师面对整个班级讲授同一题目的解析,我们的方法更为个性化。每个学生在解题时采用的路径和得出的答案各不相同,有的题目甚至可以有977种不同的错误答案。显然,用同一种解析方法来教授所有学生是不合适的。因此,我们必须根据每个学生的特点和逻辑,来定制讲解和学习计划。

我们的智适应学习大模型(LAM)不仅能通过数据分析揭示学生的性格特点,例如是否具有创新精神、是否粗心等,还能准确定位学生的个人特质。基于这些信息,我们可以为不同性格的学生提供不同的学习习惯和方法。例如,对于能够承受挑战的学生,我们可以增加学习难度;而对于敏感的学生,则需要采取更为温和的教学方法。

在整个学习过程中,我们不断通过描述学生的用户画像来生成最适合他们的学习路径。我们的目标不仅仅是提供答案,更重要的是提供教学方法和逻辑,这是教育中更为重要的部分。通过这种方式,我们能够为每个学生量身定制他们的学习计划,确保每个学生都能以最适合自己的方式进行学习。

在教育过程中,我们得以观察到孩子们的丰富表情和情绪变化,如沮丧、厌烦或快乐等不同状态。这些情绪状态与他们的学习行为轨迹、性格描述以及知识掌握情况是相互吻合的。通过这些多模态的信息整合,我们能更全面地理解每个孩子,并对他们的学习状况做出更准确的判断。

我们的系统中包含了与孩子们的多样化对话,这些对话基于学习行为数据,旨在启发孩子们对自己解题思路的深入思考。以我的双胞胎儿子为例,他们在二年级时就通过我们的系统完成了二至四年级的数学课程,三年级时便学完了八年级的物理。然而,到了四年级,他们仍在学习一年级的语文课程,因为他们在语文方面存在明显的不足。正如我小时候在大学时期才弥补了自己语文上的不足一样,每个孩子的学习路径都是独特的。在这个过程中,我经常训练他们对一道题目寻找多种解法,因为让学生反思自己的解题思路远比单纯的提问更为重要。从他们两岁开始,我就教授他们如何思考,即使那时他们还不明白“路”是什么,我就已经向他们介绍了“思路”这一概念。因此,当他们在四年级遇到一个等差数列问题时,他们能够用一种仅三步的解法,快速解决了学校提供的需要二十多步、三四种解法的问题,这让我感到非常震撼和欣慰。

我们的系统与学生的沟通能够帮助他们反思自己的解题思路,识别哪些思路是正确的,哪些是错误的,哪些是有效的,哪些是无效的,以及如何在未来避免错误并采纳更好的思路。这种训练不仅涉及思维模型和能力方法,而且是对学生终生有益的。一旦学生的思维得到畅通,他们的学习速度可能会比其他人快五倍甚至十倍。

在我们现在的大模型体系下,学生可以全日制地在我们的平台上学习,无需老师的直接指导,实现了完全的自动驾驶式学习。学生每天不必做作业,从小学一年级到六年级,就能完成高中的全部课程内容。在教育部的《教育信息化杂志》的研究论文中,通过对比实验发现,使用松鼠Ai系统的学生,其成绩比传统教学模式下的学生高出31分。在白山希望中学,即使没有老师和志愿者,我们的系统在两个月内帮助学生在中考中平均提升了50分,这体现了我们的学习效率和速度。

此外,我们与孩子在系统中的互动和对话,有时也让孩子们将我们视为倾诉的对象,分享他们的生活点滴,甚至是恋爱等私事,真正地将我们视作一个虚拟老师和朋友。

去年九月,松鼠AIi荣获人工智能教育大模型标准组主席职位。今年一月,我们举行了标准组成立仪式,期间,北京师范大学、华东师范大学和清华大学的教授们纷纷加入,他们均为教育部的专家和顾问。此外,来自全球30多个国家和40多家知名公司及高校的科学家们也纷纷申请加入我们的标准组。这标志着我们中国人在人工智能教育垂直领域,尤其是在大模型应用方面,已站在全球行业的顶峰。

在学术领域,我们不盲目追求发表数量,而是注重研究的实际应用价值。今年,我们在ICLR顶会中又有7篇论文入选。我们的研究工作始终以指导未来三年的应用为目标,避免过度超前的研究。例如,我们的多模态研究MIBA六七年前便已启动,直至最近一两年才开始实际应用。

全球人工智能科学家联合会(AAAI)的现任主席Francesca Rossi及前任主席Bart Selman都对松鼠Ai给予了高度认可。他们特别指出,我们的系统不仅能帮助孩子提高学习成绩,还能培养他们未来社会所需的能力,使他们成为更优秀的人才。

哈佛大学的教育学David Docterman教授也对我们的系统给予了肯定,认为我们能为不同学生提供针对性的学习方案,根据他们的学习行为进行个性化教学。

前任AAAI主席Bart Selman同样对我们的MCM(思想能力及方法培养)体系表示认可。

家长们对我们的市场认可度非常高。过去,我们主要服务于教育培训行业,但由于政策问题,导致4000个经销商受到冲击,公司一度背负9亿债务,险些破产。然而,经过三年的努力,我们已经偿还了2亿现金,另有6亿债权人选择转股。目前,公司的零售销售额已达到20亿规模,我们已基本偿还了90%的债务,仅剩几千万元待还。

我们转型将重点放在了智能学习机领域。家长可以利用我们的智能学习机,实现无人驾驶式的学习体验。与全球欧美最大的人工智能教育公司不同,他们提供的是辅助驾驶式的AI工具,服务于全日制学校教师,而我们则直接以智能老师的身份,代替教师进行教学。

我们的产品策略在学习机市场已经展现出明显的优势。回顾2022年,我们刚开始时背负着9亿元的债务,但我们的定价仍然高于市场上价值千亿元的讯飞机器几千元。到了2023年,我们的产品价格已经比竞争对手最贵的产品高出3000元。随着学而思、讯飞、百度等竞争对手纷纷进入学习机市场,我们的产品单价已经达到7000元,比对手高出许多。今年9月,我们推出了一款定价21100元的产品,其价格比市场上最贵的机器还要高出12000元。我们最贵的机型销量甚至超过了最便宜的机型,这反映出家长们对我们产品效果的高度认可。

在大模型垂直应用领域,重要的不仅是自夸产品有多好,而是消费者是否真正感受到了产品的优势并认可它。从7月份双减政策实施,8月份我们转型做智能学习机,到9月份产品开发部成立,再到11月份我们开始拥有用户,我们的付费用户数量已从最初的一点点增长到现在的75万,且用户支付的费用单价相对较高,不是几十或几百元的小额支付。

最后,我们的学习路径规划甚至在治疗学生的精神疾病方面显示出潜力,这并非罕见案例。一位经销商提到,有位孩子需要定期看精神科医生,我们通过学习机上的学习行为数据分析,仅用100多分钟的学习时间,就能通过一个二维码揭示孩子的问题所在。

这个孩子是否真的存在专注力问题?他自称只能专注10分钟,但我们的系统显示,他在学习前的知识水平较低,18个知识点中有12个不会,即2/3的学校知识点未掌握,只有1/3掌握了。学习后,他的水平从27分提升到了74分。这个显著的进步表明,这个孩子的专注力实际上非常好。专注力差的学生,他们的知识成长差值通常只有十几到二十个百分点,甚至可能为负,表明学习效果越来越差。然而,这个孩子的知识成长度非常高,有时达到40或60分,这表明他不仅专注力强,而且具备学习能力,只是之前可能受到了不适当的教学方法的影响。

然而,我们也发现了两个异常的学习行为数据点:他的解题时间远超全国平均水平,这可能反映了精神自控力的不足。但另一种可能性是,他可能在努力学习。我们发现他花了五倍于平均的时间,成功解决了一道难度超过他水平的题目,这表明他是一个非常用心的学生。

通过多模态数据的分析,我们发现这位孩子在花费了五倍于常规的时间进行验算,这清晰表明他的专注力并非如其母亲所担忧的那样需要每周就医,实际上他的专注力非常好。然而,随后我们注意到孩子出现了一些精神上的问题。在第19题解答错误之后,他的行为数据显示出异常——不是过度异常,而是异常不足。他在几秒钟内跳过了第20题和第21题,尽管这些题目的难度已经降低到远低于他能力水平的17级。按照他的实际水平,即便是17级的题目也应该能够正确解答。但他甚至在1级的题目上也选择了放弃,连续跳过了22至25题,即便是非常简单的问题也不愿意尝试,显示出了明显的畏难情绪和偶尔的情绪崩溃。

令人欣慰的是,孩子最终重新投入了学习。他之所以能够继续学习,是因为我们始终给予他1级的题目。对于一个能力在24至70级的孩子来说,当他发现题目如此简单时,便重新激发了学习的兴趣,并逐渐提升了学习等级。

我们的AI智能教师在题目难度系数的调整上也发生了变化。最初,难度系数的跨度很大,但随着时间的推移,这种跨度变得非常小。我们从一个极端严格的教学方式转变为一个非常温和和体贴的方式,因为我们发现这个孩子无法承受过大的压力。这正是人工智能系统通过分析大量数据和学习效果后,为每个学生提供的独特学习路径。这种路径在不依赖药物治疗的情况下,解决了孩子的问题,显示出我们在解决传统教育问题上的巨大潜力。

当前的新课程改革也提出了几个标准,这些内容我们过去六七年前就已经讨论过。首先,从教学转向学习,实现以学生为中心的教育模式,不是围绕教师,而是关注每个学生应该如何学习。其次,重视思维能力的培养,这已经强调了七年,我们在不同学科中注重培养孩子的这些能力而非单纯的知识点。这也是我们的发明专利,特别是我发明的关于MCM思想能力方法的专利。我们相信,当孩子们掌握了这些能力后,他们将成为未来工作和生活的大师。

松鼠Ai的目标是希望每个孩子都能以非常低的成本,获得一个集孔子、达·芬奇、爱因斯坦智慧于一身的AI超级教师。

图片

9月19-20日,更多的创业者将登上2024 DEMO CHINA的舞台,在AI纪元绽放自己的创新力量。

让我们相约·成都,一起见证更多超能勇士的崛起。

图片

反馈
联系我们
推荐订阅