松鼠Ai栗浩洋：大模型如何重塑教育模式

创业邦·2024-08-26

我们的目标不仅仅是提供答案，更重要的是提供教学方法和逻辑，这是教育中更为重要的部分。

8月22日，2024AGI商业趋势大会在深圳成功举办。活动由创业邦主办，南山区科技创新局、西丽湖国际科教城融合创新中心、深圳市“模力营”AI生态社区为支持单位，揽胜运动为大会指定用车，搜狐为战略合作媒体。

本届大会以“AI塑造未来市场”为主题，邀请人工智能领域的行业专家、上市公司、独角兽企业、创新企业、投资机构代表，分享研讨最新的技术、创投、治理热点话题，并围绕产品商业化、人工智能+行业解决方案进行深度交流，共同探寻更广泛的产业合作与创新机遇。

会上，松鼠Ai创始人、首席教育技术科学家栗浩洋在主题为“AI教育，重塑学习未来中”的演讲中精彩观点如下：

1. 如果学生是一只鹰，那么跟随猴子的路径将难以前行；如果学生是一匹马，那么他应选择适合自己的道路。每个孩子都有其独特的学习路径。

2. 我们的目标不仅仅是提供答案，更重要的是提供教学方法和逻辑，这是教育中更为重要的部分。

3. 在大模型垂直应用领域，重要的不仅是自夸产品有多好，而是消费者是否真正感受到了产品的优势并认可它。

以下为演讲内容，由创业邦整理：

自2014年起，我们便投身于人工智能教育领域，致力于开发专业领域的智能虚拟教师。值得注意的是，人工智能教育在美国的起源可追溯至1973年，最初以专家系统和IRT（项目反应理论）为代表，随后逐步引入遗传算法和神经网络。到了2011年，斯坦福大学的教授们开创性地应用深度神经网络进行知识追踪，而到了2014年，全球范围内人工智能教师的教学成果已超越了顶尖人类教师。正是受到这一发展趋势的启发，我们开始汇聚欧美的人工智能教育科学家，共同开展研究。

随着人工智能技术的持续进步，我们不断采用最新技术来优化我们的教育系统。关于大模型的价值，许多人曾将其与大语言模型等同起来，尤其是在一年前，这种观点颇为流行。正如出门问问副总裁李维所言，大模型在不同领域有着不同的应用方式。

我们的大模型命名为LAM（Large Adaptive Learning Model），并非传统的大语言模型。我们注意到，ChatGPT4等工具被用于教育领域，但在我看来，这种做法并不恰当。大语言模型主要用于对文字或词汇进行排序，类似于Sora对像素进行排序，而非制作视频；同样，无人驾驶技术也不是依赖大语言模型来实现。同理，教育领域的大模型并非基于大语言模型构建，而是我们经过深入研究的成果。简而言之，我们所开发的LAM专注于生成和排序学生的学习顺序。

以一个例子来说明，传统教育模式中，老师在讲台上引导所有学生沿同一路径学习，就如同在森林中，一只猴子指定了路径，所有动物都必须跟随。然而，如果学生是一只鹰，那么跟随猴子的路径将难以前行；如果学生是一匹马，那么他应选择适合自己的道路。每个孩子都有其独特的学习路径。

即便在高考这样的标准化考试中，我们也能看到像马云这样数学仅得1分，或沈从文数学得0分的个例，但这并不妨碍他们取得巨大成功。我相信，像张一鸣这样的人物，尽管在语文上可能表现不佳——我曾与他一同参与央视的对话节目，导演因剪辑不出有效内容而感到极度痛苦——但这并不影响他成为杰出的企业家。

这些例子表明，每个学生的学习路径都是不同的，传统的教育模式并不适用于所有人。我们的大模型LAM致力于分析每个学生的用户画像，为他们定制个性化的学习路径，确保每个学生都能以最适合自己的方式学习。

在过去的十年中，我们有幸积累了2400万用户，收集了高达100亿条学习行为数据。正是这些庞大的数据资源，使我们得以训练并优化我们的智适应学习的大模型（LAM），以发现最适合孩子的学习路径。

目前，我们的路径训练已取得显著成果。以一个平均成绩约70分的五年级学生为例，若要提升至90分，六年前我们估计需要360个小时的学习时间。三年前，这一时间缩短至120个小时。得益于大模型的优化，如今，同样的提升仅需43个小时。我们的系统如同导航，可以根据学生的当前水平和目标水平，甚至具体到清华北大等高校的入学标准，来规划学习时间和路径。虽然不同个体的学习时间会有所差异，但在我们的系统中，教育的每个阶段都已被解码，能够以时间的形式进行规划和完成。我们实际上是在学习序列中，将数万个知识点和上亿道题库构建成一个学习路径，供学生生成并优化其个人最佳学习路径。

七年前，我们的多模态研究论文已在谷歌学术会议上获得了前五名的荣誉，我们也是最早在教育领域应用多模态技术的团队。

至今，我们持续发展LAM的核心功能——精确定位学生问题并深入理解学生需求。以我个人为例，我曾数学成绩优异，但几何学却非常薄弱，空间能力极差。面对数学奥林匹克竞赛中的复杂几何题目，我感到十分痛苦。尽管我遍访名师，但始终未能找到解决之道。直到我在北京的一家书店中偶然发现了一本尘封三十年的《解析几何》小册子，作者笛卡尔运用函数和三元方程的方法解决了几何问题，这让我豁然开朗，最终赢得了一等奖，并获得了北大、清华、交大、复旦等高校的录取通知。这一经历充分说明，每个学生的学习路径都是不同的，传统的教育路径可能并不适合每个人。我们的大模型致力于分析每个学生的用户画像，为他们规划个性化的学习路径。正如一匹马可能选择绕远路，但最终可能比兔子更早到达目的地，每个学生都有其独特的学习逻辑和应达到的学习效果。

樊登的孩子已经在我们教育体系中学习了六年。整个学习过程中，学生与系统直接互动，实现了完全的“无人驾驶”式学习。从小学升入初中，再从初中升入高中，他一直就读于北京顶尖的四大名校之一。起初，他担心自己在班级中的表现可能会处于下游，因为班级里的同学都来自知名的初中。然而，在经过一个暑假的系统训练后，他的成绩在开学后的九月份考试中跃升至班级第一。

我们还帮助了许多原本成绩只有9分的孩子提升至90分，实现了从班级倒数第三名到正数前两名的转变，这在教育行业中堪称奇迹。我的父亲是一位拥有三十年教龄的特级教师，他能够提升优秀学生的成绩，却难以将成绩不佳的学生提升至班级前列。然而，我们的系统已经找到了适合每个孩子的个性化学习路径。

我们的系统中包含了多种方法，可以说，这是人类历史上首个具备视觉、听觉、语言和智能的多模态人工智能教师。以一个具体的细节为例，在我们的AI搜索系统中，学生在解题过程中会留下各种草稿。我们的系统能够识别并发现学生的问题所在。例如，在解决关于时钟敲击次数的问题时，系统通过分析学生的回答发现，学生没有理解到敲击11下实际上包含了10个时间间隔。通过这样的分析，我们不仅能够看到学生的书写，更能深入理解他们的思维过程，并提供针对性的解答。

这种深度的个性化教学，使得我们的系统能够根据每个学生的特点，提供最合适的指导和帮助，从而显著提高学习效率和成绩。

在我们的计算教学过程中，可以清晰地识别学生在哪些方面出现了错误。例如，学生可能错误地将梯形视为等腰梯形，而实际上并非如此。这类错误并不只是简单的识别问题，而是表面的。通过这些识别，我们能够调整学生的学习路径和方向，找出他们的弱点和瓶颈，并提供针对性的解决方案。我们甚至能够发现学生在图形绘制上的不准确之处，并给予相应的指导，从而显著提高学习效率。

相较于一位老师面对整个班级讲授同一题目的解析，我们的方法更为个性化。每个学生在解题时采用的路径和得出的答案各不相同，有的题目甚至可以有977种不同的错误答案。显然，用同一种解析方法来教授所有学生是不合适的。因此，我们必须根据每个学生的特点和逻辑，来定制讲解和学习计划。

我们的智适应学习大模型（LAM）不仅能通过数据分析揭示学生的性格特点，例如是否具有创新精神、是否粗心等，还能准确定位学生的个人特质。基于这些信息，我们可以为不同性格的学生提供不同的学习习惯和方法。例如，对于能够承受挑战的学生，我们可以增加学习难度；而对于敏感的学生，则需要采取更为温和的教学方法。

在整个学习过程中，我们不断通过描述学生的用户画像来生成最适合他们的学习路径。我们的目标不仅仅是提供答案，更重要的是提供教学方法和逻辑，这是教育中更为重要的部分。通过这种方式，我们能够为每个学生量身定制他们的学习计划，确保每个学生都能以最适合自己的方式进行学习。

在教育过程中，我们得以观察到孩子们的丰富表情和情绪变化，如沮丧、厌烦或快乐等不同状态。这些情绪状态与他们的学习行为轨迹、性格描述以及知识掌握情况是相互吻合的。通过这些多模态的信息整合，我们能更全面地理解每个孩子，并对他们的学习状况做出更准确的判断。

我们的系统中包含了与孩子们的多样化对话，这些对话基于学习行为数据，旨在启发孩子们对自己解题思路的深入思考。以我的双胞胎儿子为例，他们在二年级时就通过我们的系统完成了二至四年级的数学课程，三年级时便学完了八年级的物理。然而，到了四年级，他们仍在学习一年级的语文课程，因为他们在语文方面存在明显的不足。正如我小时候在大学时期才弥补了自己语文上的不足一样，每个孩子的学习路径都是独特的。在这个过程中，我经常训练他们对一道题目寻找多种解法，因为让学生反思自己的解题思路远比单纯的提问更为重要。从他们两岁开始，我就教授他们如何思考，即使那时他们还不明白“路”是什么，我就已经向他们介绍了“思路”这一概念。因此，当他们在四年级遇到一个等差数列问题时，他们能够用一种仅三步的解法，快速解决了学校提供的需要二十多步、三四种解法的问题，这让我感到非常震撼和欣慰。

我们的系统与学生的沟通能够帮助他们反思自己的解题思路，识别哪些思路是正确的，哪些是错误的，哪些是有效的，哪些是无效的，以及如何在未来避免错误并采纳更好的思路。这种训练不仅涉及思维模型和能力方法，而且是对学生终生有益的。一旦学生的思维得到畅通，他们的学习速度可能会比其他人快五倍甚至十倍。

在我们现在的大模型体系下，学生可以全日制地在我们的平台上学习，无需老师的直接指导，实现了完全的自动驾驶式学习。学生每天不必做作业，从小学一年级到六年级，就能完成高中的全部课程内容。在教育部的《教育信息化杂志》的研究论文中，通过对比实验发现，使用松鼠Ai系统的学生，其成绩比传统教学模式下的学生高出31分。在白山希望中学，即使没有老师和志愿者，我们的系统在两个月内帮助学生在中考中平均提升了50分，这体现了我们的学习效率和速度。

此外，我们与孩子在系统中的互动和对话，有时也让孩子们将我们视为倾诉的对象，分享他们的生活点滴，甚至是恋爱等私事，真正地将我们视作一个虚拟老师和朋友。

去年九月，松鼠AIi荣获人工智能教育大模型标准组主席职位。今年一月，我们举行了标准组成立仪式，期间，北京师范大学、华东师范大学和清华大学的教授们纷纷加入，他们均为教育部的专家和顾问。此外，来自全球30多个国家和40多家知名公司及高校的科学家们也纷纷申请加入我们的标准组。这标志着我们中国人在人工智能教育垂直领域，尤其是在大模型应用方面，已站在全球行业的顶峰。

在学术领域，我们不盲目追求发表数量，而是注重研究的实际应用价值。今年，我们在ICLR顶会中又有7篇论文入选。我们的研究工作始终以指导未来三年的应用为目标，避免过度超前的研究。例如，我们的多模态研究MIBA六七年前便已启动，直至最近一两年才开始实际应用。

全球人工智能科学家联合会（AAAI）的现任主席Francesca Rossi及前任主席Bart Selman都对松鼠Ai给予了高度认可。他们特别指出，我们的系统不仅能帮助孩子提高学习成绩，还能培养他们未来社会所需的能力，使他们成为更优秀的人才。

哈佛大学的教育学David Docterman教授也对我们的系统给予了肯定，认为我们能为不同学生提供针对性的学习方案，根据他们的学习行为进行个性化教学。

前任AAAI主席Bart Selman同样对我们的MCM（思想能力及方法培养）体系表示认可。

家长们对我们的市场认可度非常高。过去，我们主要服务于教育培训行业，但由于政策问题，导致4000个经销商受到冲击，公司一度背负9亿债务，险些破产。然而，经过三年的努力，我们已经偿还了2亿现金，另有6亿债权人选择转股。目前，公司的零售销售额已达到20亿规模，我们已基本偿还了90%的债务，仅剩几千万元待还。

我们转型将重点放在了智能学习机领域。家长可以利用我们的智能学习机，实现无人驾驶式的学习体验。与全球欧美最大的人工智能教育公司不同，他们提供的是辅助驾驶式的AI工具，服务于全日制学校教师，而我们则直接以智能老师的身份，代替教师进行教学。

我们的产品策略在学习机市场已经展现出明显的优势。回顾2022年，我们刚开始时背负着9亿元的债务，但我们的定价仍然高于市场上价值千亿元的讯飞机器几千元。到了2023年，我们的产品价格已经比竞争对手最贵的产品高出3000元。随着学而思、讯飞、百度等竞争对手纷纷进入学习机市场，我们的产品单价已经达到7000元，比对手高出许多。今年9月，我们推出了一款定价21100元的产品，其价格比市场上最贵的机器还要高出12000元。我们最贵的机型销量甚至超过了最便宜的机型，这反映出家长们对我们产品效果的高度认可。

在大模型垂直应用领域，重要的不仅是自夸产品有多好，而是消费者是否真正感受到了产品的优势并认可它。从7月份双减政策实施，8月份我们转型做智能学习机，到9月份产品开发部成立，再到11月份我们开始拥有用户，我们的付费用户数量已从最初的一点点增长到现在的75万，且用户支付的费用单价相对较高，不是几十或几百元的小额支付。

最后，我们的学习路径规划甚至在治疗学生的精神疾病方面显示出潜力，这并非罕见案例。一位经销商提到，有位孩子需要定期看精神科医生，我们通过学习机上的学习行为数据分析，仅用100多分钟的学习时间，就能通过一个二维码揭示孩子的问题所在。

这个孩子是否真的存在专注力问题？他自称只能专注10分钟，但我们的系统显示，他在学习前的知识水平较低，18个知识点中有12个不会，即2/3的学校知识点未掌握，只有1/3掌握了。学习后，他的水平从27分提升到了74分。这个显著的进步表明，这个孩子的专注力实际上非常好。专注力差的学生，他们的知识成长差值通常只有十几到二十个百分点，甚至可能为负，表明学习效果越来越差。然而，这个孩子的知识成长度非常高，有时达到40或60分，这表明他不仅专注力强，而且具备学习能力，只是之前可能受到了不适当的教学方法的影响。

然而，我们也发现了两个异常的学习行为数据点：他的解题时间远超全国平均水平，这可能反映了精神自控力的不足。但另一种可能性是，他可能在努力学习。我们发现他花了五倍于平均的时间，成功解决了一道难度超过他水平的题目，这表明他是一个非常用心的学生。

通过多模态数据的分析，我们发现这位孩子在花费了五倍于常规的时间进行验算，这清晰表明他的专注力并非如其母亲所担忧的那样需要每周就医，实际上他的专注力非常好。然而，随后我们注意到孩子出现了一些精神上的问题。在第19题解答错误之后，他的行为数据显示出异常——不是过度异常，而是异常不足。他在几秒钟内跳过了第20题和第21题，尽管这些题目的难度已经降低到远低于他能力水平的17级。按照他的实际水平，即便是17级的题目也应该能够正确解答。但他甚至在1级的题目上也选择了放弃，连续跳过了22至25题，即便是非常简单的问题也不愿意尝试，显示出了明显的畏难情绪和偶尔的情绪崩溃。

令人欣慰的是，孩子最终重新投入了学习。他之所以能够继续学习，是因为我们始终给予他1级的题目。对于一个能力在24至70级的孩子来说，当他发现题目如此简单时，便重新激发了学习的兴趣，并逐渐提升了学习等级。

我们的AI智能教师在题目难度系数的调整上也发生了变化。最初，难度系数的跨度很大，但随着时间的推移，这种跨度变得非常小。我们从一个极端严格的教学方式转变为一个非常温和和体贴的方式，因为我们发现这个孩子无法承受过大的压力。这正是人工智能系统通过分析大量数据和学习效果后，为每个学生提供的独特学习路径。这种路径在不依赖药物治疗的情况下，解决了孩子的问题，显示出我们在解决传统教育问题上的巨大潜力。

当前的新课程改革也提出了几个标准，这些内容我们过去六七年前就已经讨论过。首先，从教学转向学习，实现以学生为中心的教育模式，不是围绕教师，而是关注每个学生应该如何学习。其次，重视思维能力的培养，这已经强调了七年，我们在不同学科中注重培养孩子的这些能力而非单纯的知识点。这也是我们的发明专利，特别是我发明的关于MCM思想能力方法的专利。我们相信，当孩子们掌握了这些能力后，他们将成为未来工作和生活的大师。

松鼠Ai的目标是希望每个孩子都能以非常低的成本，获得一个集孔子、达·芬奇、爱因斯坦智慧于一身的AI超级教师。