4

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

 8 months ago
source link: https://www.qbitai.com/2024/01/112695.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

head.jpg白交 2024-01-10 14:10:27 来源:量子位

按计划,将搭载在松鼠Ai已有学习机产品中。

白交 发自 凹非寺

量子位 | 公众号 QbitAI

新的一年,教育领域大模型,迎来新玩家。

来自松鼠Ai,十年教育领域躬身者,刚刚发布首个智适应教育大模型。

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

据介绍,它可以实现纯文本外的更多任务支持,在知识获取、信息输入及传达信息等方面都具备更好的性能,同传统的大语言模型有着本质的不同。按计划,这一大模型将搭载在松鼠Ai已有学习机产品中。

与此同时,还有松鼠Ai牵头的IEEE AI教育大模型标准组(P3428)成立。第一批专家工作组包括北京师范大学黄荣怀教授、清华大学许斌教授、华东师范大学顾小清教授。

并且是松鼠Ai创始人兼董事长栗浩洋任该工作组主席,足以见其在行业的代表性。我们知道,行业标准一旦设立,大模型在教育领域的应用进一步得到规范,行业发展水平将提升到全新的水平。

过去一年,可以看到大模型在教育领域落地百花齐放。如今随着落地的深入,松鼠Ai的进展或许值得关注。

松鼠Ai智适应教育大模型

据介绍,整个松鼠Ai智适应教育大模型主要分为三层:底层的数据层、模型层、应用层,并由此体现了它的三大特点。

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

首先是数据层面。

松鼠Ai在教育场景的多年积累,构成了丰富的底层数据层。包括全学科纳米级知识图谱、海量学习资料、视频讲解以及测评和题库,以及学生学习历史数据。

值得一提的是,此处学生学习历史数据是松鼠Ai过去积累的2400万学生100亿学习行为全流程,比如学习进度、学习效果、学习路径,甚至学习过程中发呆的时间都有记录。

有了个人学习数据,一方面可以对每个学生用户画像精准把握,另一方面了解了同龄学生学习的情况,也有助于对学科整体知识点的规划和安排。

这也就决定了松鼠Ai大模型同其他传统大语言模型,比如GPT系列,有着本质的不同,他们将更加个性化,针对学生学习情况对症下药。

然后在模型层,以往谈到大模型,无非有多模态、LLM、Agent这些技术和应用,但松鼠Ai此处结合大模型的知识图谱(KG)&检索增强生成 (RAG),却值得说道说道。

简单来说,结合大模型的KG和RAG增强技术能快速找到知识点和知识点之间,知识点和题目之间,题目和孩子能力之间的关系。

若给孩子练习的题目,其与知识点的关联更高,孩子学习效率也会更高。而不同的学生对知识点的掌握也有所不同,那么具体到哪一个知识点,就需要推送与该知识点强关联的题目。

栗浩洋给出了一个具象化的形容,目前他们能实现25道题测1000个知识点,而市面上最高也只能实现25道题100个知识点,并且还能具体拆解到每个解题步骤当中去进行逐步讲解。

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

此外,栗浩洋还强调,但松鼠Ai的LAM(Large Adaptive Model)智适应大模型应用了MoE(Mixture of Experts)混合专家系统,通过将多个模型结合在一起,以获得更好的预测性能,同时降低模型的推理成本。

而在应用层,覆盖学习推荐、学习兴趣启发、习惯培养、情感干预、学习路径规划等多个场景。

比如在给学生提供辅导时,能够覆盖预习、复习、备考、作业辅导等多场景,并给予学生更多准确的回应与激励。

此外,还可以根据孩子在学习过程中反应,给予其正面的反馈与激励改善学生的情绪,帮助解决孩子的一些心理问题

可以说,其他大模型产品有的它有,没有的它也有。

如何评价?

总结来看,从数据到应用层,其实都围绕一个共同点:个性化。

再看产品功能上,松鼠Ai智适应教育大模型该有的功能都有,并且相较于大语言大模型,技术实现更为复杂。在应用场景上面,也更能把握学生个人的学习情况实现个性化应用。

至于为何能实现这样的效果,松鼠Ai的三大布局和选择值得关注:

纳米级知识拆分、MCM系统、大模型吞吐数据类型。

首先是纳米级知识点拆分。比如在数学场景中,单独针对「求加减法中的未知项」这一大知识点,就能拆分出「同分母分数两步方程-未知数为减数」、「异分母分数两步方程-未知数为加数」这种程度的知识点。

这就相当于在整个学习系统构建一个庞大的知识网络,这样能更精准地帮助学生定位学习情况,更精细的规划学习路经。

第二是MCM系统。第一个M是Model of thinking,就是思维模式,第二个C是Capacity,是学习能力,第三个M是Methodology,是学习方法论。MCM系统针对学习思维、能力、方法构建模型,这样能更科学地实时评价学生的学习状态和能力水平。

而负载了大模型能力之后,就能预测学生在未学过知识点上的能力水平、所花时间等,以推出个性化解决方案。

第三则是大模型吞吐数据类型不同。正如前文所述,数据类型更为复杂,大模型所能提供的能力更为多样。

说了那么多,其实不论是技术融合还是数据的选择,背后还有更为底层原因。

那就是智适应教育的选择,这也是整场发布会谈及最多的关键词。

什么是智适应教育?简单来说就是基于AI、大数据、物联网等技术,结合大量用户数据,针对个体学习过程差异提供适合的教育形式,以此实现个性化教育,做到因材施教。

当前包括培生教育、麦格劳希尔、Wiley、HMH这样的传统巨头也都在布局。

作为国内较早推行这一概念的企业,松鼠Ai早已开发出核心的智适应学习引擎架构。

据此前松鼠Ai联合创始人兼CEO周伟介绍,松鼠Ai智适应教育是用了三层式的架构,去构建知识地图、学习策略架构、内容地图、教学流程,进行数据的分析、推荐、算法,到最后形成完整的教学闭环。

随着大模型到来,实现个性化教育本身就是难得的契机,那么同智适应技术的融合也就成了应时之义。

按照松鼠Ai的理解,智适应技术全自动标准能按照自动驾驶那一套评价体系进行拆分。

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

△智适应教育按智能化水平L1-L5分级图

栗浩洋认为,目前业内大多数主流玩家仍处于L2发展阶段。即根据学生学习情况,实现题目数据量智适应、题目难度智适应,也就是辅助驾驶。而他们在L5即完全自动驾驶阶段,已经实现40%的水平。

在谈及AI变革教育最终形态,他们最终目标是实现虚拟老师,有助于生成更多视频讲解,助力社会需求的创新人才培养。这样一来,在个性化教育追求的同时,真正实现了教育普惠。

至少现在来看,也并非那么遥不可及。

发布会上松鼠Ai介绍,2023年松鼠Ai已经完成2000家线下智能学习机门店业务布局,是全国零售店规模最大的AI学习机品牌之一。

而随着大模型进一步部署,上线在他们的学习机产品上,就能快速带来产业价值。

大模型给教育带来怎样的变革?

过去一年,大模型技术快速迭代,AI应用可能性不断拓宽。尤其教育领域,被认为是大模型最应该落地的场景之一。

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

不少企业围绕着该场景进行布局,代表的有「可汗学院」推出的人工智能助教Khanmigo;多邻国推出的内嵌GPT-4的Duolingo Max。

总结来看,大模型落地教育主要有这样几条路径。

一种是类ChatGPT,在网页端/APP侧解决学生或老师的问题。大模型通过自然语言交互充当学习助手的角色。这在语言学习场景中最为常见,比如Duolingo、以及最近备受关注初创公司Speak。

另一种则是大模型部署在原有学习硬件之上。这种自带天然交互场景,也有用户和数据基础,应用迭代速度可能更快,但对技术要求更高,已有形态包括学习机、教育机器人、词典笔等。

百花齐放的发展现状之下,不难看出,硬件形态和软件功能容易千篇一律,并逐渐趋于同质化。

企业的创新本质还是得在于AI的赋能。这也是新一波技术浪潮企业保持竞争力的核心所在。一旦完成大模型部署,可以实现更多创新应用,用户数据带来的迭代速度更快,边际成本会逐渐降低。

不过在用户侧,除了对话这种显性功能外,大模型更多核心能力内嵌于产品中,比如根据用户习惯、学习进度制定学习计划等等,但用户往往在短时间内感知不到。

这也是当前教育场景一个主要挑战。

这就需要企业,一方面进行消费者教育,另一方面则是坚持长期且持续的技术投入,构筑企业壁垒,才能抵挡外界风云诡谲。等新技术来时结合已有场景快速利用,服务于用户。

有着近十年技术部署的松鼠Ai,就是一个范例。

不过最后不管大模型在教育怎么应用,总的方向已经确定。

那就是个性化教育、因材施教。

事实上这本身也是教育行业被广泛接受且一直以来想要实现的目标,早在上世纪八十年代,著名教育心理学家Benjamin Bloom在其教育实验中提出”two sigma”理论证明了其正确性——

接受一对一辅导的教学组平均表现要明显优于传统的1:30教学方式。

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

如今大模型本身个性化的技术特性,也就给教育行业变革带来了全新的可能性。

毫无疑问的是,随着大模型布局的深入,更多细分标准的确立,教育行业发展已经来到了关键的历史节点。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK