芥末堆芥末堆

用AI创立中文阅读新标准,考拉阅读获数千万人民币Pre-A轮融资

作者:荔闽 发布时间:

用AI创立中文阅读新标准,考拉阅读获数千万人民币Pre-A轮融资

作者:荔闽 发布时间:

摘要:阅读不是一件小事儿。

WechatIMG130.jpeg                                                          考拉阅读团队)

“美国有着一套非常完整的阅读体系,从蓝思创立的分级阅读标准,到Renaissance Learning 的阅读评测体系、Raz - Kid 所搭建的系列课堂材料等等,而中文阅读,连分级标准尚未建立,课堂上的阅读教学,老师们都在‘摸着石头过河’,缺少科学的指导”。

这是一位来自教学一线的老师心声,她在美国的小学教过英文和中文的阅读课程。考拉阅读的 CEO 赵梓淳说,这样的声音不是“孤例”,自 2016 年 10 月正式开始中文分级阅读的创业开始,在北京、河南等地的学校调研中,越发认识到中文分级阅读在一线教学里的迫切性:“没有任何数据来告诉老师,到底一个班级里每个同学的阅读水平到底如何,也就无从给予相应的辅导。当然,到底如何科学地辅导,也是一个难题。”

目前,赵梓淳和他的团队共开发了 3 款产品,主要针对的是小学阶段孩子的阅读能力发展,分别是享阅中文分级系统;考拉阅读(类似于 Renaissance Learning,提供阅读能力测验,记录和追踪学生阅读能力发展);针对公立学校的阅读整体解决方案,包括教师培训、分级短文材料等等。整套产品已经进入两百所中小学,收入过百万,团队也在近日获得由清科领投数千万人民币的 Pre-A轮投资,爱佑慈善基金跟投,此前的天使投资方真格基金、伽利略资本增持。 

  • 为什么中文需要分级阅读?

对于美国的孩子,Literacy (读写能力)是比数学、科学以及其他 STEM 学科更为被家长和社会重视的技能,特别是在 K- K8 阶段(初中之前)。之所以如此重视 Literacy 的背后,是因为一个重要的教育理念 ——  “Learning by Reading” (通过阅读来学习)。读写能力,尤其是阅读能力被认定是一项终身技能,影响个人在其他学科上的学习效果。因此,与国内的阅读喜欢读经典不同,美国的分级阅读产品里,包括大量的非小说类阅读材料,尤其是社会科学和科学类的相关文章,这些文章所提供的信息构成了孩子们对于世界的基础认识。

长远的,从职业发展的角度来说,阅读技能也同样重要。一份针对 CEO 的 2020 年人才技能要求调查显示,绝大多数的工作 ,都要求有优秀的阅读能力,位列前三。还必须注意到的是,阅读和思维训练、表达能力和写作水平密切相关,这些都是企业主所看重的技能。

Screenshot 2017-08-12 21.04.42.png

将英语的情况投射到汉语学习中,阅读的重要性不言而喻。而分级阅读对于中小学阶段的读写能力培养,则是起到了科学指导和跟踪的作用。赵梓淳说到目前语文教学的评测方式主要以背诵、默写为主,这主要测验学生对于字词的掌握能力,而阅读更为重要的是通篇理解、批判性思辩能力的培养。这些需要在课外进行专门的阅读训练进行提高和强化。

另外,分级阅读标准的出现也更好地促进教育公平的实施。在针对北京、河南等多地的实际阅读能力调研中发现,北京地区的孩子阅读能力远远高于其他地区,以中关村实验二小二年级的孩子为例,其阅读能力可以达到河南一些地区五六年级孩子的水平。“如果没有一套标准,我们无法对各地学生的阅读水平有一个全景式的了解。”

  • 英汉差异,AI 助力中文分级阅读新标准

英语分级阅读体系非常成熟,最为核心的两大标准是:语义难度(Semantic Difficulty)和句法难度(Syntactic Complexity)。语义难度根据词频来判断,越常见难度越低;而句法难度则根据句长来判断,句子越长,难度越高。但将这套标准放在汉语上,则可能会出现很多不同的问题:

  •  第一,汉语本身的基本单元多,常用字 3000 多个,辞海里更是收录了上万个汉字,排列组合后造成单字常见,组合不常见;

  •  第二,汉语的分词难度大,相对于英文以空格为界,汉语并无明显的句法标志,主要基于上下文的分析;

  •  第三,汉语的句长并不主要影响语义的理解,古诗、文言文更是相反,《道德经》洋洋洒洒五千言,都是常用字,但句意理解上则艰涩难懂。

针对汉语本身的特点,考拉阅读团队结合北大语言学多年的科研结果,从字、词、句、段、篇五个方面,给语料进行多个纬度的标签分类打分。整套模型的底本是以目前新课标下多套语文教材和课外辅导书作为基本参考,并辅之以几百万字的非平衡语料,对标准进行校对。

Screenshot 2017-08-12 23.33.15.png

         (考拉团队在中文分级阅读上采用的多维标准)

“由于中文阅读标准的维度十分复杂,我们从一开始就引入 AI 来学习专家们对于语料的分类“,在收集过程中, 赵梓淳对于其团队的技术能力非常自豪,CTO 任易曾就职于 IBM Waston 实验室,以及参与 Windows 10 中文手写输入法的开发,同时首席数据科学家 Jake Zhao 则是师从机器学习、深度学习的大师 Yann LeCun 教授。”用 AI 的方式来不断地调整目前已有的分级阅读标准,不论是对于汉语还是英文,都是领先的,这是分级阅读的未来态。”

  • 2B 天花板易见,未来会推出 2C 产品

不仅仅是在产品研发上,分级阅读产品有着汉语独特的路径,在商业模式变现上,考拉阅读的方式与国外的同类产品也略有不同,侧重于为学校提供完整的解决方案,从每半年一次的阅读能力测验、到分级阅读的短文材料,再到阅读课堂的教师培训,以及系统的数据报告平台和家校之间的互动机制。“中国的公立学校市场与国外不大相同,都是由校方统一采购,大部分教师都缺乏专业的阅读教学方法训练,因此,必须是一套完整的方案。”

考拉团队将目前的分级阅读标准和新课标体系下的日常教学相结合,变成一套具有指导性意义的课堂标准,除此之外还提供:

  • 阅读能力测评,由专家团队研发整套试卷,定期测验,同时在班级、校园和区域不同层级上做数据分析,真正展示一个学生的阅读能力水平。

  • 分级短文研发和撰写,结合北大中文系的团队和各个地区的一线教研员,撰写出符合分级阅读标准的内容,用来支持课外阅读辅导的开展。

  • 教师培训有20课时和40课时不同版本,由其团队里有丰富教研经验的老师进行研发,分为线下集中辅导和线上远程支持。

WechatIMG128.jpeg

   (考拉目前所研发的中文分级阅读标准)

不过,在赵梓淳看来,国内分级阅读市场更大的在于 2C 消费市场的发展。随着文化消费的升级,越来越多的家长开始注重自己孩子在文学素养上的提高,目前许多 KOL 的绘本、图书的团购市场发展热烈,也是侧面证明了这一点。不过,对于考拉阅读来说,目前最为重要的核心,仍然是收集数据,完善其标准,开发完整的评测体系。在此基础上,再推出适应于家长端的消费产品。“相信随着语文的重要性不断提高,中文分级阅读会成为一个共识,被家长、教师、社会所认可”。赵梓淳如是说道。

1、本文是 芥末堆网原创文章,转载可点击 芥末堆内容合作 了解详情,未经授权拒绝一切形式转载,违者必究;
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。
来源: 芥末堆
芥末堆商务合作:王老师 18710003484
  • 用AI创立中文阅读新标准,考拉阅读获数千万人民币Pre-A轮融资分享二维码