芥末堆芥末堆

DL研讨会:深度学习和在线教育有什么关系?

作者:芥末堆 发布时间:

DL研讨会:深度学习和在线教育有什么关系?

作者:芥末堆 发布时间:

摘要: 如果你关注在线教育,可能多少都会听到些与“Deep Learning(深度学习)”相关的东西……但即便是看到学习二字,也请务必先冷静下来!

如果你关注在线教育,可能多少都会听到些与“Deep Learning(深度学习)”相关的东西……但即便是看到学习二字,也请务必先冷静下来!深度学习概念源于人工神经网络的研究,是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。

追溯深度学习如何成为教育圈的热门词汇,要回到2014年5月:Coursera的联合创始人吴恩达(Andrew Ng)加入百度担任首席科学家,并负责百度研究院的领导工作。由于Ng本人拥有“机器学习和人工智能领域国际最权威学者之一”的神秘光环,“深度学习”又作为这个领域的重点研究之一,配以Coursera的标签,教育圈迅速迎来了一股不明觉厉的科技风。芥末堆也曾有作者与大家分享有关机器学习的硬干货,只是在当时与之讨论的寥寥无几。

因为许多人都还在困惑:深度学习和我们传统意义上的教育培训有什么关系?

于是在2014年底,好未来-未来之星发起了一场“深度学习研讨会”,邀请到百度深度学习研究院院长的余凯、神马搜索架构师张栋、云知声创始人兼CTO梁家恩三位老师到场分享。

以下为精华摘要:

余凯:深度学习为什么重要?

今天是一个智能时代,我们可以看到各式各样的产品,像智能手机、手表、手环、冰箱等产品。但是否真的智能?或者它只是一个商业模式?我们需要去判断。但是我们发现绝大部分的东西跟过去的老式收音机差不多,都是事先编好指令,它便可以自己完成工作。但是这个过程并没有它自己的思考。唯一不同的是,之前的程序不是用电脑程序代码来写的,可能用机械或者是电路做的。

人工智能就像我们人一样有眼睛有五官,可以感知周围的环境,可以对环境进行理解和思考,最后达到目的。这个思考的结果,就是决策控制,是人工智能的最重要的核心。那么深度学习能为什么重要?

第一,它模拟了仿真的大脑的结构和行为。在连接人和服务的通路上扮演非常好的角色。

第二,Deep Learning特别的适合大数据。由于模型和计算的原因,它的数据规模不断的增加,效果不断的变好,所以它要是一个很宽的管道,数据才可以进来更多信息可以出来更多。

第三,Deep Learning它提供了一个非常灵活的建模语言。很多人认为Deep Learning是一个黑箱系统,但是它实际上是提供了一个框架,就像一个语言。机器学习也是这样的,不只是懂数学就好,要学会运用这个工具。并且它带来的语言框架在不同的模型里面都可以针对性的解决问题。

第四,图象和语言的联合的处理。因为我们人每时每刻都是语音和图象同时处理的。比如我们看到一个图象,不仅要描述有什么物体,还要描述发生的故事。但是现在,用Deep Learning的程序就会自动生成,它可以像人一样生成自然语言,而且可以描述图象发生的故事。比如用一个基于CNN的深度神经网络,中间会有一个中间层,上面的是基于语言的深层模型,那么它便可以从当前的Word,生成下一个Word。

总的来说,Deep Learning在很多领域里面都可以取得很大的进展,最主要三个方面:1、大数据。2、计算能力。3、算法的提升。

梁家恩:深度学习与在线教育有什么关系?

深度学习现在可以看到在整个感知智能上应用是非常成功的。在座有CEO也有CTO我是一个当过CEO的CTO,作为CEO我们关注是这个东西有什么用,大概是什么概念?云知声作为一个创业不到三年时间的公司,我们在这方面也做了一些深度学习的一些技术,同时也取得比较好的效果。我们也是国内比较早一批把深度学习网络学习运用在工艺应用的东西。当时他们还很怀疑我们这么小的公司可以做这个事情。我们回过头来看这个是人性嘛,这个词可以表达这个意思。

在线教育里面有很多,包括K12的体系,还有社会化的体系,在我们所有的学习里面跟语音识别技术关联最强的是我们怎么用我们的技术帮助学生学习英语学习,培养汉语普通话以及帮老外学习语言,这是我们做的尝试。大家也可以看到,这是比较经典的一种流程,比如说有了一些这种语音过来以后,我们就把这个语音跟它所说的内容给它对齐起来,对齐之后在发音在流利方面的一些特征。比如说它在读一个句子我们是清楚的,但是要把它说话的内容把这个声音对齐起来,我们才知道这个学生它的发音跟我们有没有偏差,或者是说它有没有足够流利,这个就可以分辨口音口语的质量。

大家做在线教育,我虽然做过几年,现在基本上从教育角度来说我还是门外汉还是被教育的对象。在90年代的时候出现一些网校做远程教育,这个也不是特别的红火,2000年的时候很多的培训转到网上来了。到2011年的时候很多互联网的巨头都在发力的一块。很多PC以前会用电脑的人不多,现在基本上人手一部手机,又有计算能力又可以上网,所以中国有六个多亿的网民,移动网民超过五个亿,有非常多的用户在上面,在线教育就成为非常火热的点,我们在投资圈也有非常多的风投,巨头阿里巴巴也在投这一块,不管他们是直接做,还是投资去做,这个未来是非常大的增长点,这个是我们今天开这个会的时候,这里面有很多老师琢磨这个事情,确实这个也是在一个风口上面。

关于深度学习和在线教育里面其他应用的探讨,学霸君的老师他们是做这一块的拍照方面擅长的事情,图片收集是他们擅长的业务之一。在题海里面能有一个题海的神器,拍照可以把答案找到。还有题库的标注,特别是内容里面的谷歌的标注,因为可能大家积累的历史的数据比较多了,以前是纸质的,扫描以后还要把这个题库建立起来,还有机器人聊天。如果做开放式的聊天的话,它完全不可能。在英语的话,在特定的场景下,买东西,问一个天气啊,这个学生学习的时间有限的话,通过对话把这个互动建立起来,这个可能会做的好玩一点。

不过最后一点是比较科幻了,可能是十年之后的事情。

张栋:深度学习的延伸在哪里?

首先是一个小故事,就是林彪打仗的时候总是胜利是因为他关注数据。比如说每一次战役他会让大家统计缴获的长枪的比例,通过三个问题就可以判断敌军。大家有一点统计学的概念就知道这三个问题是机器学习的三个特征:要有一些数据,通过数据做特征,通过特征做判断。这三个是通过特征做一个判断,这个判断是一个分类器。为什么是大数据时代呢?现在的数据量每人每天获得的数据量是当年亚历山大图书馆的数据量。互联网本质上是什么?互联网本质上在我来看实际上把各式各样的线下的数据搬到线上。新浪就是把新闻数据从线下搬到线上。再往后就是电商,电商是把产品搬到线上。O2O是把服务线下搬到线上。所以这个数据是导致是爆炸的增长,互联网一天产生的数据一天可以刻1.68亿邮件,所以是很大的数据。

大家认为大数据就成为了一个类似于石油矿山类的资源,那怎么去挖掘这个资源?2013年被称为大数据元年,甚至上升为政府的高度,美国政府把这六个部门聚集起来,制定了一个大数据研究发展倡议书。这个图是给了大家一个整体的一个大数据的这么一个应用的蓝图,左边一些是所有各式各样你能够采集的数据(而且我认为万物皆数,即万世万物都可以用数据表征的。这个话不是我说的,最早是这个学派说的这句话)。然后右边就是这个各个行业应用,大家可以看到这个大数据在电子商务、医疗、军事、创意、广告。一边是数据源,一边是应用。

但在各种应用当中,它回到机器学习的算法是哪类算法?我对大数据有一点思考,这个是我以前写的一个微博其实本质上互联网所有的公司都是大数据公司。你想想BAT百度是网页和用户搜索数据,阿里巴巴是最大的电商数据,腾讯是人的最大的交互交流沟通数据,这个做大的公司都是大数据公司。因为他们最重要的资产都是数据资产。这些公司有一个共同点在初期商业模式都有一个摸索过程。为什么早期的时候没有商业模式,因为它规模没有到达一定的点,所以就没有商业模式。百度之所以上百亿网页的时候就没有商业模式,但是作为一个小公司就没有一个商业模式。当你的用户数和你的数据到达一定的规模的时候,这个商业模式自然而然就出来了。如果你想做大数据相关的应用要在大公司,因为大公司已经有这样的平台和数据了。

1、本文是 芥末堆网原创文章,转载可点击 芥末堆内容合作 了解详情,未经授权拒绝一切形式转载,违者必究;
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。
来源: 芥末堆
芥末堆商务合作:王老师 18710003484
  • DL研讨会:深度学习和在线教育有什么关系?分享二维码