杨现民:大数据支持下的智慧教育管理(报告全
首页
阅读:
admin
2019-10-07 07:02

  ”可订阅哦! 杨现民 江苏师范大学 副教授 杨现民副教授在“互联网+教育”变革路径之开放论坛上发表了题为

  杨现民 副教授以下为杨现民副教授报告全文我今天给大家分享的题目也是最近热议的一个话题——大数据,我重点探讨的是大数据支持下的教育管理怎么转型,我汇报的内容包括理念和一些实践案例,将两者结合来探讨我们未来的教育管理将会有什么样的转变。 我将从以下四个方面进行今天的汇报,首先我们要了解什么是教育大数据;第二是从信息的视角去解读智慧管理;第三,目前大数据在教育管理中的应用究竟有哪些典型案例;最后分享大数据在教育管理应用中值得思考的几点问题。

  什么是大数据呢?大数据的概念是什么呢?许多专家给了一些界定,有的说是4V,也有说是7V,这些概念的共同之处都是说量很大、来源很广、价值的密度很高、产生的速度很快。但我个人认为目前大数据的内涵是需要拓展的,我们应该不仅仅把他看成一种技术还应该看成一种能力,尤其在信息时代,他是一种能够从纷繁复杂的事物当中寻找到其中关联的一种能力,也是一种预测的能力,同时大数据更是一种思维的方式。以前我们更多的是一种思辨式的、经验式的,大数据时代是靠数据说话的,你说你的课上的很好,你有数据说明吗?你说你学校管理很好,你有数据佐证吗?

  同时我觉得大数据目前正在慢慢的演变成一种文化。大数据能演变成一种文化很重要的推动因素是国家很重视,国家提出了大数据的战略,包括习大大在世界互联网大会上提到国家“十三五”期间实施大数据战略,其中必不可少的一项就是教育大数据。

  目前我们谈论的比较多的大数据,都是哪些领域大数据呢?首先电商的大数据,这与我们很多人都很相关,尤其是很多女性朋友离不开淘宝;第二是交通的大数据,这也与我们的生活息息相关,尤其是开车的朋友;还有就是金融的大数据、工业的大数据,这是我们关于大数据谈论比较多的。

  有人可能就会质疑,那究竟教育领域有没有大数据?我觉得这是一个技术问题。有没有?那首先,我们就来做一个数据体量的初步测算,我们团队做了一个这样的计算,我们是基于2014年全国教育事业的统计公报,这份公报统计了我国基础教育阶段有多少所学校有多少人。然后我们大体看在幼儿、小学、初中高中有不同的班格,我们计算他们班的人数,同时我们有一个计算框架,那么教育大数据一年的体量我们可以从几个方面来看。

  一是师生的基本信息数据量,在基本信息中我们只看学生的学籍档案,老师的教学档案,从档案来看基本上是20K左右。课业的测试与作业的数据量,比如说中小学,一个学年考四次,期中和期末,一份试卷大概是270K,结合学科数、次数以及学生数我们测算出课业测试和作业的数据量。第三是关于校园里面实录的数据量,这包含两个部分,一是课堂实录数据,二是24小时的校园安全监控数据,我们也有一个测算,例如,一节课的课堂实录我们按110M来估算,校园安全数据1小时大概在300M左右。第四是课程的资源量,因为现在的中小学都有配套的数字资源,我们也做了一个测算。具体的算就不给大家介绍了,在这里我只是公布一些数据。 基础教育的一年的数据量大概在35.22ZB,ZB是什么概念?我们先不说ZB,我们先说PB,因为目前讨论PB的比较多。假如说我们现在有MP3音乐,平均4分钟一首歌,一分钟大概是1M一首歌曲大概是4M,你需要播放两千年,才可以把1PB的MP3音乐播放完。另外一个例子,一张3M左右的7寸图片,将这样的图片排够1PB大概有四万八千英里,大概是绕地球两圈。

  那大家说教育有没有大数据?不管是按照PB的量算还是用ZB的量算,教育领域确实有大数据,而且我们统计的这些数据仅仅是基础教育领域的大数据,很多校外的数据、网上学习的数据我们都没有包含其中,仅仅是常规业务当中就达到了35.22ZB。所以我们有一个结论是教育领域有大数据。那究竟什么是教育大数据?我有一个概念的界定,教育大数据是指在整个教育活动过程中产生的、根据教育需要采集到的、用于教育发展并可创造巨大潜在价值的数据集合。教育大数据绝对不仅仅是教育课堂的数据、分数的数据,还要涉及到学生的家庭背景、经济状况等等各方面的信息数据,强调数据的关联性和交叉性。

  在《中国教育信息化》杂志评选的中国教育信息化十大热词中,教育大数据位列第七。 关于教育大数据主要有两个产生渠道,一种来源于教学活动,另外一种来源于教育的管理活动。

  教育大数据跟传统的大数据有什么样的区别?我做了这样一个对比,传统的教育数据有阶段性的而且是部分的采集,目前我们采集的更多的是学习的信息或者是老师档案的数据,而教育的大数据应该是持续的、全面的采集;传统的数据是在非自然状态下采集的,而且很多时候是社会采集,而教育的大数据的采集一定是在自然状态下的,更强调动态的实时性;第三从应用方面,传统的教育数据是统计汇报,更多的是一种结构性的数据,而教育大数据是一种深度的、多元的分析,数据的挖掘,强调多样化的数据;传统的教育数据更多关注的是宏观层面,关于区域层面的比较,而教育大数据不仅仅是宏观,他最大的优势还是在微观上,他可以精准地判断某个学生的知识结构有什么样的缺陷,另外在预测、预警方面也有很大的作用。

  下面我们来看一下教育大数据与其他领域的大数据有哪些区别。比如说与电商的大数据有什么区别?目前我们听到比较多的是淘宝的数据魔方,他有一些排行、关联分析、市场分析等等。

  还有是在智能交通以及网络安全领域,有这样一个中国网络骗子地图,这张地图统计骗子最多是在中国的东南部,而且不同的区域的骗子类型不一样,比如说在上海最多的是假淘宝、假京东这样的骗子。这就是基于大数据做的分析。

  那教育大数据跟这些领域的大数据有哪些不一样呢?我认为主要体现在以下三点,教育领域的大数据采集呈现的是一种高度的复杂性的,教育大数据的采集跟电商大数据的采集不一样,电商通过支付、操作等行为就可以采集很多数据,而教育领域数据很难采集,尤其是在校外的,非正式学习领域的数据,如果说他不用网,不用手机你怎么采集他的学习数据。

  第二就是关于教育大数据的应用要有高度的创造性。这跟商业数据不同,商业数据挖掘只需要找到数据之间的关系提升营业额就可以了。

  那教育应该怎么做?教育的目的是什么?有专家说教育的目的是创新创造,那我们怎么用大数据服务于学生的创新创造能力,所以教育大数据的应用要有高度的创造性。其他领域的大数据更多的关注的是相关,而教育大数据不仅仅要了解相关,更要了解他的因果。为什么用这种方法,就会导致学生创新创造能力的提升,就会导致学生学习兴趣的提高,为什么?教育大数据还他独特的价值,主要体现在三个方面,一是战略资产,二是目前教育大数据是教育领域综合改革的科学力量,三是教育大数据是发展智慧教育的基石。

  大数据怎么推动教育的转变呢?我做了这样一个总结,首先从教育过程上来说,大数据让我们实现了非量化到量化的转变,现在有一种自我量化技术,通过可穿戴设备随时随地测量你身体的各项指标。 第二就是教育决策正从经验化走向数据驱动的科学化;第三是教育的模式正在从大众走向真正的个性化;教育的管理正在从不可见、纯经验式的走向一种可视化的、数据驱动的;教育评价从单一化的评价走向综合性的评价,随着创客、智慧教育的发展,整个教育综合改革的推进,教育评价一定会起到一个导向综合性评价作用。

  我分析了一个教育大数据结构模型,这个结构模型分为四层,第一层是基础层,也就是我们国家最最基础的数据,是高度保密的数据;第二是状态层,各种装备、环境与业务的运行状态的数据;第三是资源层数据,最上层是关于教育领域的用户行为数据。

  关于教育大数据的冰山模型,目前我们更多的是采集一些显性化的、结构性的数据,而存在冰山之下的是更多的非结构化的,而且真正为教育产生最大价值的数据是在冰山之下的,需要我们有一双“慧眼”,怎么把他们挖掘出来。

  关于教育大数据的发力点我们总结了几个方面:教育发展水平评估、教育资源均衡配置、教育舆情监测与剖析、数据驱动的教育决策、即时学习诊断与预警、学生的发展性评价、基于大数据的科学研究。

  下面一个内容是信息化视角下智慧教育的管理,我个人认为管理的信息化是走在我们教育信息化的前面的。上午我参加的一个产品评审会,从他们教育信息化的组合解决方案中我们发现教学是其中的一个短板,而在管理方面却很丰富。

  我们国家在教育管理方面也取得很大的成绩,但问题依旧存在。我们说了很多年的孤岛的问题到目前依然存在,我们强调管理的整合,但到目前很多学校做到的仅仅是单点登陆,但单点登录能保证所有数据是融通的吗?所有数据是跨界融合的吗?我认为未必能够做到。另外在智能化程度方面,目前总得情况还是人管电控,我们学校所有的投影设备都是工人在维护,我想中小学可能也是这种情况。技术怎么服务于教育的管理层是我们要思考的。第三,我们对数据缺乏系统化的、精细化的管理,所以难以支持精准化的教育决策。最后是教育监督系统不到位,难以进行动态监管。

  智慧管理的基本特征注意体现在七个方面:教育的智慧管理首先要实现教育业务全面数字化;第二运维是智能性的;第三要有安全预警功能;第四智慧决策;第五远程督导;第六强调业务的协同,业务流程的重构,大大提高管理的效率;第七强调个性化的智能服务。

  关于智慧教育管理的一般流程,我也绘制了一个图,我将其归结为四步走的管理模式。第一监控教育过程,采集数据,第二要进行深入数据挖掘进行智能分析以及预测,第三步将预测的结果、诊断的结果通过可视化形成呈现出来,形成一种智慧决策,第四就是根据智慧决策发布调度指令实施优化管理。

  下面我想和大家分享一些关于智慧管理的应用案例。我们团队梳理了国内外大概四五十个典型案例,在这里我在每个方面大概选取了2个案例与大家分享,一个国内一个国外。 在大数据支持智能运维方面。第一个案例是清华大学智能运维服务。清华大学采用SiteView、Cati等专业的监控系统,这一系统能够实时采集所有装备,包括软件和硬件的工作状态,提供报警,同时提供相关报表,进行智能分析,此外这一系统支持管理人员的远程登录、管理和维护。

  清华大学的这一预警系统有几个方面的特点,一是做了一个智能管控,二是对故障进行及时检测,第三加强了各种硬件设施的智能管理,第四是预警通知,预警通知之后支持远程管理。这是清华大学的一个案例。

  美国也有一个案例,这所大学用大数据做校园的安全管理,上次我们参加一个全国智慧教育高层论坛,有专家提出目前学校IT的安全管理很成问题,那大数据怎么发力呢?这所大学用一款名为SPUNK,的软件,这是一种日志管理维护的软件,一个学校所有的网站,所有软硬件设备,这个软件都可以收集他们的日志,他把每天产生的日志搜集起来做分析,通过一套模型和算法分析,检测账户的异常,学生行为的异常,包括服务器硬件设备的状态等等。同时他可以实现快速的检测、定位和诊断。

  这是他们的一个架构图,把各种软硬件所有信息汇总到日志中心,然后用他们自己的模型进行数据分析,这是一个统计图表,右侧是一个预警方式的设定。

  下面分享大数据支持科学决策方面的案例。 首先来看深圳的一个案例。深圳用大数据做了一个教育资源的动态科学规划,这个案例其实是很有启发性,目前中国的教育资源可以说很多,但是也可以说很少,很少是对于偏远地区或者说某一个薄弱校区而言的,有些应该享受优质资源的没有享受到,反而他本身已经有了很好资源的却的不到更多的资源,那做一个科学的动态规划就很有必要。 深圳是基于什么样的方式来实现资源的动态规划的呢?他综合了各种各样的数据,包括人口流动的数据、学校分布情况等等,通过各种各样的数据计算来做预测。判断可能在这个学区,在未来三到四年增加一所学校,他是根据流动人口的情况、根据生育情况、学生升学的情况等等综合判断的。国家现在放开了二胎的政策,更应该用大数据预测一下,学校设点设在什么地方,设多少,是什么样的学校,师资的配备是什么样的。

  另外是美国的一个案例,美国构建了一种立体化的教育数据网络来支持教育的决策。我们不得不承认在教育信息化或者管理信息化方面美国是走在我们国家前面的。上学期我也在美国访学过,国外的教授用远程的方式授课,他们把这种方式作为一种常态化的教学方式。我今年一月份在波士顿,雪很大,没有办法出去,波士顿政府把所有的交通全部封掉,所有的市民都要呆在家里,这时候技术就是一个很好的工具,老师用网络开展授课。再回到美国的教育数据采集网络,他有这样一个结构,首先国家层面,他有一个部门叫美国国家教育统计中心,类似于我们国家的教育部、教育管理信息中心一样,搜集各种各样的数据;在州的层面,部署了州一种纵向的数据系统,美国大概有40多个州,都用了这种州级纵向数据系统,可以采集州层面的数据;同时他在学校层面和我们国家数据校园差不多,有信息的系统、课程管理以及教学评价的系统。这样形成一种立体化的数据采集网络,从学校到区、州再到美国国家教育统计中心,所以美国的国家教育进展报告都是由这个中心提供的,因为他有很丰富的数据。他们在做这个事情在90年代就开始做,而我们国家部署的教育管理云的服务平台,两级建设五级应用也是刚刚启动。

  同时美国还有一个面向幼儿的数据研究项目。他是搜集幼儿从出生到上大学到毕业所有数据。数据采集完成后为政策的制定提供依据,为老师、为家长、为管理者提供决策依据。另外还有弗吉尼亚州从1992年开始部署纵向数据系统,此外纽约用一种数据驱动的教学决策,大概40万的学生在用这样的教学平台。

  第三个是大数据支持危机预警方面的案例。我们调研了很多,大概十几款国外的在线学习预警平台,这里我列出了四种。第一个是关于课程信号的,第二是关于可汗学院的学习仪表盘的,第三是一个海星早期预警系统,第四是加拿大Desire2Learn公司开发的学生成功系统,这些系统都内制了课程学习预警系统。目前国内很多课程学习管理平台也都开发了学习预警功能,但效果还我们还不是很清楚。

  我们从预警的方式、预警的内容、预警的效果以及优缺点方面对五种在线学习预警系统做了一个对比分析。

  第二个预警体现在学生管理与发展预警方面,在这一方面网络上有很多报道,包括华东师大的餐饮预警、还有浙江大学的资产管理应用等。我认为目前最新的可能是电子科技大学做的一个教育大数据的研究中心,他们做的发展预警不仅仅是课程学习,他们更多关注在学校里面学生异常行为的预警,还有学生就业方面的预警,所以我把他归结为学生发展的预警。无锡做的是关于校园安全的预警,比如校园里异常的停留、校园里面打架斗殴等,管理者可以第一时间判断到。

  最后一个是大数据支持的个性化服务。这张图是一个羊绒的披肩,这张图很火,因为这是我们的彭妈妈在英国访问期间,帝国理工学院的设计者设计的,设计者基于700多张在各种场合的着装照片进行计算设计的。

  在个性化方面,美国有一个马鞍峰社区学院,他们做了是一个完全面向学生发展的系统,学生应该选什么样的课程,应该采用什么样的方式,系统通过一套算法给学生推送不同的服务。

  我们国内其实在去年报考志愿的时候,很火的就是百度的大数据,辅助学生智慧择校,包括专业的选择、分数的预测、职业的选择等等。

  以上是几个案例的简单分享,下面一个议题是值得探讨的问题。 我们国家目前可以借鉴美国,去构建一个立体化的教育数据网络,那怎么去做呢?首先应该以国家的教育管理公共服务平台做一个革新,然后把我们国家各层、各级教育系统打通,实现教育数据纵向贯通和互联,这样就可以把所有的数据形成一个良性的循环。对数据实现持续、动态、标准化的采集。这是第一个问题。

  那第二个问题是关于应用推广的问题,我这有一张漫画,BigDate很火、很有价值,但是怎么用却是其中最难的部分。右侧这张图是讲我们目前其实可以采集数据,但是我们缺的是一种分析的能力。我们有了数据不知道怎么用。我认为目前国内不管是高等教育还是基础教育还没有很成熟典型的创新应用案例。

  第三个重要的问题是如何保障教育数据质量与安全。其实有很多因素会影响到教育数据质量,如果我们本身采集的数据本身是不合规的、质量不合格的,他预测的结果会是准确的吗?肯定不准确。所以我们要保证数据的质量,首先从采集技术方面,实现自然状态下的采集,其次要有管理规范,加强管控,最后还要对学生的隐私进行保护。

  最后一个问题也很重要,要想让大数据真正成为一种活水,让他流动起来,就要给规范让大数据合理合规地运营。政府、企业、教育相关人员都应该参与其中,每个不同方的职责、权利、义务是什么,目前国家还没有界定。其次是关于运营的边界问题,美国在运营大数据,但是运营不到两年时间就关闭了这个公益的组织,主要是因为涉及到隐私的问题。最后是关于数据的适度开放的问题。教育数据是我们国家的一种教育资产,不可能完全开放,那怎么适度开放呢?目前也没有做界定。

  目前我们正在做《中国基础教育大数据白皮书》,希望各位有关于教育大数据的应用案例的可以通过以下邮箱与我们分享,感谢各位。