学术资讯

当前位置: 网站首页 - 学术资讯 - 正文

【学术论文】基于需求图谱分析的智慧教育督导发展策略研究——以国家智慧教育督导平台建设的实践为例

点击量: 时间:2023-06-01 编辑:罗添

摘 要:国家教育数字化战略行动背景下,信息化建设进程进一步加速了教育资源融合、教育供给结构转型以及教育治理模式创新。作为教育治理体系架构下的重要组成部分,教育督导迈向“智慧化”是应然选择。如何顺应时代发展需求、顺应人民群众对教育公平与教育质量的美好诉求与向往,需要在国家、地方各级各层教育用户需求之间做好平衡、兼顾、取舍,设计一整套贴合需求的智慧教育督导体系架构——服务于教育全域突出问题的研判与解决,从而实现教育督导从单一业务管理功能转向监测分析与公众服务并重,推动教育督导治理体系和治理能力的升级,为教育提质增效保驾护航。课题组基于国家智慧教育督导平台建设的实践,面向全国督导战线干系人(省、市、区、校督导负责人、家长等)开展调研和访谈,充分利用基于语义主题发现用户需求的思路方法,采用文本挖掘技术对多源异构数据进行处理,抽取需求特征词库,并与督导业务流程建立映射关联,绘制需求图谱。通过对图谱进行释义和解构,为精准感知各级教育督导业务需求提供科学分析与决策支持,为我国智慧教育督导发展路径提供策略建议。

关键词:智慧教育督导;需求图谱;文本挖掘;主题聚类;策略建议;

 

一、问题缘起

伴随着新一代信息技术的创新发展,大数据的研究和应用也渗透到教育领域,高质量教育体系的构建依赖教育数字化转型(祝智庭等,2022)。《教育部2022年工作要点》提出“实施教育数字化战略行动”,加快推进教育数字转型与智能升级,要求按照“需求牵引、应用为王、服务至上”的原则,深入推动全领域、全要素、全流程、全业务的数字化意识、数字化思维和数字化应用(黄荣怀,2022)。《加快推进教育现代化实施方案(2018—2022年)》中提出要重视数据对教育治理的作用,开展数据支撑下教育治理模式的创新与变革(张志华等,2022)。聚焦教育督导领域智慧化建设,充分利用智能技术感知、预测和预警教育方针贯彻落实、教育投入保障、教育评价改革、师德师风及校园安全运行等情况,及时把握师生认知和身心变化、家长和社会舆情变动,主动、及时、精准地作出决策,形成教育数字化治理新策略和新能力,实现教育督导数字化转型升级,成为应然之选。

近年来,在国家教育信息化政策推动下,伴随基础设施、教学平台建设,国家和地方在智慧教育督导方面已经取得了较为丰富的基础性成果,如省级人民政府履行教育职责测评系统、国家义务教育质量监测平台、幼儿园办园行为督导评估系统、县域学前教育普及普惠督导评估申报和审核系统等。地方层面的典型案例:北京教育督导信息管理应用系统中设计开发的督导数据采集功能、督学责任区网格化管理功能、教育舆情监测功能、教育决策支持功能等(赵丽娟等,2018)。学界也有关注智慧督导的学者对“智慧督导”进行了概念界定,分析了人工智能时代教育督导工作队伍的建设策略,提出在基础教育领域形成政府宏观管理、学校自主办学、社会参与评价、多元主体协同共治的治理模式(刘梦梦等,2020)。也有学者提出通过机器人即时智能回复与人工客服功能相结合的平台构建,探索基于互联网的交互式教育评价(郑巧等,2008;刘广超,2019),或提出新一代信息技术,力图从治理结构上推动协同化的治理主体、扁平化的治理层级、透明化的治理空间,从治理功能上推进科学化的治理决策、精准化的社会治理和高效化的公共服务(陈潭,2021)。

综上所述,不管是工作实践还是学术研究,信息技术赋能教育督导变革,不断推进教育督导向“智慧督导”进阶。督导职能向双属性演进,即“业务管理属性”和“公众服务属性”并重。因此,精准把脉“双属性”驱动的需求,是构建我国智慧教育督导(以下简称“智慧督导”)发展框架顶层设计的关键。然而,在当前复杂的互联网和移动应用环境下,服务供需双方“双盲”现象普遍存在,通过构建需求图谱来分层拆解问题目标,逐级精准定位,才能找到最适切的理论框架、创新取向及其技术路径。基于“多元共治”理念,利用信息技术将碎片化的用户需求进行知识萃取、知识融合和知识挖掘,从离散的非结构化的数据中整合出有价值的用户分层分类需求,在教育督导领域知识、信息化应用模式、用户个性化需求之间建立起互联互通的“桥梁”,是本研究所体现的价值意蕴。

二、研究设计

为了明确我国智慧督导发展的方向和重点,课题组基于国家智慧教育督导平台的建设实践,从问卷客观数据结果、主观访谈诉求表达切入,采用调研问卷数据分析和访谈文本LDA主题算法挖掘两种方法,对两种模态的数据进行深入挖掘,以求更全面地反映地方需求。研究设计思路如图1所示。

(一)研究对象

研究以全国31个省(自治区、直辖市)和新疆生产建设兵团的省级、地市级、区县级督导相关人员及学校负责人为研究对象,采用分层随机抽样,对省级人员、市级人员、区县人员和学校负责人进行分层抽样。具体步骤为:(1)每个省份抽取1位省级人员,共计32人;(2)每个省份(除直辖市、建设兵团外)随机抽取4个市,每个市抽取1人,共计116人为市级人员(21×4+6×2+4×5,考虑到部分省份为平台建设的试点省份,或已有成熟的省级督导平台,因此,浙江、湖南分别抽取6个市,江苏、宁夏、辽宁、四川分别抽取5个市);(3)每个省随机抽取3个区县,每个区县抽取3人,共计108人为区县人员(26×3+6×5,考虑到4个直辖市没有市级,以及部分省份为试点省份,因此,这些区县人员分别多抽取2人);(4)每个省份随机抽取两所学校,每所学校抽取1人,共计64名学校负责人。综上所述,研究对象包括省级人员32人(占全部样本的10.0%),市级人员116人(占全部样本的36.2%),区县级人员108人(占全部样本的33.8%),学校负责人64人(占全部样本的20.0%),平均年龄为40.12±2.93岁。另外,研究目的、自愿原则等相关事宜已提前告知研究对象,并取得其同意。研究共发放问卷320份,最终均有效回收(有效回收率100%)。

1C19A

图1 研究设计流程图

(二)问卷编制

目前,关于智慧督导的研究较少,仅万红波等人(2018)提出过明确概念:智慧教育督导是教育督导信息化、网络化、智能化的一个过程。本研究结合上述定义,参考教育督导信息化和教育管理信息化的概念,提出智慧督导的概念内涵。前者指充分利用信息技术开发利用教育督导信息资源,促进信息交流与共享,充分、高效、科学地履行教育督导职能的过程(赵丽娟等,2018),后者则为推动政府转变教育管理职能、提高管理效率和建设现代学校制度的有力手段(教育部,2012)。综上所述,本研究认为智慧督导为利用大数据、人工智能等信息技术,整合、共享、建立教育督导相关数据、资源和指标模型库,将其融入教育动态监测、信息研判、可视化智能决策等环节,从而形成科学、高效、多方参与的教育督导新生态。

已有研究证实,政府电子服务能力受政府互联网资源、科技人才、财政支出、需求规模、经济发展等因素的影响(丁依霞等,2018)。此外,《教育信息化十年发展规划(2011年—2020年)》中提出,未来教育信息化行动包括:(1)提高教育信息管理水平,即建立教育管理信息标准体系与系统,推动教育电子政务,优化教育管理与服务流程;(2)多方共建共享,即要形成政府购买服务与市场提供个性化服务相结合的机制;(3)信息化队伍建设,即加强教育信息化标准化工作和队伍建设;(4)经费保障机制,即制定教育信息化建设和运行维护保障经费标准等政策措施(教育部,2012)。本研究参考相关文献与政策文件、咨询4名专家(2名技术研发人员,2名教育部督导业务工作者),最终确定问卷结构包括4个维度,各维度的题目数分别为17、9、5、3,共34个,详见表1。

表1 问卷指标体系

37C7D

(三)检验效度

课题组邀请6名专家对问卷做内容效度评价。在6名专家中,3名为地方系统技术人员,3名为教育领域高校教师(教授1名,副教授2名,分别来自教育技术专业、应用统计专业、教育管理专业);博士3名,硕士1名,学士2名;工作年限为5.83±1.25年。6名专家均认同问卷的指标体系,问卷总体内容效度为0.89,内容效度良好。课题组参照专家意见对部分问题的措辞进行修改,删除包括重复含义的题目,最终确定问卷总题目数为31个。

(四)访谈大纲编制与对象选取

为全面了解各地智慧教育督导平台建设情况,课题组采用文献调研与专家指导相结合的方法编制访谈大纲。对31个省(自治区、直辖市)和新疆生产建设兵团已有智慧教育督导平台建设的各级用户进行随机抽样访谈调研。本次访谈前后共计开展四轮调研,访谈对象为从有效问卷中随机抽取的样本,共160人,抽取方法为:(1)4个直辖市省级人员均为访谈对象;(2)市级人员为每个省份样本人数除以2后的向上取整;(3)区县人员为每个省份样本人数除以2后的向下取整(4个直辖市不做处理,试点省份向上取整);(4)学校负责人访谈对象量为问卷样本量的一半(试点省份不做处理,另从东部、中部和西部地区中各选取1个省份不做处理)。访谈分为4轮,每轮访谈对象人数为40人。为保证访谈数据结果的代表性,访谈对象来自东部、中部和西部的省、市或区县各级工作人员,同时包括平台所面向的五级用户。

(五)LDA主题模型的研究设计

为了在问卷之外更开放性地获取地方对智慧教育督导平台建设的需求点,我们综合使用了文本聚类方法。传统的TF-IDF模型由于向量维度过高、数据稀疏,不能解决同义词和多义词问题。LSA (Latent Semantic Analysis)模型和PLSA (Probabilistic Latent Semantic Analysis)模型虽解决了上述问题,但算法复杂度较高(Hofmann,2003;Landauer&Dumais,1997)。LDA主题模型对PLSA模型进行了贝叶斯改进,通过引入文本主题分布来降低数据维度,减少模型运算的复杂性(Blei et al.,2003)。LDA主题分析模型(Latent Dirichlet Allocation)由Blei等人提出,主要用于推测文本中的隐含主题,它使用一个服从狄利克雷分布的维隐含随机变量来表示文档中主题概率的分布,来模拟文档的产生过程(Blei et al.,2003)。本文使用LDA模型对访谈数据进行挖掘。

1. 数据采集

本研究对160位随机样本进行4轮访谈调研,将访谈录音转为访谈纪要文档。文档筛选过程为刨除标题、访谈人与访谈对象的基本信息、人名类词语、内容提纲类文本,最终得到访谈的客观和主观记录文档共计140份,699,298字,3,182个自然段落,平均每份文档约4,994个字,22个自然段落。

2. 文本预处理

本文采用Python3.7的jieba分词包、re字符串处理包,通过自定义用户词典分词处理,筛查出错误词汇与无实际意义的词汇,形成停用词词典,最后去除停用词,对文本进行向量转换。具体转换步骤如下:第一,通过梳理《深化教育督导改革转变教育管理方式的意见》《关于加强教育督导与评估工作的意见》等51份政策文件,筛选出教育督导相关的专业性词汇,如“优质均衡”“教育职责”“基础教育”“学前教育”等,丰富自定义用户词典;第二,通过jieba分词包,对原始访谈文档进行分词处理(如图2所示),并从中筛查出错误分词的词汇,将错分词汇整合后添加至自定义用户词典中,以便计算机识别;第三,根据分词处理后的结果数据,筛选出语气词、虚词、助词、人名等一些无实际意义的词,如“个人建议”“总结”“举个例子”“陈处长”等,形成中文停用词词典,提高访谈文档与智慧教育督导的相关性;第四,使用Python中CountVectorizer函数对去除停用词后的文本进行向量转换,转为LDA模型分析所使用的向量模式。

3. LDA模型参数设置

本研究提取特征词语数量为3,000个,纳入关键词的最大、最小阈值为50%和1,前者意味着若某个单词的频率大于50%,将不视为主题的关键词。本研究采用1,000次为最大迭代次数,α值设为50/K,β设为0.01(徐戈等,2011)。

三、调研结果

(一)问卷结果

1. 教育信息管理与共建共享

调查数据表明,66%的调研对象表示本省(市)已建立正在使用的网页或客户端形式的智慧督导平台,且平台使用频率高(占比86%)、用户规模大(200人以上占比57%)。但仍有81%的调研对象表示平台之间数据不互通,且没有外链的数据库。在平台业务上,主要聚焦于督政、督学和评估监测,占比分别是95%、86%和62%。在平台建设与维护上,97%的调研对象表示平台来源于市场采购、单位与企业联合研发;95%的调研对象表示平台由第三方专业团队维护,这一群体中已提出平台的升级改造计划的调研对象占81%。在未来升级计划中,90%以上的调研对象表示希望建立辅助预警决策的智能数据可视化功能或系统。

2. 信息化队伍建设与经费保障机制

数据表明,88%的调研对象表示地方督导配备人数在3~9人之间,均值为7人,在这一群体中已专门设置督导人员岗位的调研对象占78%。在经费保障机制建设上,66%的调研对象表示当地已针对督导信息系统的建设投入相关经费并对来年提出经费预算,而“缺乏业务培训与指导”是主要的建设困难(占比97%)。

(二)LDA主题模型结果分析

大量研究证实LDA主题数K值对主题抽取的结果产生直接影响。在大量研究中,困惑度(Perplexity)是常用的主题数选取方法。它可以刻画主题模型的泛化能力,对模型的性能做出量化评价(Blei et al.,2003;王婷婷等,2018;赵凯等,2020)。但困惑度选取的主题数目往往偏大,从而使得主题之间相似度较大。主题相似度,通过测量两个主题间主题词概率分布间差异性来反映,往往采用KL散度(Kullback-Leibler Divergence)来衡量(Arun et al.,2010)。参考Arun等人(2010)的实验结果:KL散度越小,主题数越接近最优值(KL散度见公式2)。基于此,本文权衡模型的泛化能力和主题抽取效果,将主题困惑度与主题相似度作为最优主题数选取的指标。

4803F 

图2 文档语料分词前后对比(部分)

 

通过Python编写程序,设置最大主题数为15、步长为2来计算困惑度Perplexity得分。当主题个数为7时,困惑度Perplexity得分曲线和主题相似度曲线处于最低处(见图3和图4),因此基于困惑度Perplexity和主题相似度两种计算方法,所得到的最优主题个数为7个。

AC3D

图3 困惑度结果曲线图

9F25

图4 主题相似度结果曲线图

将7作为主题数代入LDA主题模型,通过运行Python程序后输出7个主题下的关键词。为节约篇幅,本文仅呈现每个主题下词频排名前五的关键词,主题-关键词矩阵如表2所示,主题占比与词频见图5。

表2 主题-关键词矩阵

1C0CB

(三)基于问卷、访谈数据协同分析的需求图谱构建

依据《关于深化新时代教育督导体制机制改革的意见》等51个文件的政策精神,课题组对问卷调研结果和LDA主题聚类结果进行了数据比对、溯源、编码。通过德尔菲专家分析法,对主客观数据结果展开综合赋权与融合分析,对问卷调研结果中可用于校验“需求”的Item因子和LDA主题聚类后的特征词库进行权重解析和综合评价。结果表明:问卷调查中的客观题数据能够较好地量化不同层级用户对需求要素的主观认知,其中的权重因子项与核心需求主题词有很高的一致性。

在需求图谱构建过程中,运用一级主题词(核心需求)和二级主题词(关键需求)对不同用户多个维度的细分需求进行精准绘制,进而为国家层面精准感知地方各层级的共性和个性化需求提供参考。如图6所示:一级节点为“核心需求”,包括提升社会公众参与、数据打通与融合、业务优化与一网通办、督导队伍建设、政策资源投入、智能预警与决策支持、提供多元化用户体验,其节点大小取决于LDA聚类系数由大到小的排序;二级节点为“关键需求”,包括五级用户、数据外链、多元形式、协同、可视化、信息技术。图6借助节点与节点之间的“边”,用可视化的方法形象地表达了专家赋权后的需求关系。

1. 提升社会公众参与

教育督导业务社会化是“管评办”逐渐分离的现代学校制度和教育公共治理制度的体现,有助于解决督导业务过于行政化,缺乏专业性的问题(黄崴,2009)。在提升社会公众参与需求中(占比最高,达20.2%),访谈过程多次提到“地方”(词频65次),其余高频词汇均涉及学生、家长、教师等督导前线人员。此外,在问卷结果数据中,57%的调研对象表示系统用户规模达200人以上,规模增大在一定程度上也表明有更多层级对象的纳入,这一事实在数据上也得到证实:在平台开放层级调研上,表明智慧督导平台开放应用层级至区县级的比例达100%。LDA关键词和问卷数据比例反映出调研对象对提升社会公众参与高度的需求,以及部分地区对该需求的响应能力。

22219

图5 主题占比和关键词频数图

2. 数据打通与融合

数据打通与融合是访谈者对平台建设的另一个需求(主题词词频占所有词汇词频的18.3%),他们希望智慧教育督导平台实现业务数据库的整合,并建立起统一的数据标准和指标体系,打破原有各地之间存在的数据壁垒。从LDA词频矩阵来看,“业务数据”的词频最高,为54次,这说明以数据驱动为导向是智慧教育督导平台的基石。这一事实在问卷调查中也有呈现,在已外链至其他数据库的地方督导系统中,教育事业统计相关数据库和中小学办学条件数据库的占比分别为33.3%和19.0%。词频矩阵中较高词频的词汇分别是“指标体系(52次)”“数据管理(35次)”“数据标准(30次)”;问卷中81%的样本也表示当地的督导系统并没有外链的数据库,仍处于“数据孤岛”状态。从主客观两个角度来看,在平台建设的数据方面,地方希望能够建立统一的指标体系与数据标准,将数据融合打通作为平台建设的重点。

3. 业务优化与一网通办

评估监测、任务单等5个主题词词频占全部词汇词频的15.8%,这反映了督导业务优化与一网通办的需求点内涵。根据问卷调研,智慧教育督导平台的业务使用基本聚焦于督政、督学和评估监测(在问卷调研对象中的占比分别为95%、86%和62%)。督导机构重组、义务教育普及和农村教育改革等历史为我国督导中督政、督学的结合提供了实践和理论本源(杨颖秀等,2005)。督政包括自上而下各级的督政,也包括各部门之间的横向督政。由此,督导任务单之间的流转显得尤为重要。在LDA数据结果中,“任务单”“业务”的词频分别为34次和30次。可见,地方需要将督政与督学过程中发现的问题以灵活快捷的任务单“一键触达”业务流转至各层级,以改善原有的各级业务线混杂、业务执行拖延的状况,实现业务的优化。另外,评估监测作为督导的重要手段,同时是督导三大业务之一(主题词词频占比62%),未来平台减少加入评估监测系统或功能也成为各地的需求(LDA主题词词频为57次)。

20FA1

图6 需求关系图谱

4. 财政与资源投入

财政与资源投入词频占比为13.0%。第一,“专家”和“信息技术”的词频分别是33次和32次,访谈对象表示希望督导信息化平台建立全国教育专家库,为地方提供专家咨询窗口,提高义务教育地区均衡水平。除了督导业务的专家资源投入,信息技术方面也是地方的诉求之一。50%的问卷调研对象表示在教育督导信息化中存在“缺乏专业的技术团队研发或维护系统”的困难。同时,某省督导局工作人员表示项目前中后期都需要大量技术支持,技术人员投入问题亟待解决。第二,从经费方面来看,“资源”和“财力”的词频分别为27次和23次,多个访谈者表示信息建设是个持续战,目前财政体系支持很不理想,且不同地区的资源存在差异。问卷结果也表明:47%的问卷调研对象表示“缺乏专项的经费支撑”。由此,专家投入和专项专款建立是督导信息化过程中财政资源投入的核心。

5. 智能预警可视化与决策支持

缺乏可视化交互呈现,难以有效、直接地支撑教育行政部门的各项工作(杨宗凯,2017)。在问卷调研中,90%以上的问卷调研对象表示希望建立辅助决策的数据可视化智能系统。LDA结果显示,可视化成为主要关键词(词频40次),访谈对象希望系统能够将数据智能化地转化为可视化大屏,而非传统上依靠人工的数据计算和文档呈现。决策依靠数据事实已经成为共识。在访谈文本主题挖掘中,“分析”一词也多次被提到(词频17次),这里指的不仅是传统数字的分析,还希望在平台中内嵌丰富的数据分析模型、文本挖掘模型,如word2vec、Mirt等,便于对督导评价和公众舆情数据作定时性、多样式的报告,为教育督导科学决策提供准确、科学的数据支持。另外,访谈文本中提到“调研”(词频12次),或希望能将实时调研数据实现报告自动化,或是对平台提供调研工具开发检验计算,或提供成熟的调研工具使用产生需求。最终,平台用户可以依据上述内置工具或系统有效读懂数据背后的问题,实现科学决策。

6. 督导队伍建设

督导队伍建设词频占比为12.8%。第一,“培训”词频最高(词频59次),97%的调研对象表示“缺乏业务培训与指导”。调研对象都表示未来培训要通过信息化手段,提供线上课程,解决各级人员培训队伍过于庞大的问题。第二,“队伍建设”也被提到多次(词频30次)。队伍建设包括年轻力量注入、信息化水平提高、岗位专职建设等方面。从队伍年龄构成来看,78%的问卷调研对象的年龄段在31~50岁之间,另有19%的年龄在50岁以上。访谈对象也表示多数督学为退休返聘,年龄较大,无法深入实地完成督学任务。从信息化水平来看,43%的问卷调研对象表示“人员信息化应用能力较低,使用系统较困难”。从岗位专职建设来看,仍有22%的问卷调研对象表示未设置专门的督导人员岗位。访谈对象表示当地的督学多为学校校长兼职,队伍松散。另外,“绩效考核”也值得关注(词频17次),访谈对象表示缺乏硬性的考核标准,熟人之间考核结果不客观,同时也表达了提供督学绩效补贴的需求。

7. 用户体验多元化

由于移动设备深入日常生活中,对于系统的使用不再局限于电脑的操作。“用户体验多元化”词频占比为9.1%,“智能手机”(词频26次)、“移动端”(词频13次)被提及多次,这反映出地方希望平台终端能够多元化,形成PC端和移动端的有机结合。如某教育局局长表示:“希望教育督导在信息安全上加强,未来能够在电脑、浏览器、QQ和微信上都打通,实现跨云端跨情景的使用。”“多功能”(词频24次)是地方在功能多元化方面的需求。地方希望系统既要有普适的功能,又要有个性功能,同时希望增加问卷调查功能以辅助地方督导决策。“小程序”也被提及多次(词频11次),“小程序”是指依附在某个应用程序上的接口功能,这一主题词的提出反映地方对智慧教育督导平台使用的任意性和伴随性要求高。正如某督学表示:“现在微信人人都有,督导平台应该嵌入微信,这样人人都会顺手使用。”由上可知,平台的移动化、伴随化、多功能化是地方对用户体验具体方向。

四、基于需求图谱分析的智慧教育督导发展策略建议

按照国家关于深化教育督导体制机制改革的整体部署,结合地方督导的实际需求,构建全国统一、分级使用、开放共享的“国家智慧教育督导平台”是我国教育督导向智慧督导转型升级的关键。基于上述研究结果和数据分析,深度融合国家与地方需求,我国智慧教育督导平台建设遵循的逻辑进路如图7所示。

督导的智慧化进阶,本质上是基于数据的深度运用。在图7中,平台建设以数据为驱动,面向全域督导干系人的“分层分类服务”,实行统一数据标准与多接口管理,将“协同共治机制”下的多方数据汇聚至涵盖各级用户、指标模型库、算法库以及可视化引擎、触发与决策机制在内的数据自动化生态圈中。发挥多端协同和数据自动化生态的作用,让各级人员实现常态化调研、提交数据、预警报警与报告获取,逐步实现“问督于民”与“全过程智治”。“平台+队伍”双轮驱动是平台可持续发展的基础,一方面依靠稳定的经费投入保障系统运维,并在“协同共治机制”下,根据实际需求对不同业务、区域、层级下的子系统进行集成,实现全方位的共建共享;另一方面要依靠教育测量与评价、教育大数据等学科布局和信息化培训,做好督导人才储备以及信息化素养提升工作,夯实智慧督导发展的基础。

3959B

图7 国家智慧教育督导平台建设逻辑进路

(一)完善以数据驱动为核心的智慧督导体系架构

基于需求图谱分析,国家智慧督导平台建设的体系架构以数据驱动为核心,如图8所示。通过创新数据采集方式和数据分析、展示以及结果运用,建立各类督导数据汇聚、整合、清洗和建模的数据中台,形成一个涵盖自然语言处理、机器学习、关联分析、教育统计和心理测量成熟的程序模型库,服务应用层模块灵活调用。同时,实现数据可视化,提升督导专家和业务干系人对数据的理解能力,打通数据采集、指标提取、指标可视化、智能预警、预警报告触发各环节,形成可视化的从数据到决策的闭环。为构建“长牙齿”的教育督导问责新局面提供有力的数据支撑。

3837A

图8 以数据驱动为核心的智慧督导体系架构

(二)创设多场景应用为基础的“全民参与”协同机制

基于需求图谱得知,从第三方参与到全面参与的教育督导新体系构建,是民心所向。将“问督于民”落到实处,有赖于提高社会参与度。一方面包括将第三方引入督导评估与教育公共治理的环节,另一方面要为大众提供有效的政策性服务。从用户体验的角度,要打造轻量级、便捷性强的交互操作平台,创设智慧教育督导模式下的多场景应用。从教育服务的属性出发,要跳出传统硬件设备的圈子,构建起电脑、平板、手机互通互联的多元终端网络,设计流程优化与多端协同;通过建设“智慧教育督导门户网站”“微信公众号”“小程序”等,有效支持学生、家长和社会各方有序参与教育督导活动,健全师生、家长、社会共同参与的协同监管机制。从教育管理的属性出发,经过数据采集、汇聚整合、清洗和建模处理后进行数据可视化,实现教育督导结果跨部门、跨区域、跨层级的场景运用,创设涵盖教育全领域的“主动发现问题、精准诊断问题”的应用场景,创新“一键触发”式教育督导工作新范式,也将成为智慧督导的着力点。

(三)遵循资源整合为目标的“平台+队伍”双轮驱动原则

依据图谱分析结果,一方面,教育督导信息化的经费投入应有所保障,支撑督政、督学和评估监测等业务板块的信息化系统运维;另一方面,与教育数字化战略行动背景下国家智慧教育平台整体建设理念保持一致,充分利用现有的督导信息化建设成果,应用为王,加强连接与集成,集智攻关资源开发和应用开放,实现共建共享。从国家层面制定数据资源标准,设定安全标准,设计“质检”体系和“安保”体系,为资源建设、地方系统对接和平台融合等定规则、立规矩。如图8所示,业务层要发挥好已有的省级人民政府履行教育职责测评系统、学前教育普及普惠督导评估系统、县域义务教育均衡发展督导评估系统、国家义务教育质量监测系统等多个平台和资源的基础支撑作用,整合集成、改造“升舱”。加强督导相关专业的学科布局规划、人才储备以及信息化素养培训力度,发挥现有督学专家队伍,要严格督学聘任,创新督学管理模式,建立激励机制,把有能力、有品德、有热情、有担当的同志吸纳到督导队伍中来。要加强培训,不断提升督导人员的政策水平和数据业务能力,强化“智慧督导”工作胜任力,进一步优化人、财、物资源整合格局。

五、总结与展望

本研究基于国家智慧教育督导平台建设实践,将教育学的研究方法与大数据技术手段相结合,以不同层级、不同角色用户的需求为研究对象,在传统的问卷调研基础上,采用文本挖掘技术,实现了对用户开放性需求的挖掘,通过融合“自下而上”的数据分析弥补了传统研究/工作方法对各级各类用户需求“自上而下”理解的不精准,构建了国家智慧教育督导平台需求图谱,并基于图谱分析,为教育数字化转型背景下,在我国教育督导迈向智慧督导高阶阶段进程中,顶层设计者精准感知用户需求从而制定平台技术路线提供科学分析与决策支持。

然而,在国家教育数字化战略行动的快节奏进程中,由于“国家智慧教育督导平台”Ⅰ期的建设和上线周期较紧,本研究也存在一些局限。本文构建的需求图谱仅为静态图谱,未充分考虑督导业务在数字化进程中的转型升级而引发用户需求的动态变化。后续在国家智慧教育督导平台上线实施中,团队将持续以“应用为王”理念,改进需求识别与提取算法,且行且思、且建且用,通过发挥平台自身优势,创建“常态化需求调研”任务流程,纳入智慧教育督导工具集,周期性地获取各级各类用户需求和体验的相关数据;在大数据分析技术方面不断加强人工智能技术赋能,如加入Word2Vec模型,加强对主题词间关系的刻画,并以此为数据基础进行主题自适应聚类;结合支持向量机、朴素贝叶斯等方法,智能挖掘高价值需求信息,刻画更全面的需求特征库,从而形成全周期、动态性的应用需求立体综合画像,用以指导平台的持续升级迭代,为国家教育督导向智慧督导进阶奠定良好的决策支持基础。


[参考文献]

[1] 陈潭.(2021).国家治理的大数据赋能:向度与限度.中南大学学报(社会科学版)(5),133-143.

[2] 丁依霞,徐倪妮,&郭俊华.(2020).基于TOE框架的政府电子服务能力影响因素实证研究.电子政务(1),103-113.

[3] 黄荣怀.(2022-04-06).未来学习,要构建智慧教育新生态.光明日报[2022-09-05]. https://baijiahao.baidu.com/s?id=172928801373525 3031&wfr=spider&for=pc.

[4] 黄崴.(2009).我国教育督导体制现状、问题与改革路径.教育发展研究(12),16-20.

[5] 教育部.(2012).《教育信息化十年发展规划(2011—2020年)》.中华人民共和国教育部网站.http://www.moe.gov.cn/srcsite/A16/s3342/201203/t20120313_133322.html.2012.3.13.

[6] 刘广超.(2019).“互联网+”背景下基础教育管办评的协同治理研究.南宁师范大学.

[7] 刘梦梦,&孙明娟.(2020).“智慧督导”阶段教育督导队伍建设路径探索.绿色科技(21),247-248.

[8] 万江波,&万纤荷.(2018).“智慧督导”创新区域推进智慧校园建设“4+1”模式.中国教育信息化(13),86-88.

[9] 王婷婷,韩满,&王宇.(2018). LDA模型的优化及其主题数量选择研究——以科技文献为例.数据分析与知识发现(1):29-40.

[10] 徐戈,&王厚峰.(2011).自然语言处理中主题模型的发展.计算机学报(8),1423-1436.

[11] 杨颖秀,&郭莲荣.(2005).督政与督学相结合——中国教育督导制度的显著特色.教育科学(2),37-40.

[12] 杨宗凯.(2017).信息化驱动教育督导现代化.国家教育行政学院学报(7),6.

[13] 张志华,王丽,&季凯.(2022).大数据赋能新时代教育评价转型:技术逻辑、现实困境与实现路径.电化教育研究(5),33-39.

[14] 赵凯,&王鸿源.(2020). LDA最优主题数选取方法研究:以CNKI文 献为例.统计与决策(16),175-179.

[15] 赵丽娟,&周航.(2018).“互联网+”时代教育督导信息化建设的机遇、挑战与对策.中国电化教育(7),39-44.

[16] 郑巧,&肖文涛.(2008).协同治理:服务型政府的治道逻辑.中国行政管理(7),48-53.

[17] 周平红,杨宗凯,张屹,&陈蓓蕾.(2011).基于结构方程模型的我国高等教育信息化水平综合评价研究——来自“中国高校信息化建设与应用水平”的调研.电化教育研究(11),5-10.

[18] 祝新宇,&曾天山.(2018).义务教育学校信息化发展状况监测指标研究.中国电化教育(9),56-60,80.

[19] 祝智庭,&胡姣.(2022).教育数字化转型的实践逻辑与发展机遇.电化教育研究(1),5-15.

[20] Arun, R., Suresh, V., Veni Madhavan, C. E., et al.(2010). On Finding the Natural Number of Topics with Latent Dirichlet Allocation: SomeObservations.Pacificasia Conference on Advances in Knowledge Discovery and Data Mining.Springer Berlin Heidelberg.

[21] Blei, D. M., Ng, A., & Jordan, M. I..(2003). Latent dirichlet allocation.The Journal of Machine Learning Research.03(1), 993-1022.

[22] Landauer, T. K. , & Dumais, S. T. .(1997). A solution to plato’s prob⁃ lem: the latent semantic analysis theory of acquisition, induction, and representation of knowledge.Psychological Review,104(2),211-240.

[23] Hofmann, T.(2003). Collaborative Filtering via Gaussian Probabilistic Latent Semantic Analysis.Acm Sigir Conference. ACM.



编辑:罗添    预审:唐菁莲    审核:施羽晗

相关文章: