基于高校排名的高等教育发展分析

(整期优先)网络出版时间:2024-08-29
/ 2

基于高校排名的高等教育发展分析

吕林蔚

云南大学数学与统计学院,云南 昆明,650500

要:本研究基于大学排名数据,运用数据可视化、主成分分析和聚 类的方法,对大学进行统计分析。首先,收集了大学排名榜单的数据,并利 用数据可视化技术将这些数据以图表形式展示出来。通过对地区分布、学科 分布和各项指标的对比分析,我们能够更好地理解不同大学之间的差异与特 点,我国高等教育发展的总体趋势。其次,我们运用主成分分析方法对大学 排名指标进行降维处理,以减少数据的复杂性并寻找主要影响因素。通过主 成分分析,我们可以确定哪些指标对于大学排名的影响最为重要。此外,主 成分分析还可以帮助我们发现指标之间的相关性,进一步理解大学排名的内 在结构。而后,我们采用聚类方法对大学进行分类,以便更好地识别相似的 大学群体。通过聚类分析,我们可以将大学划分为几个有相似特征的群组, 从而更好地理解大学的共性和差异。最后,针对分析结果给出相应结论与建 议。

关键字: 数据可视化、主成分分析、k-means聚类、k-prototype聚类

前言

党的二十大报告明确指出,“教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑”,即坚持教育优先发展、科技自立自强和人才引领驱动,旨在加快建设教育强国、科技强国和人才强国,高校建设发展一直备受国家及民众的关注,为此,大学排名可以帮助民众了解基本的高校信息,同时对高校发展起到一定的监督作用;既能帮助管理者发现高等教育发展存在的问题,同时可以协助高校及相关机构共同探寻教育发展趋势。如能运用得当,大学排名对社会具有重要意义。本文以 2023年中国大学软科排名为研究对象,对国内高校基本情况作简要分析,旨在了解国内高校的教育水平,探究影响学校排名的因素,为高校的进一步发展提供参考,助力高校教育发展。

研究方法

(一)文献调查法

对大学排名相关的文献和资料进行系统性的收集、阅读、分析和综合,对目前已有的研究进展和成果有了初步了解,填补研究领域空白,提供了理

论和实践方面参考,为研究提供基础和方法指导。

(二)综合分析法

统计综合分析需根据研究目的,在实质性科学正确地指导下运用统计方法,以统计资料为依据,结合具体情况,从定性和定量地角度对客观事物进行科学分析和综合研究,揭示其本质和规律,提出解决矛盾的对策。

数据来源与说明

(一)数据来源

数据均来自中国大学排名网站公开数据,为 2023年中国大学排名数据。数据来源网站:软科-高等教育评价领先品牌 (shanghairanking.cn)

(二)数据说明

为研究我国高校的发展情况,选择如下软科排名中的指标进行研究,变量解释如下表:

表 1 变量解释

变量名称

变量类型

变量取值

排名

数值变量

[1:590]

学校名称

分类变量

590个水平

英文名称

分类变量

590个水平

层次

分类变量

4个水平

类型

分类变量

5个水平

地区

分类变量

31个水平

评分

数值变量

[43.5,1004.1]

办学层次

数值变量

[0,40]

学科水平

数值变量

[0,77.1]

办学资源

数值变量

[0,50]

师资规模与结构

数值变量

[0,54]

人才培养

数值变量

[0,328.6]

科学研究

数值变量

[0,105.7]

服务社会

数值变量

[0,46.9]

高端人才

数值变量

[0,91.2]

大项目与成果

数值变量

[0,124]

国际竞争力

数值变量

[0,91.8]

三、探索性统计分析

(一)主成分分析

在实际分析中,由于变量之间可能存在⼀定的相关性,所讨论的全部变量中可能存在信息的重叠,为了消除信息的重叠,希望⽤个数较少但保留了原始变量⼤部分信息的几个不相关的综合变量来代替原来较多的变量,从而简化数据分析,其本质为“降维,” 即将              ⾼维数据有效地转化为低维数据来处理,揭示变量的内在联系。主成分分析中的信息,指变量的变异性,变量的变异性越大,说明它提供的信息量就越大,用标准差或方差进行衡量,在实际应用中,从样本的相关系数矩阵 R 出发进行主成分分析,具体步骤如下:(1)标准化原始数据;(2)求样本相关系数阵 R;(3)求 R 特征值及相应的特征向量;(4)按主成分累积贡献率超过 80%或相关系数矩阵特征值大于 1的标准确定主成分个数;(5)对结果关于实际意义进行分析。

(二)聚类分析

(一)K-means和 K-prototype方法介绍

由于数据集呈现分类变量与数值变量混合的特点,本次数据分析将采用以下两种算法并在分析结束后进行对比择优:1、K-means算法:需要将分类变量 a转换为哑变量,使其成为数值型变量,然后通过计算欧几里得距离得出聚类结果。(1).首先确定分类的数量 K(2). 从数据集中随机的选择 K个样本点作为初始类中心(质心)(3). 计算数据集中每一个样本点与初始类中心的距离,离那一个类中心近就划分给那个类中(4).重新计算 K个类的类中心(质心),新的质心是该组所有样本的各属性的平均值,即 means(5).如果新的类中与旧的类中心的距离小于设定的阈值,可以认为我们进行的聚类达到预期的结果,算法终止。(6).如果新的类中心和旧中心的距离很大,继续迭代 3~5步骤。2、K-prototype算法

无需创建哑变量,将分别为分类变量计算汉明距离、为数值型变量计算欧几里得距离然后得出聚类结果。K-prototype算法提出了混合属性簇的原型,其原型就是数值属性原型用属性中所有属性取值的均值,分类属性原型是分类属性中取值频率最高的属性。合起来就是原型。K-prototype聚类的准则就是使用一个合适的损失函数去度量数值型和分类型变量对原型的距离。

结论与建议

(一)结论

通过分析,我国对高校进行的 985工程,211工程及双一流建设发展稳定,相应高校在排名中表现与其定位大致相符,我国高等领域的世界一流大学建设和世界一流学科建设都取得了显著进步。但也存在部分 985院校排名落后的现象。我国高等教育存在地区发展不均衡的情况,可能受地理及经济因素响,东部地区高校水平普遍高于西部地区,北京市和上海市的教育源有显著的优势。理工类及综合类院校数量多,且排名靠前,可能与新中国成立初期对理工科人才需求大有关,存在高等教育学科发展不均衡的情况。

(二)建议

1、资源聚集现象严重,不利于国内高校系统的整体发展。鉴于此,“双一流”后续建设中              可采取公开透明的评选机制和动态进出机制,使有限资源发挥最大效能,最大限度实现教育公平。2、针对学科发展不平衡问题,应该适时调整世界一流大学和一流学科的关系,强化学科建设发展的均衡性和大学综合能力建设。3、根据排名指标,对高校发展给出如下建议:(1)优化课程设置和教学方法:应注重培养学生的创新能力、实践能力和综合素质,适应社会需求和行业发展趋势。在课程设置和教学方法上,可以加强实践性课程、项目式学习和跨学科交叉培养,提高学生解决问题的能力。(2)加强师资队伍建设:需要拥有高水平的师资队伍,引进和培养一流的教师和研究人员。可以采取多种方式,如增加高层次人才引进计划、提高教师待遇、加强教师培训和评价机制等,以吸引和留住优秀的教师。(3)推进国际化发展:应积极开展国际交流与合作,引进优质的国际教育资源,吸引更多国际学生来华留学,推动我国高校在国际上的影响力和竞争力。(4)强化产学研结合:应与产业界和科研机构深度合作,加强产学研一体化,促进科技成果的转化和应用。可以建立更多的产学研合作平台,提供创新创业支持,培养具备实践经验和创新能力的高层次人才。

参考文献

[1]解德渤,张晓慧.中国大学学科建设的世界坐标与未来抉择—— 基于软科 2017—2021年 世界一流学科排名的数据分析[J].现代教育管理,

2023(02):32-44.DOI:10.16697/j.1674-5485.2023.02.004. [2]张金峰. 我国大学排行的发展现状研究[D].湖南大学, 2022.DOI:10.27135/d.cnki.ghudu.2020.004361.

[3]苏蓉,刘佳磊,卢笑歌.国内主要大学排行榜及其指标体系分析研究[J].成都大学学报(社 会科学版),2018(03):100-105 .

吕林蔚(2000.6-),汉族,云南大学数学与统计学院统计学专业学生,在读本科

研究方向:统计学