简介:不确定性是数据的固有属性,在实验过程中由于仪器的限制或者收集过程中的误差都会造成数据的不确定性。数据挖掘算法在处理不确定数据的相关研究尚处于初级阶段,不确定数据聚类是不确定数据研究中的典型问题,已有一些聚类算法被应用到处理不确定数据,如UK-means等。无论是UK-means还是FDBSCAN都仅仅考虑了不确定数据之间的几何距离,而没有考虑到不确定数据之间的概率分布差异。然而,概率分布特征是不确定数据的本质特征,考虑不确定数据的概率分布能够更准确度量不确定数据间的距离,从而提高聚类算法的性能,本文使用核函数度量不确定数据与类中心的距离,然后使用UK-means算法聚类不确定数据,通过大量实验验证了本文提出的距离函数优于使用欧式距离期望的UK-means方法。
简介:适时调整中小学校空间布局,重组教育资源是目前我国的一项重要工作。鸟鲁木齐市也面临了同样的问题,鸟鲁木齐市中心区中小学校存在空间分布不合理,学校规模不达标、教育资源存在校际差异等许多问题,因此采用2010年现状调查的数据及中小学空间分布图并以2009年出台的《鸟鲁木齐市中小学办学条件标准》为依据对乌鲁木齐市中小学校分布中所存在的不合理问题作了初步分析,并对此提出了相应的对策建议,以期为本市教育管理部门提供一些合理的参考意见,使乌鲁木齐市的中小学校得到合理的规划与布局,进而促进本市基础教育健康、持续发展。(乌鲁木齐市中心区包括沙依巴克区、新市区、水磨沟区和天山区)