简介:决策树是数据挖掘分类问题算法中一种性能较好的算法,本文主要研究自决策树在数据挖掘中应用以来存在问题,主要是可扩展性问题。综述了国内外针对此问题所提出的解决方法,以及分析了改进算法的优缺点,以便有利于对决策树关键问题,即扩展性问题的研究。同时本论文中所研究的算法的思想也有助于数据挖掘中其它领域解决大数据集问题。
决策树分类算法的可扩展性研究