一种基于分类-回归决策树的烤烟产区识别模型

(整期优先)网络出版时间:2014-06-16
/ 1
为建立不同产区及风格烤烟烟叶与化学指标之间的关系,对2005~2009年湖南省、河南省、福建省和云南省等4省份共计1040份烟叶样品的21种化学成分进行检测,并利用MiningTree模型进行分类-回归决策树(C&RTanalysis)数据分析。结果表明:(1)从21个烟叶化学成分中,共筛选出14个特征化学指标,其中钾和硝酸根为4省烟叶共有特征化学指标;(2)湖南、河南、福建和云南4省份识别概率最高的特征化学指标分段组合(Segment)分别为:还原糖(≤24.93%)、钾(〉1.98%)、pH值(≤5.37)(p=0.658);钾(≤1.98%)、灰分(〉11.03%)、水溶性灰份碱度(≤0.49)、硝酸根(≤0.06%)(p=0.776);还原糖(〉24.93%)、钾(〉1.98%)、硝酸根(≤0.06%)、蛋白质(〉5.01%)(p=0.914);钾(≤1.98%)、灰分(≤11.03%)、水溶性总糖(〉28.94%)、硫酸根(≤1.43%)(p=0.957)。分类-回归决策树方法在建立烤烟化学成分识别模型中具有重要的应用价值。