简介:梯度Boosting思想在解释Boosting算法的运行机制时基于基学习器张成的空间为连续泛函空间,但是实际上在有限样本条件下形成的基学习器空间不一定是连续的。针对这一问题,从可加模型的角度出发,基于平方损失,提出一种重抽样提升回归树的新方法。该方法是一种加权的加法模型的逐步更新算法。实验结果表明,这种方法可以显著地提升一棵回归树的效果,减小预测误差,并且能得到比L2Boost算法更低的预测误差。
简介:利用蒙特卡洛模拟实验研究倾向得分匹配方法(propensityscorematching)的敏感性。模拟试验结果表明:(1)倾向得分匹配方法对误差项分布不敏感,即使当假定的误差分布与实际分布相差较大时,据倾向得分匹配方法仍能得到大致无偏的估计。(2)隐指标函数的误设可以使倾向得分匹配方法估计结果的偏差高达61%。(3)当共同支撑域较大时,倾向得分匹配方法对具体匹配方法的选择不敏感。当共同支撑域较小时,局部线性回归匹配方法为最优。(4)倾向得分匹配方法对强可忽略性假设是非常敏感的,即使轻度的违背此假设,倾向得分匹配方法的估计结果偏差也超过50%。