简介:多因变量综合线性回归中变量筛选问题,一直受到学术界的高度关注。针对当前不少学者对多因变量综合线性回归中变量筛选问题的错误认识,尤其是"偏最小二乘回归模型"涉及数学过于深奥,很多学者不能理解其原理,不能适合采用该模型的条件而盲目使用。在利用线性代数中正定与半正定矩阵的性质和矩阵的特征理论的基础上,剖析三种常规线性回归建模方法的原理,揭示"偏最小二乘回归模型"的本性,并在肯定其优越性的同时也指出其应用上的局限性;提出实际应用中合理选择回归模型的若干标准,建立一种容易掌握操作简便且可替代OLS法的"超平面回归模型";利用一个实例对几种回归建模方法的应用效果进行比较和说明。
简介:在大数据环境下,劳务众包APP平台上任务的完成率是反映平台运营的重要指标。利用某劳务众包APP平台上的会员信息以及一个已结束项目的任务数据,辅以地区宏观数据,挖掘出六个影响因素,构建相应的预测模型。Fisher线性判别模型表明,价格、距离、非户籍人口比例对完成度有正向影响,而人均可支配收入、交通支出和失业率有负向影响;随机森林模型显示,按照重要性排序,影响因素依次是距离、交通支出、非户籍人口比例、价格、可支配收入和失业率。此研究结论能及时为平台、商家的任务发布策略提供参考,有助于平台更加有效地运营。