简介:利用蒙特卡洛模拟实验研究倾向得分匹配方法(propensityscorematching)的敏感性。模拟试验结果表明:(1)倾向得分匹配方法对误差项分布不敏感,即使当假定的误差分布与实际分布相差较大时,据倾向得分匹配方法仍能得到大致无偏的估计。(2)隐指标函数的误设可以使倾向得分匹配方法估计结果的偏差高达61%。(3)当共同支撑域较大时,倾向得分匹配方法对具体匹配方法的选择不敏感。当共同支撑域较小时,局部线性回归匹配方法为最优。(4)倾向得分匹配方法对强可忽略性假设是非常敏感的,即使轻度的违背此假设,倾向得分匹配方法的估计结果偏差也超过50%。
简介:据调查了解,胶州市共有76万人口,92.2万亩耕地,人口比我们少,耕地面积比我们小,其他方面情况基本相近,从地理位置看,两市同处山东半岛西部,胶州有25.5公里海岸线,我市全部为内陆;两市都距青岛市比较近,且境内都有铁路和高速公路经过,从自然条件系,两市均以平原为主,地势南高北低;同属温带大陆性季风气候,年平均气温,降水量都相差不大,不同的是,胶州市能出产部分海产品,从经济基础看,前些年胶州市不如我市,特别在工业方面差距明显,70年代,我市的“五小”工业在全省有名、全国挂号,与胶州市相比是名符其实的“老大哥”,但就在这样一种情况下,经过近些年的发展,两市经济有了很大的差距。
简介:极端值亦称离群值或边远值,即在观测值中远远偏离数据主体部分的个别值,这些值不能服从假定的概率分布。如果将极端值和其它数据不加区别地等同对待,会使数据的离散程度加大,计算出的数字特征不能反映主体数据的特征。对极端值进行识别并加以处理,是探索性数据分析的一个重要问题。经过适当处理后的数据,具有较强的耐抗性,即对局部数据的不良行为具有不敏感性。在统计分析中,识别极端值的方法有以下几种:(一)四分展布法四分展布法是一种经验法,首先计算中位数和四分位数:设有数据X1,X2…Xn,将其从小到大排列,记为X(t),X(2)…X(n);当n为奇数时,n=2k+1,中位数=X(k),中位数位次为k+1;当n为偶