[摘 要] 从博弈论视角分析公职人员败德行为及其监管的混合策略,给出其纳什均衡解及经济意义,并在分析基础上提出监管败德行为的政策建议。
[关键词] 公职人员 败德行为 监管 博弈
一、博弈论的引入
博弈论研究的是决策主体的行为发生直接相互作用时的决策以及这种决策均衡问题,应用最普遍的是纳什均衡。而纳什均衡,是指一组满足给定对手的行为,各博弈方所做的是它所能做的最好的策略,为一种非合作博弈。博弈论的基本假设有两个:一是强调个体行为理性,假设当事人在进行“决策”时,能够充分考虑到他所面临的局面,即他必须并且能够充分考虑到人们之间行为的相互作用及其可能影响,并能够做出合乎理性的选择;二是假设博弈各方最大化自己的目标函数,能够选择使自身效益最大化的策略。博弈论分析的实质是,在经济主体理性的条件下,行为主体根据给定的条件及对方的行为(策略)等,来决定自己的行为(策略),从而使自己的利益最大化。
公职人员败德行为及其监管的主体是公职人员及其监管方,他们一般是行为理性的,显然能清楚地认识到拥有某种重要社会地位、薪金收入等的自身价值。但面临纷繁复杂的外部环境诱惑,局中人还是会作出不同的决策,即选择严监管与否、选择败德行为与否取决于行为人对自身价值的认识及与预期收益的比较,这几点正好符合博弈论分析的基本特征,因此我们可以将博弈论引入公职人员败德行为的研究中,来分析公职人员败德行为及其监管,并在此基础上提出治理建议。
二、公职人员败德行为及其监管的博弈分析
(一)博弈模型的选择
根据上述假设及分析建立公职人员败德行为及其监管的博弈模型。监管方的纯策略选择是严监管或松监管(不监管是松监管的极限状态),公职人员的纯策略选择是实施败德行为或不实施败德行为。表1概括了对应不同纯策略组合的支付矩阵。矩阵中第一个数字为监管收益,第二个数字为公职人员收益。其中:Cs是监管方实施松监管的成本(不监管时Cs=0),Cy为监管方实行严监管多支付的成本,Mg指公职人员实施败德行为未被查出预期所得收益(包括政治利益、经济利益和其它不当得利等),Lj表示监管人员工作失职可能受到的惩罚(包括刑事责任、行政处分、经济处罚等),Lg代表公职人员实施败德行为被查出可能受到的惩罚(亦包括刑事责任、行政处分、经济处罚等)。
假设各利益相关者的策略如下:
Pj :监管方严监管的概率,则(1-Pj)为松监管概率;
Pg :公职人员实施败德行为的概率,则(1-Pg)为不实施败德行为的概率。
矩阵中的四种策略组合表示的意义:当监管方严监管时公职人员公然实施败德行为,此时公职人员败德行为被查出将蒙受Lg的损失,而工作出色的监管人员将获得奖励Mj,Mj扣除严监管的成本(Cs+Cy)为监管方的净收益;当监管方严监管时,公职人员选择遵纪守法不实施败德行为,则监管方损失严监管的成本(Cs+Cy),而公职人员既无损失也无收益(收益为0);当监管方松监管甚至不监管时,公职人员若选择败德行为,此时监管方因监管人员失职而受惩处导致损失(Cs+Lj),而公职人员则因败德行为得逞获得不当得利Mg;当监管方松监管时,公职人员如没有败德行为,此时监管方会损失松监管成本Cs,而公职人员当然既无损失也无收益(得益为0)。
表1:公职人员败德行为及其监管得益矩阵
得益矩阵
公职人员
实施败德行为 Pg
不实施败德行为 1-Pg
监管方
严监管
Pj
Mj-(Cs+Cy),-Lg
-(Cs+Cy),0
松监管
1-Pj
-(Cs+Lj),Mg
-Cs,0
通过以上分析可知,如果监管方实施松监管,公职人员的最佳策略是实施败德行为,以获取额外非法得益;而当公职人员实施败德行为时,监管方的最佳策略是进行严监管,以打击作奸犯科者,保障国家或企业不受损失。既然监管方实施严监管,公职人员的最佳策略是不实施败德行为,以免受惩罚;而当公职人员不实施败德行为时,监管方的最佳策略是进行松监管甚至不监管,使监管成本最小化……如此重复的结果,不可能产生一个使博弈双方愿意单独改变自己策略的纯策略组合,而只能以上面假设的某种概率,如Pg、Pj等随机地选择不同的策略组合构成混合策略博弈的纳计均衡。根据纳什定理,在这种均衡条件下,监管方和公职人员都无法通过改变自己的混合策略来改善自己的得益。
如果设监管方和公职人员的期望收益分别为Ej和Eg,则:
Ej =Pj ·{ [Mj-(Cs+Cy)]·Pg+ [-(Cs+Cy)](1-Pg)}
+(1-Pj)[-(Cs+Lj)·Pg+(-Cs)(1, -Pg)]
= Mj Pj Pg+Lj Pj Pg-Cy Pj-Lj Pg-Cs
Eg =Pg·[-Lg·Pj+Mg·(1-Pj)]+(1-Pg)[0·Pj+0·(1-Pj)]
= Mg Pg-Lg Pj Pg-Mg Pj Pg
若使公职人员败德行为及其监管的混合策略博弈达到纳什均衡,
则:
Mj Pg +Lj Pg -Cy =0 (1·1)
Mg -Lg Pj-Mg Pj =0 (1·2)
解(1·1)、(1·2) 组成的方程组,求得该混合策略的纳什均衡解为:
=Mg/(Mg+Lg )和= Cy /(Mj+Lj )
(二)数据分析
在监管人员查出败德行为所得奖励Mj 和因工作失职而受到的惩处Lj 既定的情况下,即对监管人员工作业绩的奖惩力度一定时,公职人员实施败德行为的最优概率取决于监管方实行严监管多支付的成本Cy,且与其成正比。这预示着发现败德行为需要支付很高的监管成本,没有付出高企的额外成本就不能发现败德行为,意味着发现败德行为的概率降低了,因而实施败德行为变得相对的容易,故败德行为的发生概率随着监管成本的增加反而提高了。反过来说,在一定条件下,设法降低严监管多支付的成本就可以降低败德行为的发生概率;同理,Cy一定时加大对监管人员工作业绩的奖惩力度能达到同样的监管效果。但是,降低监管方的监管成本,加大对监管人员工作业绩的奖惩力度,在短期内可提高监管人员实施严监管的积极性,但长期效果如何呢?
当Pg >时,监管方的最佳策略是选择严监管。而根据 = Cy /(Mj+Lj ),公职人员选择实施败德行为的最优概率只与Cy 、Mj、Lj 有关,即与Cy 成正比,与Mj、Lj两者之和成反比。因而,降低Cy 、提高Mj和Lj,都能降低发生败德行为的最优概率,从而达到Pg>,促使监管人员履行职责。但长此以往,在监管方实施严监管后,公职人员又会趋于选择职务合法合规行为,而使败德行为概率Pg 降低,低至一定幅度就会导致监管方严监管与松监管两者的期望收益等值,监管方又会重新选择混合策略,出现重复博弈。而 =Mg/(Mg+Lg )表明混合策略中监管方选择严监管的概率主要与Mg、Lg 有关,而与监管人员松监管所受惩处Lj无关。因此,单纯降低监管方的监管成本、加大对监管人员的惩罚力度,而不改变公职人员期望得益,虽短期有作用,但长期来看却并未改变监管人员的博弈策略选择,对败德行为效果不大。
同样地,当Pj>时,公职人员最优选择是遵纪守法。故要使监管有效,必须降低值。而由推导知, =Mg/(Mg+Lg )。在现实经济生活中,公职人员未被查出预期所得收益Mg是外生变量,虽然在不同的败德行为行为中由案件的严重性决定可大可小,但在某一固定事件中通常为一常量,即可确定监管者的最优概率主要取决于败德行为被查出受到的惩罚Lg,且成非严格意义上的反比关系。因而加大惩处力度,使Lg值变大,将降低监管方的最优概率,从而形成Pj>的局面,促使公职人员选择不实施败德行为。但久而久之,在没有败德行为的情况下,监管方必然会理性地放松警惕,降低监管力度至一定程度时,败德行为实施与否的期望收益相等,公职人员又会重新选择混合策略,导致重复博弈。结果呢?根据 = Cy /(Mj+Lj ), 与Lg无关,即实施败德行为的最优概率与被查出的损失无关。此时即使被查出的损失Lg足够大,根据博弈理论,如果监管乏力,对公职人员而言也只是不可置信的威胁,必然继续延续前科。因此,单纯加强对公职人员败德行为的惩处力度,加大其损失,而不改变监管人员的期望得益,虽然短期内使公职人员败德行为有所收敛,但长期也将导致监管人员降低监管力度,难以真正发挥控制败德行为的作用。
三、启示及建议
(一)公职人员是否实施败德行为及监管人员能否履行职责是问题的两个方面,单纯采取对一方的奖惩来诱导其行为也许短期有效,但从长期看,并不能改善任何一方的理性和道德风险行为。为了达到(松监管,不败德行为)的目标,我们过去总是片面强调加大惩罚力度,因为在一定范围内惩罚得越严厉就越接近这一目标;与此同时,也提倡配合一定的激励措施,希望达到监管方和公职人员的双赢。但惩罚和激励措施必须适度,而实际很难把握:对惩罚而言,力度过大会使部分公职人员产生逆反心理,形成拼死一搏的倾向,反而达不到约束的作用;对于激励而言,其效果受多种因素影响,激励程度不够,会使监管人员在收益增加的情况下仍然松于监管,而过分激励、收益过多会使监管人员产生当前的收益已经足够了的想法,丧失进取动力,同样达不到目的。笔者认为,由检查力度、处罚力度和处罚执行力度三者合一所决定的监管环境是制约败德行为的关键因素。治理败德行为,应由目前的加强对败德行为公职人员的惩处力度为主,逐渐过渡到提高对违法者的检查力度和处罚执行力度与加强对败德行为的惩处力度并重,加大对监管人员失职行为的处罚力度与降低监管成本并重,建立健全教育、制度、监督并重。
(二)博弈论的研究表明,一个人作出的选择,取决于其对该选择成本收益的预期以及对他人选择的预期。给定必需的权力和信息不完全这两个条件,败德行为及其监管的内在逻辑沿着成本和收益变动的路径展开。因此,权力配置结构问题是监管败德行为机制设计及战略选择的根本问题。亦即监管败德行为不能局限于在权力既定这一约束条件下只是通过加强对权力的外部制约来监督控制公职人员败德行为而不改变现有的权力结构。如扩大公众的监督权,把某些不必要集中的权力下放到市场中,是监管败德行为的釜底抽薪之计。其次,改善权力配置的信息结构、提高透明度,包括完善政务公开、重大问题决策公开、选拔干部公开等制度,细化公职人员职务权力义务的规定等是监管败德行为的另一项重要措施。另外,给定监管败德行为的必要条件(如制度、信息不完备),监管人员与公职人员的期望得益、价值取向和道德约束主宰着实施败德行为的动机,从另一侧面说明了建立健全教育、制度、监督并重的惩治和预防腐败体系的特殊意义。
(三)博弈过程是一个长期复杂的过程。松监管,不败德行为作为我们追求的最终目标,是均衡点而不是一次博弈的结果。它是博弈双方经过长期磨合和斗争、反复修订各自的策略、经过多次博弈最终形成的结论。随着内外部环境的变化,隔一段时间各方还要进行修订,以逐步接近最佳点。而且,达到最佳点涉及到政府政策、社会风尚、道德水准等许多方面,并不是只论及本文中提到的两方,也就是说,这在实际中应该是一个多方博弈,甚至牵涉监管人员和公职人员的合谋问题,达到均衡点不是一朝一夕的事,由于本人水平的限制,很多问题由待大家共同研究。
[参考文献]
[1].张维迎.博弈论与信息经济学[M].上海:上海人民出版社,1996.
[2].(法)克里斯汀·蒙特.博弈论与经济学[M].北京:经济管理出版社,2005.
[3].胡鞍钢、过勇.公务员腐败成本—收益的经济学分析[J].经济社会体制比较,2002,(4).