规范国有企业体制改革,重要的一项住务是要规范“上有政策下有对策”的现象,可以因此把它视为“政策”与“对策”的博弈。“对策”的出现原因是多方面的,其中很大程度上是由于部分企业管理者自以为得计的策略选择,类似于“囚徒困境”中的权衡。因而借鉴“囚徒困境”中的管理学意义,对于揭开“上有政策下有对策”的产生以及其难以禁绝之谜,规范国企改革,进而规范管理者的管理行为或许是有益的。
管理者的另类自由度
博弈论中对“囚徒困境”的分析被美国经济学家萨缪尔森引入《经济学》一书后,在经济管理领域产生了重要影响。尤其是诺贝尔奖得主纳什提出“纳什均衡”的概念后,把企业管理者的管理行为与“囚徒困境”中的策略选择联系起来进行分析,成为西方经济学中传统假说的一块基石。但是经济学家们对“囚徒困境”的研究,迄今主要是针对囚徒之间可供选择的方案进行,即两个“囚徒”之间是选择合作还是不合作的价值取向或者自由度,对检察官给定的“规则”是不加怀疑的。其实,只要囚徒们冷静地分析一下检察官给定的“规则”,就会发现自己的对手并非仅限于自己的同伙,负责办案的检察官才是更重要的博弈对象,在检察官面前,囚徒们才具有更多的“共同利益”。囚徒们虽然被分别关押,各行其事,完全可以根据他们的“共同利益”独立做出判断,做出暂不伤及同伙,而对囚徒一方更为有利的策略选择。因为这种与检察官合作还是不合作以及如何应对的权衡和选择,我们可以称之为另类自由度。比如在实践中,对公司员工而言,知道了领导的水平,判断领导们是否有能力领导企业,就得到了自己在这里是否有发展的推测,这要比在同事之间相互折台具有更重要的意义。
西方经济学家对“囚徒困境”中另类自由度的忽视或许是为了研究的方便,但也有西方文化背景的影响。西方文明对正义的理解富有自己的特色,其法治意识较强,强调自然法则。在“囚徒困境”中,就假定了检察官和他们谈话时给定的“规则”是天然正义的。囚徒们或许以为检察官只会严格按照法律原则办案,不会对权力的行使作过多的猜测。东方文明虽然也强调“中正”,但往往离不开“人治”,看重权力。而这两者之间是有区别的。一位西方哲人曾经说过:一个人罪有应得,受到法律的制裁,这是正义的力量;而一个人罪当处死而由皇帝或某高官以不同形式予以减缓,那就是权力。依靠权力,希望自己得“例外”行事之便利的潜意识在东方文化中是无法被忽略的,这种特征在管理中表现的更为明显。在中国传统文化中,管理之道如同兵法,兵不厌诈,重视知彼,擅于权变,讲究方圆。其中,“方”就是基本法规,“圆”是应该有弹性的部分。在东方人看来,像检察官办案之类,一定有他的“权限”范围,利用法律可能存在的弹性,在“权限”之内他是有权变通的,在“权限”之外,他还可以向上级述求。因而他所管辖的囚徒在其给定的“规则”引导下,总有争取法外开恩、变通倾斜的希望。在这种潜意识的指导下,囚徒既使在困境中也不会放弃“另类自由度”的努力。因此,它应当成为对于“囚徒困境”的分析不可忽略的一个变项,至少在中国式的企业管理领域是如此。
在“囚徒困境”中进行另类自由度上的策略选择,往往并不需要和其他囚徒进行信息沟通,也不需要和其他囚徒合作,完全可以单独进行,有时候单独进行更为有利,因此进行另类自由度上的策略选择是不是被分别关押并不重要。当然,企业管理者不是囚徒,只要他们愿意,就可以进行信息沟通,为谋取某种共同利益达成一定程度的共识,例如签定价格协议之类,另类自由度上的策略选择也就较为便利。西方经济学家也并没有忽略这种倾向,对此也进行了深入的研究,但那主要是“囚徒”之间的横向联合。而我们在这里所说的另类自由度中的策略选择,则主要是指单个的囚徒与检察官之间的“纵向联合”,在现实中的表现就是所谓的跑“部”、“公”关,争取优惠、扶植和政策倾斜等等。或许,检察官先生不会和囚徒共谋,不可能形成正式的联合形式,但这并不等于关闭了所有的沟通渠道,囚徒仍有可能与检察官套近乎,达成其种默契,彼此心照不宣,增加“关照”、“倾斜”的权重。既使囚徒无法实施或者实现不了与检察官的“沟通”,他仅凭其在谈话中给定的“规则”,对这种必要和有限的信息进行深入地分析,仍然可以发现策略迭择的另类自由度的大小。
既定政策总有“精妙”之处
在“囚徒困境”中,检察官认定,根据目前掌握的证据,既使两个囚徒均不认罪和坦白,也可以分别判他们各自两年的监禁;如果其中一个人坦白另一个不坦白,那么只对坦白的人监禁半年以下,而对不坦白的人监禁10年以上;但是如果两个人都坦白了,则分别对两人各自监禁5年。这种“规则”对于囚徒来说,显然没有商量的余地,似乎不平等。但是既然做为一种“规则”,就应该对囚徒与检察官双方均有约束力,在这个意义上讲,双方又应当是“平等”的。如果从市场行为来看,“规则”的执行就是检察官与囚徒的“交易”。在这种“交易规则”的约定中尽管检察官居于优势地位,可当他表示要这样办案,也就等于同时做出了愿意遵守的承诺。既然这种“交易规则”更有利于检察官办案,那么也就不难发现其间的破绽:很明显,其真实意图就是想方设法从囚徒的口中掏出新的线索,而那些巧妙的“承诺”都是在为办案服务。
首先,通过检察官给定的“规则”,囚徒可以推断出“规则”背后隐含的信息。例如可以通过检察官给定的“规则”中推断出检察官目前对两个囚徒共同犯罪所掌握的证据尚有不足之处,根据目前掌握的材料只能分别判他们各自一年监禁;检察官所言两个囚徒都坦白后,将各判他们五年监禁,只能说明检察官推测两个囚徒的犯罪事实可能更严重,而且可以进一步肯定他没有掌握这方面足够的证据;检察官或许根据现有线索进行推测,经过自己的努力可以掌握犯罪更为严重的证据,但是这样做比较困难,或者需要付出额外的努力,或者需要动用更多的资源,而且不能保证有绝对成功的把握,所以他才试图与囚徒进行“交易”。如果说检察官并非刻意偷懒,那么他多少是想在两个囚徒间制造冲突和竞争,以坐收渔翁之利。检察官采取以“规则”与囚徒进行心智的较量的办法,说明检察官先生并非完全是在秉公执法,多少掺进了个人的私念。
如果我们“上纲上线”地进行分析,甚至可以说他在不择手段,为了达到有利于自己的效果,不惜混淆相关概念,对相关的价值观念进行误导。例如,如果把坦白从宽做为一种法律原则,那么它对每一个囚徒都应当是单独适用的,不能把甲囚徒的坦白与否与乙囚徒的认罪态度进行株联,反过来也是一样。如果量刑要以事实情节为依据,那么就不能轻信口供,即不管囚徒坦白与否都可以定罪。假如双方都坦白时量刑五年为公正的话,那么在一个坦白另一个不坦白的情况下对前者量刑半年对后者量刑10年显然是畸重畸轻,偏离了以事实为依据的原则。检察官给定的“规则”固然是“透明”的,有利于对分别关押的囚徒各个击破,但是在其中制造相互猜疑和算计,则涉嫌诱供,是在对“诚信”缺失风气的推波助澜。如果检察官断定两个囚徒均不坦白时只能各判一年监禁,那么在他们都没有坦白前就断定他们坦白后明确的刑期,显然是一种有罪推定,很难说检察官比囚徒更为“诚信”。如果把囚徒之间的合作当做囚徒职业道德的话的,也很难说检察官比囚徒更讲职业道德,都在挑战职业道德。
再次,根据“纳什均衡”的原则,囚徒之间两个人都坦白是最好的策略选择,因为在囚徒之间的价值取向或者自由度中,这样做了以后两个人都不会感到“后悔”。但是如果他们果真都坦白了之后,就会大为“后悔”,因为针对囚徒与检察官之间的价值取向或者自由度中,两个囚徒都不坦白时,检察官只能各判他们一年监禁,而两个囚徒都坦白了反而都被判了五年监禁,太不合算了。只要两个囚徒都能认识到这一点,就不难求同存异,做出最佳选择。如果两个囚徒能从同伙之间争高下的思维惯性中摆脱出来,把检察官的“规则”吃透,敏锐地捕捉住其间的“另类”信息:目前掌握的证据只能各判一年,如果都坦白了则要各判五年,从整体利益出发两相比较还是不坦白划算……吃透了其中的精妙之处,囚徒就不难做出最佳的策略选择,实现“帕累托最优”。这样做自己虽然放弃了单独坦白而获减刑的机会,却可以避免大幅加刑的风险,又获得了同伙的信任,在心理上仍然可以实现“纳什均衡”。
如果我们把检察官给定的“规则”叫做“政策”,那么囚徒针对自己与检察官之间合作与否的价值取向或者自由度,做出不坦白的策略选择就是“对策”,因为这种“对策”破译了“政策”的精妙之处,可以同时得到“帕累托最优”和“纳什均衡”,实现另类双赢,“对策”产生也就不足为怪,反过来说,没有这种“对策”的产生才是奇怪的。
“对策”有望进一步发挥
在“囚徒困境”中囚徒针对同伙的策略选择被称为同步博弈,即他们只能同时做出选择;而囚徒分别与检察官的过招则可能会成为交替博弃,因为是检察官的规则出台在先,囚徒们的对策选择在后。从惩罚犯罪的动态过程来看,既使囚徒选择坦白,也不是受政策的道义感召,而是纯理性的趋利行为,很难设想他们能够“痛改前非”。当他们再次犯罪时,可能会更加理性,进一步策划自己的对策,利用犯罪经验钻政策的空子,有望将对政策的“运用”发挥到淋漓尽致的程度。 |