本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
* d F- m- X/ a
$ _! B. C. ]' j U% e1 k严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy); ~ c$ G& A: z
以下三个定义:
* |1 H( m8 D& p y 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 b) Z( L: O6 S7 P+ d 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 - y# }" b4 a) U+ D( Z7 Y" F
所谓的双方优势策略则是指双方利益总和最大的策略。
$ r* A" J3 D* ?& X[编辑本段]严格优势策略举例分析
% W$ h# `: i" t4 d8 t 一、经典的囚徒困境
: H. o* E- o3 U 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 d2 M7 f4 q5 a% M 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: % ]5 [+ K) r- w- G: g# S# t
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
4 l7 \4 [& w8 g, |( s 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ( ~4 w7 q# a* ^9 e% w3 b3 s
若二人都互相检举(互相“背叛”),则二人同样判监2年。
8 U8 |1 e* q/ x& l ( X' o8 C" g0 G* @6 X* |
用表格概述如下:
8 |9 F7 n/ i. S+ a" |* [
5 R3 Q; B! M5 Z8 u 甲沉默(合作) 甲认罪(背叛)
( g; j8 X* I- G, m5 F+ R/ @7 b# _6 s& ~乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
8 {7 j6 |8 s$ T1 S+ k& }2 b乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ; r) J- T0 {( G# W$ G" D
a1 ^5 A" i; `7 O 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 / U" p' n6 u# _9 t* M* s1 k
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
$ h2 v8 B" e! h& `% _$ |( z- l) C 若对方沉默、背叛会让我获释,所以会选择背叛。
' d$ } c9 M+ M' E2 w4 z; c: J 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- L$ V# z' {" h: H; r 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( U3 ]" A% ?7 r& N 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 I& {+ P2 T" Y6 j* `
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' B' n: \4 F( L; d5 W) M; J[编辑本段]二、智猪博弈理论! B5 V8 O; H' D+ a; @
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 D. Z% Y1 A' z" r* l- J* G
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ u* c* y) r$ S 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
% L& A& K( s: x- V5 ~1 o( _" V( r 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 : T1 x" Q- G0 G2 L* O) c5 l
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 o% V1 }. ~0 I! }0 ]7 | 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
% ?7 A% O/ K7 c( h9 } 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。, E+ T3 i6 p- c& F/ F; Q( T6 o
* d* F. J m& T2 Y) Y6 S: }三、关于企业价格策略2 j3 U4 P3 d* _, R2 I7 X9 G
5 j8 L5 Q. P$ r6 T U7 z- X+ L, z
2 r5 T% _$ g# X2 Q) K* J- p 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 u+ `0 i; j) k9 b/ E* G" n
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);! c6 o7 u1 f i+ @
以下三个定义:
7 Q) l7 S! I5 b4 N 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 A/ s2 ^5 Q! m9 l0 T
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * m9 y. @! L% l5 |2 q2 I" K7 L* @3 J" i
所谓的双方优势策略则是指双方利益总和最大的策略。 $ f1 C6 C, Y# y4 ]& ]$ U
[编辑本段]严格优势策略举例分析
' i- _" {# O- r* ]+ Y 一、经典的囚徒困境
+ G5 L' _; W; v' Z) i 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
0 t; r4 g# w j8 O/ K% D9 Y) O* h( d1 G 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
3 J: G, X2 [6 k4 I' B- F; h 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : w( ^. _ _1 V# I% m
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 $ j5 L0 X4 ~( p" w: A0 Y
若二人都互相检举(互相“背叛”),则二人同样判监2年。+ ?) Z0 Y3 T8 \: a/ z4 b
9 E6 j+ ~! }' p+ e0 J" s
用表格概述如下:) K0 D Y1 ?% C1 O
t# Z# j$ L" T V9 O( B# J8 ^% w6 a, ?
甲沉默(合作) 甲认罪(背叛)
" [# a0 s6 A" e& w/ I% ?乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
y, p9 o! q9 f% `' R/ Y9 c乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 + t" u# u7 _& @1 A) U! W- w
9 H! k+ U! `# c
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 & v% @) D l, q+ Y
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
; R. q' x9 H ?0 `3 X0 L 若对方沉默、背叛会让我获释,所以会选择背叛。
W2 f8 d* S% n9 G 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; H% T' b4 x9 W" j
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 5 n8 S$ r" c! @& ]$ U, b
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# A5 d+ }; w5 k* U 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
9 W U, X$ M6 P* e! h4 C[编辑本段]二、智猪博弈理论$ c6 T; `/ C* ?* [, u$ R
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 * f" L3 j0 G3 r# `
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! z* M5 }! v9 f4 _& C2 B 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & n. p; R/ d0 z, G) p
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " a* d4 O- i. p" j- d& R2 D
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 1 M/ M& w X- k9 h/ e5 H
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) \% k0 D; B( A! `1 e 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& _, v$ D2 n* `, I' O% E/ R ' `1 F; t$ E. A" H3 S
三、关于企业价格策略1 ~$ s+ X& u$ J" R% \& N
v5 |1 I" T. d
& h& c4 S9 d. e# j 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 I) l) W) I" I" }' j8 g0 X" Q. R( p 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 j L' a, U/ P. h# O4 t) B9 P 以下三个定义:/ v c, t3 ]2 h3 g. ~1 E
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- `$ S, ~9 b: C9 v0 Y4 a 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ) n, y! S: S6 w( H+ {+ e, u! v) y
所谓的双方优势策略则是指双方利益总和最大的策略。 7 k2 U* |: s0 M
[编辑本段]严格优势策略举例分析
$ ~- J9 W) M/ Q8 d2 J( y# E 一、经典的囚徒困境
. M. r8 S+ y, Z/ }0 y 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, [+ @" l, ~, p$ d 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
- a% C/ G, B3 e' c5 Y% j6 x 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % ]/ [+ A5 I( ?( a6 S
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
" w- |! |- T, D 若二人都互相检举(互相“背叛”),则二人同样判监2年。1 F# C1 X# i) N. b3 }: @6 ~$ k" E
* C/ h( z; J3 P, B. q0 O用表格概述如下:, I1 s: s- M# [, V& {/ I K O2 |
9 v0 [& z x, H y/ w 甲沉默(合作) 甲认罪(背叛)
( E2 [( A6 @1 C% A0 E' {乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
" A* N8 ~! p& c+ E; i乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
. k; _. N3 r9 y3 @
- z% D5 ^5 Q4 j Y$ j f/ r 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 N3 O1 B8 w4 R# u% S* a
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
, X" l* Z' \/ ` 若对方沉默、背叛会让我获释,所以会选择背叛。
" z. f" @5 ~0 `' q0 L# h2 O 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
' F' k7 V+ }7 [/ ?2 Z, K& A 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 a% A( ]7 u: @( G4 d, |1 J
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( \1 l8 e0 R0 v% t# t 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。2 _2 j7 \ E7 z2 r6 g# P' x
[编辑本段]二、智猪博弈理论
/ K$ y9 ?% M# o1 _* d5 ^" v 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 A/ U0 h1 a0 `1 _+ @" i! d+ I 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
6 Q' ]' n5 B7 N 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 5 q9 r$ N$ [5 `- R
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 + s5 C5 U6 ~& E# b
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 1 O7 l3 b( U s
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
. j2 |$ |7 u$ n3 L3 |4 p1 o L 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 [9 M" a3 r; V1 f. _ 0 S: F4 r4 L/ U- d
三、关于企业价格策略4 d5 `6 ?5 K$ ]( u- l
" L7 f( W. R; J
# x/ L8 h% q0 w; K( S; A 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* D) n$ g& z2 f1 r& o 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 W$ h9 E: E% L 以下三个定义:
, Z( T9 A9 o+ l2 y# D2 w. s$ N 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 6 L& @7 @" Y3 D) y" P; V) }
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 1 n% K; r$ t( I/ V9 h }
所谓的双方优势策略则是指双方利益总和最大的策略。
/ t. Z1 h' F' \* V: t; ~; R! g[编辑本段]严格优势策略举例分析9 p; S* _4 t! r( p' M! Y
一、经典的囚徒困境 : F8 m/ Y7 k1 T4 \# g8 V
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ n/ _: t/ F- b" U# J4 m/ [4 I 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* u5 `) B* \/ e7 F$ Q# Z) v5 ? 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % b. c4 @0 @1 D# l
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * b7 L7 R) t7 m& X; \3 R2 u9 x
若二人都互相检举(互相“背叛”),则二人同样判监2年。
- i8 \ R' l" }" _
& ~/ \* m' C4 `4 |# C用表格概述如下: ~3 l' |2 g0 I$ r% o/ _% b
: `3 T3 G% V, f" A5 B& c S
甲沉默(合作) 甲认罪(背叛)
- s1 x; x: C& M. L乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 2 O5 V2 }- X& \$ r
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
' e; D% n" ]" O0 Z# P! P6 ?1 V- i! e# R" n1 V- k
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 + m4 B: o$ s) D6 R
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
; y( [6 G8 A, }& @( y5 t C! ~1 |1 N 若对方沉默、背叛会让我获释,所以会选择背叛。
) w' E2 x5 f7 a i 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
4 v& V( u; e0 G7 h+ v 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 s" R; _( v3 @# ~3 I 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
9 m' F: w/ y6 i! p 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。, `- [7 X; g* {( ?8 W) T8 Z9 Y
[编辑本段]二、智猪博弈理论
6 H& E/ P* S; }0 d 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 Q8 U, T1 Y# H, D. g 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
% @& c: K9 a+ W2 R1 r 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: O7 R0 b7 ~7 z1 ] 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! p& ]& i$ R! E" j4 S
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) a: Z2 d4 j4 e1 k" _# P& U, E
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
- M% N+ N+ I, ? 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。2 a6 O9 G0 u1 B) c9 q5 s% p0 m) P
% R, p. z/ f; K, D' N# f
三、关于企业价格策略
# z7 _/ b- U, K! O
" h' t7 _1 n/ I" J, M; p: N! t9 L, j
: R r6 _: Z) u I( k2 b1 _ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? - { d3 y; p4 g( f7 I" S
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |