1
00:00:00,100 --> 00:00:01,862
第12章好人终有好报

2
00:00:01,887 --> 00:00:04,637
好人垫后这句俗语似乎来自

3
00:00:04,650 --> 00:00:07,599
棒球界不过有些权威人士声称它

4
00:00:07,599 --> 00:00:11,336
有其他内涵美国生物学家加勒特哈丁

5
00:00:11,625 --> 00:00:14,224
GarrettHardin用这句俗语来总结

6
00:00:14,250 --> 00:00:17,411
社会生物学或者自私的基因其中的贴切

7
00:00:17,437 --> 00:00:21,324
不言而喻在达尔文主义中好人是那些愿意

8
00:00:21,336 --> 00:00:24,461
自身付出代价帮助种群中其他成员

9
00:00:24,475 --> 00:00:26,812
个体以此使他们的基因传

10
00:00:26,812 --> 00:00:29,836
到下一代的人这么看来好人的

11
00:00:29,850 --> 00:00:32,987
数目注定要减少善良在达尔文主义里

12
00:00:33,100 --> 00:00:36,298
终将灭亡这里的好人还有另一种

13
00:00:36,325 --> 00:00:39,112
专有解释和俗语中的含义相差

14
00:00:39,137 --> 00:00:41,411
并不远但在这种解释里

15
00:00:41,811 --> 00:00:43,911
好人则能得好报在这

16
00:00:43,911 --> 00:00:46,262
一章节里我将阐释这个相对

17
00:00:46,274 --> 00:00:48,686
乐观的结论想想第10章

18
00:00:48,686 --> 00:00:51,686
里的斤斤计较者那些鸟儿显然以

19
00:00:51,712 --> 00:00:54,000
利他的方式互相帮助但对那些

20
00:00:54,000 --> 00:00:56,575
曾经拒绝帮助他人的鸟它们却

21
00:00:56,575 --> 00:01:00,298
怀恨在心以牙还牙地拒绝给予帮助比起

22
00:01:00,311 --> 00:01:03,250
傻瓜那些无私奉献却遭遇剥削的

23
00:01:03,262 --> 00:01:06,686
个体和骗子那些互相无情剥削而

24
00:01:06,700 --> 00:01:09,599
共同毁灭的个体斤斤计较者在种群

25
00:01:09,599 --> 00:01:12,212
中占优势因为它们可以将更多基因

26
00:01:12,311 --> 00:01:15,512
传递给后代斤斤计较者的故事表达

27
00:01:15,512 --> 00:01:19,287
了一个重要原则罗伯特特里弗斯将此

28
00:01:19,299 --> 00:01:22,900
称为互惠利他理论在清洁工鱼第

29
00:01:22,900 --> 00:01:25,936
10章的例子里互惠利他不仅

30
00:01:25,950 --> 00:01:28,349
局限于单个物种还存在于所有

31
00:01:28,361 --> 00:01:31,474
共生关系中类似的例子还有蚂蚁

32
00:01:31,474 --> 00:01:33,587
为它们的奶牛蚜虫挤奶第

33
00:01:33,587 --> 00:01:35,750
10章当第10章写就

34
00:01:35,750 --> 00:01:40,500
时美国政治科学家罗伯特阿克塞尔罗德将互惠

35
00:01:40,500 --> 00:01:43,025
利他的概念延伸至更为激动人心的

36
00:01:43,037 --> 00:01:48,186
方向阿克塞尔罗德曾与威廉唐纳汉密尔顿合作

37
00:01:48,549 --> 00:01:50,436
后者的名字在这本书里

38
00:01:50,549 --> 00:01:53,212
已经出现无数次了开篇已经暗示

39
00:01:53,212 --> 00:01:56,462
过正是阿克塞尔罗德赋予了好人一个专有

40
00:01:56,474 --> 00:02:01,212
含义如同许多其他政治科学家经济学家数学家

41
00:02:01,311 --> 00:02:04,650
与心理学家一样阿克塞尔罗德对囚徒困境

42
00:02:04,674 --> 00:02:06,962
这一简单的博弈游戏很感兴趣

43
00:02:07,537 --> 00:02:10,473
这个游戏极其简单但我知道许多

44
00:02:10,486 --> 00:02:13,650
聪明人完全误解了游戏以为其复杂

45
00:02:13,662 --> 00:02:17,361
无比不过它的简单也带有欺骗性

46
00:02:17,925 --> 00:02:20,836
图书馆里关于这个博弈衍生物的书籍

47
00:02:20,949 --> 00:02:24,175
多如牛毛许多有影响力的人认为

48
00:02:24,275 --> 00:02:26,175
它是解决战略防御规划问题的

49
00:02:26,187 --> 00:02:29,312
钥匙这个模型需被仔细研究以

50
00:02:29,312 --> 00:02:32,525
阻止第三次世界大战的发生而作为一个

51
00:02:32,550 --> 00:02:35,687
生物学家我站在阿克塞尔罗德与汉密尔顿

52
00:02:35,699 --> 00:02:38,836
一边许多野生动物和植物正以其

53
00:02:38,861 --> 00:02:42,111
演化进程精确无误地进行着囚徒困境

54
00:02:42,137 --> 00:02:44,875
的博弈在其原始的人类版本中

55
00:02:45,187 --> 00:02:48,287
囚徒博弈是这样的一个银行家判定

56
00:02:48,312 --> 00:02:51,025
两位玩家的输赢并付与赢家报酬

57
00:02:51,598 --> 00:02:53,775
假设我们便是这两位玩家当我们

58
00:02:53,787 --> 00:02:56,562
开始博弈时虽然我们将看到对立

59
00:02:56,586 --> 00:02:58,037
是我们最不应该做的我们

60
00:02:58,037 --> 00:03:00,425
手中各有两张卡分别为合作

61
00:03:00,537 --> 00:03:03,086
与背叛我们各自选定一张牌

62
00:03:03,361 --> 00:03:05,550
面朝下摆放在桌子上这样

63
00:03:05,550 --> 00:03:07,361
我们都不知道对方的选择也

64
00:03:07,361 --> 00:03:09,525
不会为对方选择所影响这便

65
00:03:09,537 --> 00:03:12,861
等同于我们同时行动然后我们等待

66
00:03:12,887 --> 00:03:15,699
银行家来翻牌我们的输赢不仅

67
00:03:15,711 --> 00:03:18,262
取决于我们出的牌还取决于对方

68
00:03:18,287 --> 00:03:21,300
打出的牌其悬念在于虽然

69
00:03:21,300 --> 00:03:23,336
我们清楚自己的出牌却并

70
00:03:23,336 --> 00:03:25,425
不知道对方的出牌我们都

71
00:03:25,425 --> 00:03:28,187
只能等银行家来揭晓结果我们一共

72
00:03:28,187 --> 00:03:31,675
有2×2=4张牌于是也便有

73
00:03:31,699 --> 00:03:34,000
4种可能的结果为向这个

74
00:03:34,000 --> 00:03:37,050
游戏的发源地北美致敬我们以美元

75
00:03:37,062 --> 00:03:40,111
来表示这4种输赢结果结果

76
00:03:40,111 --> 00:03:43,625
1我们俩都选择了合作银行家给

77
00:03:43,625 --> 00:03:47,211
我们每个人300美元这个不菲的总数是

78
00:03:47,211 --> 00:03:50,562
对相互合作的奖赏结果2我们

79
00:03:50,562 --> 00:03:53,723
俩都选择了背叛银行家对每个人罚款

80
00:03:53,750 --> 00:03:57,900
10美元这是对相互背叛的惩罚结果

81
00:03:57,900 --> 00:04:02,062
3你选择合作我选择背叛银行家

82
00:04:02,086 --> 00:04:05,312
付给我500美元这是背叛的诱惑罚

83
00:04:05,312 --> 00:04:09,848
了你傻瓜100美元结果4你选择

84
00:04:09,861 --> 00:04:13,550
背叛我选择合作银行家将背叛的

85
00:04:13,562 --> 00:04:15,812
诱惑付给了你而罚了我

86
00:04:15,812 --> 00:04:19,024
这个傻瓜100美元结果3与4明显

87
00:04:19,036 --> 00:04:22,387
互为镜像一个玩家得到好处则

88
00:04:22,387 --> 00:04:25,375
有另一个玩家将付出代价在结果

89
00:04:25,399 --> 00:04:27,675
1与2里我们俩得到相同的

90
00:04:27,687 --> 00:04:29,937
结果而结果1对我们俩都

91
00:04:29,937 --> 00:04:33,036
有好处这里金钱的具体数目并不要紧

92
00:04:33,387 --> 00:04:35,850
重要的是这个博弈里囚徒困境

93
00:04:35,875 --> 00:04:38,961
结果的排列顺序背叛的诱惑相互

94
00:04:38,961 --> 00:04:41,961
合作的奖赏相互背叛的惩罚失败

95
00:04:41,961 --> 00:04:45,411
的代价严格来说这个博弈还有另一个

96
00:04:45,425 --> 00:04:48,100
条件背叛的诱惑与失败的代价

97
00:04:48,100 --> 00:04:50,687
的平均值不可高于相互合作的奖赏

98
00:04:51,262 --> 00:04:53,350
我们将在后边附加条件里提到

99
00:04:53,375 --> 00:04:56,312
这个原因这四种结果总结于表

100
00:04:56,312 --> 00:04:59,687
12—1里表12-1我在囚徒困境博弈

101
00:04:59,687 --> 00:05:02,612
里各种结果的输赢状况那么为什么

102
00:05:02,637 --> 00:05:05,161
这是一个困境看看这张输赢状况

103
00:05:05,161 --> 00:05:07,661
的表格想象一下我在与你

104
00:05:07,675 --> 00:05:09,937
博弈时脑海中盘旋着的想法

105
00:05:10,512 --> 00:05:13,899
我知道你只有两张牌合作或者

106
00:05:13,911 --> 00:05:16,350
背叛让我们按次序来想想

107
00:05:16,911 --> 00:05:19,600
如果你打出背叛这表示我们

108
00:05:19,612 --> 00:05:21,036
将看向表格中的右边一

109
00:05:21,036 --> 00:05:23,086
列我能打出最好的牌

110
00:05:23,187 --> 00:05:25,250
也只能是背叛虽然我也将

111
00:05:25,262 --> 00:05:27,800
接受相互背叛的惩罚但我知道

112
00:05:28,336 --> 00:05:31,312
如果选择了合作失败者的代价只会

113
00:05:31,324 --> 00:05:34,137
更高而如果你选择了合作看

114
00:05:34,137 --> 00:05:36,925
向左边一列我最好的结果也只能

115
00:05:36,925 --> 00:05:39,824
是选择背叛如果我们合作了我们

116
00:05:39,824 --> 00:05:42,112
都能得到300美元但如果我选择

117
00:05:42,125 --> 00:05:45,149
背叛我将得到更多500美元这里

118
00:05:45,149 --> 00:05:47,300
的结论是无论你选择哪张

119
00:05:47,300 --> 00:05:50,086
牌我最好的选择是永远背叛

120
00:05:50,100 --> 00:05:52,149
我已经运用我无懈可击的逻辑算

121
00:05:52,149 --> 00:05:55,387
出无论你如何选择我都必须背叛

122
00:05:55,961 --> 00:05:57,875
而你也将算出同样的

123
00:05:57,887 --> 00:06:01,211
结果于是当两个理性的对手相对

124
00:06:01,211 --> 00:06:04,425
时他们将同时背叛也将同时

125
00:06:04,524 --> 00:06:07,711
被罚款获得一个较低的分数虽然

126
00:06:07,737 --> 00:06:11,000
每个人都心知肚明如果他们彼此选择合作

127
00:06:11,312 --> 00:06:12,937
两人都将得到较高的相互

128
00:06:12,949 --> 00:06:15,500
合作的奖赏我们的例子里是

129
00:06:15,512 --> 00:06:18,762
300美元这就是为什么这个博弈被

130
00:06:18,762 --> 00:06:22,475
称为困境自相矛盾得令人恼火这也就是

131
00:06:22,487 --> 00:06:25,461
为什么人们开始提出必须有一个法律

132
00:06:25,562 --> 00:06:28,336
来对付这个问题囚徒来自一个特殊

133
00:06:28,336 --> 00:06:30,975
的想象中的例子上述例子中

134
00:06:30,975 --> 00:06:33,949
的现金被监狱的刑罚取代两个

135
00:06:33,975 --> 00:06:36,161
在监狱中的囚徒姑且称他们

136
00:06:36,161 --> 00:06:39,350
为彼得森与莫里亚蒂有共同犯罪的嫌疑

137
00:06:39,923 --> 00:06:42,062
囚徒们各自被关押在单独的

138
00:06:42,074 --> 00:06:44,449
牢房里并各自被劝诱背叛他

139
00:06:44,449 --> 00:06:47,350
的同伙将所有犯罪证据栽赃对方

140
00:06:47,923 --> 00:06:50,574
他们的判决结果将取决于两个囚徒

141
00:06:50,574 --> 00:06:52,812
的行为而双方都不知道对方

142
00:06:52,812 --> 00:06:56,162
的选择如果彼得森将所有罪过都

143
00:06:56,173 --> 00:06:59,798
推向莫里亚蒂而莫里亚蒂始终保持沉默与

144
00:06:59,798 --> 00:07:02,312
他从前的朋友现在的叛徒合作

145
00:07:02,586 --> 00:07:06,662
莫里亚蒂将接受重罚而彼得森得以无罪释放

146
00:07:06,824 --> 00:07:09,649
享受背叛的诱惑如果两人互相

147
00:07:09,662 --> 00:07:12,324
背叛便都将获罪但可以因为

148
00:07:12,348 --> 00:07:15,537
供认不讳而得到轻判这便是互相背叛

149
00:07:15,537 --> 00:07:18,625
的惩罚如果两人互相与对方

150
00:07:18,723 --> 00:07:22,399
而不是当局合作闭口不谈过往所得证据

151
00:07:22,423 --> 00:07:23,762
将不足以把两人判以

152
00:07:23,762 --> 00:07:25,912
重罪则两人也都将得到

153
00:07:25,923 --> 00:07:29,012
轻判得到互相合作的奖赏虽然

154
00:07:29,024 --> 00:07:32,086
将牢狱刑罚称为奖赏有点儿奇怪但

155
00:07:32,086 --> 00:07:34,473
比起漫长的铁窗生涯犯人们

156
00:07:34,500 --> 00:07:36,824
肯定会将此看作奖赏的你

157
00:07:36,836 --> 00:07:39,723
可以发现虽然这里的回报不是美元

158
00:07:39,812 --> 00:07:42,861
而是牢狱刑罚博弈的主要特征依然

159
00:07:42,861 --> 00:07:45,812
保存着看看四个结果可取性的排列

160
00:07:45,812 --> 00:07:48,598
顺序如果你将自己放在任何

161
00:07:48,611 --> 00:07:51,111
一个囚徒的位置上假设两人

162
00:07:51,211 --> 00:07:53,162
都以理性的自我利益为动机

163
00:07:53,574 --> 00:07:56,949
你将看到两人都只能背叛对方而

164
00:07:56,961 --> 00:08:00,236
同样接受沉重的刑罚有没有逃离困境

165
00:08:00,236 --> 00:08:03,537
的方法呢双方都知道无论对方

166
00:08:03,562 --> 00:08:06,486
如何选择他们能做出的最好的选择

167
00:08:06,586 --> 00:08:09,912
都是背叛但他们也都知道如果

168
00:08:09,925 --> 00:08:12,723
双方都选择合作任何一方都可以

169
00:08:12,723 --> 00:08:16,512
得到更多的好处如果如果如果能

170
00:08:16,512 --> 00:08:19,250
有一个办法让他们达成共识能

171
00:08:19,250 --> 00:08:21,774
有一个办法让双方都坚信对方

172
00:08:21,774 --> 00:08:24,037
可以被信任不至于奔向那个自私的

173
00:08:24,050 --> 00:08:26,500
奖赏能有一个方法来维持双方

174
00:08:26,512 --> 00:08:28,973
共识在囚徒困境这个简单博弈里

175
00:08:29,324 --> 00:08:32,500
没有任何方法可以达成信任除非其中

176
00:08:32,500 --> 00:08:34,924
一方是一个虔诚的傻瓜善良得

177
00:08:34,949 --> 00:08:38,424
根本不可能适应这个世界这个博弈注定

178
00:08:38,437 --> 00:08:42,287
将以相互背叛相互损伤告终然而

179
00:08:42,723 --> 00:08:45,449
这个博弈还有另一个版本重复博弈的

180
00:08:45,473 --> 00:08:49,287
囚徒困境这个重复博弈更为复杂但

181
00:08:49,299 --> 00:08:52,736
复杂性里孕育着希望重复博弈只是

182
00:08:52,750 --> 00:08:55,236
简单将上述博弈与同一个对手

183
00:08:55,336 --> 00:08:58,125
无限次重复你我再次在银行家

184
00:08:58,136 --> 00:09:01,274
面前左右相对再次拥有手中的两张牌

185
00:09:01,562 --> 00:09:04,174
合作与背叛我们再次各自打出

186
00:09:04,187 --> 00:09:07,287
一张牌由银行家根据上述规则

187
00:09:07,399 --> 00:09:09,799
给出奖赏与惩罚但这一次

188
00:09:09,812 --> 00:09:12,687
对弈不再是博弈的终结我们捡

189
00:09:12,687 --> 00:09:14,674
起手中的牌准备着下一

190
00:09:14,674 --> 00:09:17,074
轮下一轮的游戏给予我们

191
00:09:17,086 --> 00:09:20,375
机会来重新建立信任与怀疑实施

192
00:09:20,386 --> 00:09:23,774
对抗或和解给予报复或宽恕在

193
00:09:23,774 --> 00:09:26,000
这无限长的博弈里我们最

194
00:09:26,000 --> 00:09:28,761
重要的任务是赢了银行家而

195
00:09:28,761 --> 00:09:32,361
不是对方在10次博弈后理论上我

196
00:09:32,473 --> 00:09:35,062
也许可以获得最多5000美元但

197
00:09:35,074 --> 00:09:37,736
只有在你完全愚不可及或者大公无私地

198
00:09:37,761 --> 00:09:39,836
每次都打出合作的时候我

199
00:09:39,836 --> 00:09:42,461
才有可能每次都得到最高奖赏背叛

200
00:09:42,461 --> 00:09:44,875
的诱惑在更实际一点儿的情况

201
00:09:44,875 --> 00:09:47,149
里我们各自都在10次对弈中

202
00:09:47,250 --> 00:09:49,674
打出合作并各自从银行家里

203
00:09:49,787 --> 00:09:53,199
得到3000美元这样我们并不

204
00:09:53,199 --> 00:09:55,787
需要特别大公无私因为我们彼此都能

205
00:09:55,787 --> 00:09:57,912
从对方过往的行为中知道对方

206
00:09:57,937 --> 00:10:00,774
可以信任我们事实上也在监管着

207
00:10:00,774 --> 00:10:03,261
对方的行为还有另一个也可能发生

208
00:10:03,261 --> 00:10:06,100
的结果我们彼此不信任对方在

209
00:10:06,112 --> 00:10:08,024
10次对弈中都打出了背叛

210
00:10:08,399 --> 00:10:11,011
银行家则从每个人处得到了100美元

211
00:10:11,586 --> 00:10:13,687
最可能发生的是我们并不

212
00:10:13,687 --> 00:10:16,086
完全信任对方打出了各种次序

213
00:10:16,086 --> 00:10:18,237
的合作与背叛双方都得到了

214
00:10:18,261 --> 00:10:20,211
并不多的金钱在第10

215
00:10:20,211 --> 00:10:22,824
章中那些互相从对方羽毛中

216
00:10:22,937 --> 00:10:25,125
捉出蜱虫的鸟正是进行一

217
00:10:25,125 --> 00:10:28,049
场囚徒困境的重复博弈这怎么

218
00:10:28,049 --> 00:10:30,912
进行呢你应该还记得对于鸟

219
00:10:30,912 --> 00:10:33,774
来说从自己身上清除蜱虫非常重要

220
00:10:34,136 --> 00:10:36,037
但它无法自己清除头部的蜱虫

221
00:10:36,412 --> 00:10:38,886
只能依靠同伴来帮助它而让

222
00:10:38,886 --> 00:10:41,674
它同样报答对方也是公平的但

223
00:10:41,687 --> 00:10:44,074
这项工作耗费了许多时间精力

224
00:10:44,449 --> 00:10:47,037
鸟类在这方面并不宽裕如果

225
00:10:47,037 --> 00:10:49,174
某只鸟能以欺骗方式从

226
00:10:49,187 --> 00:10:51,324
这个小圈子中逃出来让别人

227
00:10:51,336 --> 00:10:54,812
清除自己的蜱虫而拒绝互惠互利它

228
00:10:54,824 --> 00:10:57,037
则能得到所有实惠而不需

229
00:10:57,037 --> 00:10:59,737
支付任何代价如果你将这些回报

230
00:10:59,750 --> 00:11:03,274
结果排列一下次序你将发现这

231
00:11:03,274 --> 00:11:06,687
正是真实的囚徒困境博弈互相合作

232
00:11:06,799 --> 00:11:09,237
以清除彼此的蜱虫固然是好事

233
00:11:09,612 --> 00:11:11,549
但还有着更好的诱惑促使

234
00:11:11,549 --> 00:11:14,649
你拒绝支付互惠的代价互相背叛

235
00:11:14,750 --> 00:11:17,725
以拒绝清除蜱虫固然不是好事但

236
00:11:17,725 --> 00:11:19,475
也没有比花精力帮别人除

237
00:11:19,475 --> 00:11:22,199
虫而自己无人理睬更不好表

238
00:11:22,199 --> 00:11:25,899
12—2展示了这个回报结果表12-2

239
00:11:25,912 --> 00:11:28,586
鸟类清除蜱虫的博弈我从各种

240
00:11:28,600 --> 00:11:29,836
结果中得到的回报

241
00:11:30,100 --> 00:11:32,548
但这只是一个例子如果你继续

242
00:11:32,562 --> 00:11:35,062
思考你更会发现从人类到

243
00:11:35,075 --> 00:11:38,125
动植物生活中充满了囚徒困境的

244
00:11:38,149 --> 00:11:42,799
重复博弈植物是的记得我们谈到策略

245
00:11:42,799 --> 00:11:45,511
时我们没有提到有意识的策略但

246
00:11:45,524 --> 00:11:47,611
我们之后可能会提及但我们提及

247
00:11:47,611 --> 00:11:50,500
了梅纳德史密斯的意识这便是一种

248
00:11:50,524 --> 00:11:53,062
预定基因的策略我们之后还会

249
00:11:53,073 --> 00:11:57,049
提到植物动物甚至细菌它们都在

250
00:11:57,062 --> 00:12:00,125
进行着囚徒困境的重复博弈现在

251
00:12:00,549 --> 00:12:03,350
先让我们详细探索一下为何重复

252
00:12:03,361 --> 00:12:06,812
博弈如此重要在简单博弈里我们

253
00:12:06,825 --> 00:12:09,298
可以预见背叛是唯一的理性策略

254
00:12:09,875 --> 00:12:12,537
但重复博弈并不相同它提供

255
00:12:12,537 --> 00:12:15,798
了许多选择范围简单博弈里只有

256
00:12:15,798 --> 00:12:19,986
两种策略合作或是背叛但重复博弈

257
00:12:20,100 --> 00:12:22,399
可以有很多我们想象得到的策略

258
00:12:22,673 --> 00:12:25,225
并没有任何一个是绝对的最佳

259
00:12:25,236 --> 00:12:28,812
方案比如大部分时间合作而在随机

260
00:12:28,812 --> 00:12:32,136
的时间里背叛这个策略便是成千上万

261
00:12:32,136 --> 00:12:34,111
的策略里中的一个也可以

262
00:12:34,125 --> 00:12:36,673
基于过往历史来选择策略我的

263
00:12:36,700 --> 00:12:39,849
斤斤计较者正是一个例子这种鸟对

264
00:12:39,861 --> 00:12:42,099
脸部有很好的记忆力尽管它

265
00:12:42,111 --> 00:12:44,361
基本采取合作策略但它也会

266
00:12:44,375 --> 00:12:46,700
背叛那些曾经背叛过它的对手

267
00:12:47,274 --> 00:12:50,312
还有一些其他策略可能更为宽容或者

268
00:12:50,325 --> 00:12:53,636
有更短期的记忆显然重复博弈

269
00:12:53,636 --> 00:12:55,711
里可用的策略之多取决于我们

270
00:12:55,711 --> 00:12:58,511
的创造力但我们能够算出哪个

271
00:12:58,524 --> 00:13:01,649
是最佳方案吗阿克塞尔罗德也这么问

272
00:13:01,649 --> 00:13:03,750
自己他想出了一个很具

273
00:13:03,761 --> 00:13:07,187
娱乐性的方案举行一场竞赛他广发

274
00:13:07,187 --> 00:13:09,599
通知让博弈论的专家们来

275
00:13:09,611 --> 00:13:12,774
提交策略在这里策略指的是

276
00:13:12,798 --> 00:13:16,162
事先确定的行动规则所以竞争者

277
00:13:16,187 --> 00:13:20,261
可以用计算机语言编程加入博弈阿克塞尔罗德

278
00:13:20,361 --> 00:13:23,274
总共收到了14个策略为了得到更

279
00:13:23,274 --> 00:13:24,923
好的结果他还加了第

280
00:13:24,923 --> 00:13:28,761
15个策略取名为随机这个策略只是

281
00:13:28,774 --> 00:13:31,399
简单地随机出合作或背叛牌

282
00:13:31,662 --> 00:13:34,625
基本等于无策略如果任何一个其他

283
00:13:34,636 --> 00:13:36,812
策略比随机策略的结果更坏

284
00:13:37,224 --> 00:13:40,461
这一定是个非常差的策略阿克塞尔罗德

285
00:13:40,562 --> 00:13:43,098
将这15个策略翻译成一种常用

286
00:13:43,098 --> 00:13:46,000
的计算机语言在一台大型计算机中

287
00:13:46,111 --> 00:13:49,574
设定这些策略互相博弈每个策略轮流

288
00:13:49,586 --> 00:13:52,787
与其他策略包括它自己进行重复

289
00:13:52,799 --> 00:13:58,187
博弈15个策略总共组成15×15=225个排列

290
00:13:58,187 --> 00:14:01,586
组合在计算机上轮番进行每一个

291
00:14:01,598 --> 00:14:04,750
组合需要进行200回合的博弈所有

292
00:14:04,761 --> 00:14:07,437
输赢累积计算以得出最终的赢家

293
00:14:08,011 --> 00:14:10,875
这里我们不关心某一个策略是否

294
00:14:10,875 --> 00:14:13,774
优于另一个策略我们只关心哪个策略

295
00:14:13,875 --> 00:14:16,037
在与15个对手博弈后最终赢得

296
00:14:16,062 --> 00:14:18,961
最多的钱在这里钱指的

297
00:14:18,961 --> 00:14:21,562
是赢得的分数相互合作的奖赏

298
00:14:21,562 --> 00:14:24,437
为3分背叛的诱惑为5分互相

299
00:14:24,449 --> 00:14:26,986
背叛的惩罚为1分相当于我们早先

300
00:14:27,000 --> 00:14:28,937
例子中的轻判失败的代价

301
00:14:28,961 --> 00:14:30,986
为0分等同于之前例子中的

302
00:14:31,000 --> 00:14:35,312
重罚表12-3阿克塞尔罗德的计算机竞赛我

303
00:14:35,312 --> 00:14:37,336
在各种结果中所得的回报无论

304
00:14:37,336 --> 00:14:39,761
是哪一种策略理论上它们能得到

305
00:14:39,761 --> 00:14:42,625
的最高总分都是15000分每

306
00:14:42,625 --> 00:14:45,549
一回合5分15个对手共有200回合

307
00:14:45,875 --> 00:14:49,261
最低分则是0分不用说这两个

308
00:14:49,261 --> 00:14:52,861
极端都没有实现实际上一个策略如果

309
00:14:52,875 --> 00:14:55,111
能超过15个对手中的平均水平

310
00:14:55,424 --> 00:14:57,924
最多也只能获得比600分高出

311
00:14:57,924 --> 00:15:00,625
一些的分数因为如果双方决定持续

312
00:15:00,636 --> 00:15:03,199
合作每人在200场博弈中都

313
00:15:03,199 --> 00:15:06,537
能得到3分总共便是600分我们可以

314
00:15:06,549 --> 00:15:09,674
将600分作为基准分将所有分数

315
00:15:09,787 --> 00:15:12,586
表达为600分的百分比这么算来

316
00:15:12,986 --> 00:15:15,287
理论上面对一个对手的最高分将

317
00:15:15,287 --> 00:15:19,699
是166%1000分但事实上没有

318
00:15:19,711 --> 00:15:22,299
任何一个策略的平均分超过600分

319
00:15:22,861 --> 00:15:25,562
要知道竞赛中的博弈者并不是

320
00:15:25,574 --> 00:15:28,549
人类而是计算机事先设定好的程序

321
00:15:29,125 --> 00:15:31,074
而基因在这些程序的作者里

322
00:15:31,187 --> 00:15:34,211
事先设定了程序使得它们身体力行地

323
00:15:34,223 --> 00:15:36,586
扮演同样的角色想想第4

324
00:15:36,586 --> 00:15:39,299
章中的计算机对弈与仙女座超级

325
00:15:39,312 --> 00:15:42,500
计算机你可以将这些策略想象成

326
00:15:42,524 --> 00:15:45,562
这些作者的微型代理虽然一个作者

327
00:15:45,662 --> 00:15:47,987
原本可以提交一个以上的策略但

328
00:15:47,987 --> 00:15:50,574
这其实是作弊这表示作者将

329
00:15:50,574 --> 00:15:53,225
在竞争本身中加入策略使得其中

330
00:15:53,237 --> 00:15:55,687
一个角色从另一个角色的牺牲中

331
00:15:55,787 --> 00:15:59,287
得到合作的好处阿克塞尔罗德应该不会接受

332
00:15:59,299 --> 00:16:01,537
这一点有一些交上来的策略

333
00:16:01,562 --> 00:16:04,250
很聪明当然它们远没有其作者

334
00:16:04,261 --> 00:16:08,000
聪明然而最后胜出的策略却是

335
00:16:08,011 --> 00:16:10,612
一个最简单的而且看起来最不

336
00:16:10,612 --> 00:16:13,737
聪明的一个这个策略被称为针锋相对

337
00:16:13,924 --> 00:16:16,287
TitforTat它来自多伦多一位

338
00:16:16,287 --> 00:16:20,125
著名心理学家和博弈学家阿纳托尔拉波波特

339
00:16:20,399 --> 00:16:24,399
AnatolRapoport教授这个策略在第一回合时

340
00:16:24,511 --> 00:16:27,149
采取合作行动然后在接下来的所有

341
00:16:27,162 --> 00:16:29,500
步骤里只是简单复制对手上一

342
00:16:29,500 --> 00:16:32,011
步的行动有了针锋相对策略的

343
00:16:32,024 --> 00:16:36,199
博弈将如何进行呢一如寻常下一步的

344
00:16:36,211 --> 00:16:39,562
出牌完全取决于对手假设另一

345
00:16:39,574 --> 00:16:42,524
对手也选择了针锋相对的策略每一个

346
00:16:42,537 --> 00:16:45,461
策略不止与其他14个对手竞争也

347
00:16:45,461 --> 00:16:48,024
与自己博弈双方都选择以合作

348
00:16:48,136 --> 00:16:51,336
开场第二步中双方都复制对方上

349
00:16:51,336 --> 00:16:54,375
一步的策略仍然采取合作这样

350
00:16:54,750 --> 00:16:58,336
博弈双方持续合作直到游戏结束双方

351
00:16:58,336 --> 00:17:00,761
都能获得100%的600分基准分

352
00:17:01,100 --> 00:17:04,375
那么假设针锋相对与另一个策略老实人

353
00:17:04,386 --> 00:17:09,299
探测器NaiveProber开始博弈事实上老实人

354
00:17:09,311 --> 00:17:12,261
探测器并没有出现在阿克塞尔罗德的博弈

355
00:17:12,275 --> 00:17:14,500
竞赛中但它依然是一个富有

356
00:17:14,511 --> 00:17:17,375
指导性的策略这个策略基本等同

357
00:17:17,375 --> 00:17:20,148
于针锋相对但每隔一会儿比如在

358
00:17:20,162 --> 00:17:22,574
每十步中任意选择一步这个

359
00:17:22,586 --> 00:17:24,724
策略会打出恶意的背叛牌

360
00:17:24,949 --> 00:17:27,112
而获得最高的分数背叛的诱惑

361
00:17:27,686 --> 00:17:29,574
如果老实人探测器不打出其

362
00:17:29,586 --> 00:17:32,424
试探的背叛牌博弈双方便是两个

363
00:17:32,449 --> 00:17:35,011
针锋相对打出一场漫长且互利

364
00:17:35,011 --> 00:17:37,724
的合作牌彼此安稳地获得100%

365
00:17:37,724 --> 00:17:40,511
的基准分但突然间假设在

366
00:17:40,537 --> 00:17:43,450
第8回合老实人探测器出其不意地

367
00:17:43,474 --> 00:17:46,436
背叛了针锋相对却依然不知情地

368
00:17:46,436 --> 00:17:48,936
坚持合作也便只能付出失败者的

369
00:17:48,936 --> 00:17:52,186
代价得到0分而老实人探测器能

370
00:17:52,186 --> 00:17:54,923
得到最高成绩5分但在下一步里

371
00:17:55,250 --> 00:17:58,000
针锋相对开始报复复制了对手上一

372
00:17:58,000 --> 00:17:59,950
步的行动打出了背叛牌

373
00:18:00,325 --> 00:18:03,061
而老实人探测器盲目地继续原本

374
00:18:03,075 --> 00:18:05,311
设定的程序复制对手上一步

375
00:18:05,311 --> 00:18:08,125
的合作牌于是它只能获得0分

376
00:18:08,237 --> 00:18:12,211
而针锋相对得到5分再下一步老实人

377
00:18:12,223 --> 00:18:14,737
探测器极其不公正地又开始了

378
00:18:14,750 --> 00:18:19,325
报复背叛了针锋相对反之亦然在每一

379
00:18:19,325 --> 00:18:21,798
轮交替报复的回合里双方各自

380
00:18:21,811 --> 00:18:25,037
平均获得2.5分5分与0分的平均值

381
00:18:25,612 --> 00:18:28,798
这依然低于双方持续双向合作所

382
00:18:28,798 --> 00:18:31,575
能轻而易举获得的3分这也是本章

383
00:18:31,575 --> 00:18:33,737
前文中尚未解释的特殊情况

384
00:18:33,761 --> 00:18:37,136
的原因于是当老实人探测器与

385
00:18:37,150 --> 00:18:40,461
针锋相对开始博弈双方都未能获得两个

386
00:18:40,487 --> 00:18:43,348
针锋相对博弈时所得的分数而如果

387
00:18:43,375 --> 00:18:45,973
老实人探测器互相对弈其结果只

388
00:18:45,973 --> 00:18:48,936
可能更坏因为这种以牙还牙的冤冤相报

389
00:18:49,048 --> 00:18:51,336
可能开始得更早让我们再

390
00:18:51,336 --> 00:18:55,237
来考虑另一个叫愧疚探测器RemorsefulProber

391
00:18:55,436 --> 00:18:58,275
的策略这个策略有点类似于老实

392
00:18:58,275 --> 00:19:01,325
人探测器但它可以主动终止循环

393
00:19:01,325 --> 00:19:03,798
于双方间的交互背叛这便

394
00:19:03,811 --> 00:19:06,950
需要一种比针锋相对或老实人探测器

395
00:19:06,973 --> 00:19:09,723
更长的记忆愧疚探测器能记住

396
00:19:09,723 --> 00:19:12,799
自己是否刚刚主动背叛或者只是为了

397
00:19:12,811 --> 00:19:16,186
报复如果是后者它便愧疚地

398
00:19:16,299 --> 00:19:18,799
让对手得到一次反击的机会而

399
00:19:18,799 --> 00:19:21,223
不加以报复这便将此循环

400
00:19:21,250 --> 00:19:24,525
报复行为终结在萌芽状态如果你

401
00:19:24,525 --> 00:19:27,711
在想象中旁观愧疚探测器与针锋相对

402
00:19:27,711 --> 00:19:30,574
的博弈你会发现可能的循环

403
00:19:30,586 --> 00:19:34,261
报复行动不攻自破博弈中大部分时间都

404
00:19:34,261 --> 00:19:37,049
采取互相合作使得双方都能获得

405
00:19:37,074 --> 00:19:39,436
相应的高分在与针锋相对的

406
00:19:39,449 --> 00:19:42,174
博弈中愧疚探测器能获得比老实

407
00:19:42,174 --> 00:19:44,461
人探测器更高的分数但依然

408
00:19:44,461 --> 00:19:46,862
没有针锋相对与自己对弈的分数高

409
00:19:47,424 --> 00:19:50,125
阿克塞尔罗德的竞赛里还有一些比老实

410
00:19:50,125 --> 00:19:52,511
人探测器与愧疚探测器更为复杂的

411
00:19:52,525 --> 00:19:55,336
策略但它们平均分都比针锋相对

412
00:19:55,348 --> 00:19:58,924
低事实上最失败的策略除了随机

413
00:19:59,074 --> 00:20:01,223
是最复杂的那一个作者为

414
00:20:01,324 --> 00:20:04,362
匿名这个作者的身份引发了一些

415
00:20:04,386 --> 00:20:08,987
饶有兴趣的猜测五角大楼的高层中央情报局的

416
00:20:09,000 --> 00:20:14,625
首脑国务卿基辛格阿克塞尔罗德自己我们也许永远

417
00:20:14,636 --> 00:20:17,311
也不会知道不是每个策略的细节

418
00:20:17,412 --> 00:20:19,386
都值得研究这本书也不

419
00:20:19,386 --> 00:20:22,000
谈计算机程序员的创造力但我们可以

420
00:20:22,000 --> 00:20:24,211
给这些策略归类并检验这些类别

421
00:20:24,211 --> 00:20:27,811
的成功率阿克塞尔罗德认为最重要的类别

422
00:20:27,811 --> 00:20:31,737
是善良善良类别指的是那些

423
00:20:31,761 --> 00:20:35,761
从不率先背叛的策略针锋相对便是其中

424
00:20:35,775 --> 00:20:38,162
一个例子它虽然也采取背叛的

425
00:20:38,174 --> 00:20:40,174
行动但它只在报复中这么

426
00:20:40,174 --> 00:20:43,449
做老实人探测器与愧疚探测器也

427
00:20:43,461 --> 00:20:46,511
偶尔采取背叛但这种行为是主动

428
00:20:46,525 --> 00:20:49,500
起意挑衅的属于恶意的策略这

429
00:20:49,500 --> 00:20:52,174
场竞赛中的15个策略中有8个

430
00:20:52,186 --> 00:20:55,848
属于善良策略令人吃惊的是策略中

431
00:20:55,848 --> 00:20:57,824
的前8名也是这8个善意的

432
00:20:57,836 --> 00:21:02,348
策略针锋相对的平均分504.5分达到我们

433
00:21:02,375 --> 00:21:05,150
600分基准分的84%是一个很

434
00:21:05,150 --> 00:21:08,186
好的分数其他善良策略所得分数

435
00:21:08,287 --> 00:21:11,949
要比针锋相对少一些从83.4%到

436
00:21:11,961 --> 00:21:15,900
78.6%不等排名中接下来的则是

437
00:21:15,900 --> 00:21:19,924
由格雷斯卡普Graaskamp所获得的66.8%

438
00:21:20,148 --> 00:21:21,737
与高分们有很大差距

439
00:21:22,125 --> 00:21:23,787
而这已经是所有恶意策略中

440
00:21:23,787 --> 00:21:26,162
的最高分了令人信服的结果

441
00:21:26,162 --> 00:21:28,924
表明好人在这个博弈中可以胜出

442
00:21:29,500 --> 00:21:32,511
阿克塞尔罗德提出的另一个术语则是宽容

443
00:21:33,074 --> 00:21:36,537
一个宽容的策略只有短期记忆虽然

444
00:21:36,561 --> 00:21:38,699
它也采取报复行为但它会

445
00:21:38,699 --> 00:21:42,162
很快遗忘对手的劣迹针锋相对便是一个

446
00:21:42,186 --> 00:21:44,699
宽容的策略面对背叛时它毫不

447
00:21:44,699 --> 00:21:47,000
手软但之后则过去的让它

448
00:21:47,011 --> 00:21:49,811
过去第10章中的斤斤计较者

449
00:21:49,836 --> 00:21:51,849
则是一个完全相反的例子它

450
00:21:51,849 --> 00:21:54,625
的记忆持续了整个博弈永不宽恕

451
00:21:54,648 --> 00:21:57,561
曾经背叛过它的对手在阿克塞尔罗德

452
00:21:57,561 --> 00:22:00,336
的竞赛中有一个策略与斤斤计较

453
00:22:00,336 --> 00:22:02,436
者完全相同由一位名叫

454
00:22:02,461 --> 00:22:06,436
弗里德曼Friedman的选手提供这一个善良

455
00:22:06,461 --> 00:22:08,237
而绝不宽恕的策略结果并不

456
00:22:08,237 --> 00:22:10,686
算佳成绩在所有善良策略里

457
00:22:10,686 --> 00:22:13,724
排倒数第二即便对手已经有悔改

458
00:22:13,737 --> 00:22:15,699
之意它也不愿意打破相互

459
00:22:15,711 --> 00:22:18,750
背叛的恶性循环因此无法取得很高

460
00:22:18,750 --> 00:22:22,412
的分数针锋相对并不是最宽容的策略

461
00:22:22,987 --> 00:22:24,449
我们还可以设计一个两报还

462
00:22:24,449 --> 00:22:26,912
一报TitforTwoTats的策略

463
00:22:27,237 --> 00:22:29,612
允许对手连续两次背叛后才开始

464
00:22:29,625 --> 00:22:32,162
报复这似乎显得过分大度坦荡了

465
00:22:32,724 --> 00:22:35,737
阿克塞尔罗德算出只要在竞赛中有

466
00:22:35,761 --> 00:22:37,299
两报还一报策略的存在

467
00:22:37,586 --> 00:22:39,612
它便一定会获得冠军因为它

468
00:22:39,625 --> 00:22:41,750
可以有效避免长期的互相伤害

469
00:22:42,099 --> 00:22:44,523
于是我们算出了赢家策略的

470
00:22:44,548 --> 00:22:47,798
两个特点善良与宽容这几乎是

471
00:22:47,798 --> 00:22:50,598
一个乌托邦式的结论善良与宽容

472
00:22:50,699 --> 00:22:53,424
能得到好报许多专家曾试图

473
00:22:53,436 --> 00:22:55,936
在恶意策略里耍点儿花招认为

474
00:22:55,936 --> 00:22:58,549
这可能得到高分即使那些提交

475
00:22:58,574 --> 00:23:00,912
善良策略的专家也未曾敢如

476
00:23:00,936 --> 00:23:04,148
针锋相对一般宽容所有人都对这个

477
00:23:04,148 --> 00:23:07,799
结论十分惊讶阿克塞尔罗德又举办了第二次

478
00:23:07,811 --> 00:23:11,061
竞赛这次他收到了62个策略再

479
00:23:11,061 --> 00:23:13,787
加上随机策略总共便有了63个

480
00:23:13,799 --> 00:23:17,023
策略这一次博弈中的回合数

481
00:23:17,136 --> 00:23:19,836
不再固定为200而改为开放式

482
00:23:19,836 --> 00:23:22,000
的不定数我之后会解释这么做

483
00:23:22,000 --> 00:23:24,586
的理由我们依然将得分评判为

484
00:23:24,612 --> 00:23:27,474
基准分永远合作分数的百分比不过

485
00:23:27,474 --> 00:23:29,724
现在基准分需要更为复杂的计算

486
00:23:29,961 --> 00:23:32,648
并不再是固定的600分第二次竞赛

487
00:23:32,648 --> 00:23:34,711
的程序员们都得到了第一次竞赛

488
00:23:34,711 --> 00:23:38,250
的结果还收到了阿克塞尔罗德对针锋相对

489
00:23:38,336 --> 00:23:41,761
与善良宽容策略获胜的分析这么

490
00:23:41,761 --> 00:23:43,936
做是为了让参赛者们能

491
00:23:43,936 --> 00:23:46,037
从某种方向上了解比赛的

492
00:23:46,061 --> 00:23:49,673
背景信息来权衡自己的判断事实上

493
00:23:50,025 --> 00:23:53,711
这些参赛者分成两种思路第一种参赛

494
00:23:53,711 --> 00:23:56,848
者认为已经有足够证据证明善良

495
00:23:56,862 --> 00:23:59,798
与宽容确实是获胜因素他们便

496
00:23:59,825 --> 00:24:02,150
随即提交了善良与宽容的策略

497
00:24:02,723 --> 00:24:06,173
参赛者约翰梅纳德史密斯提交了一个

498
00:24:06,200 --> 00:24:07,848
最为宽容的三报还一报

499
00:24:08,136 --> 00:24:11,086
TitforThreeTats的策略另一

500
00:24:11,086 --> 00:24:13,625
组参赛者则认为既然对手们

501
00:24:13,650 --> 00:24:16,287
已经读过了阿克塞尔罗德的分析估计

502
00:24:16,298 --> 00:24:18,886
都会提交善良宽容的策略他们

503
00:24:18,900 --> 00:24:21,400
于是便提交了恶意的策略以期

504
00:24:21,412 --> 00:24:24,450
在善意对手中占到便宜然而

505
00:24:24,886 --> 00:24:27,450
恶意再一次没有得到好报阿纳托尔

506
00:24:27,473 --> 00:24:30,311
提交的针锋相对策略再一次成为赢家

507
00:24:30,625 --> 00:24:34,275
获得了满分的96%善意策略再

508
00:24:34,275 --> 00:24:37,000
一次赢了恶意策略前15名中

509
00:24:37,112 --> 00:24:40,011
只有一个策略是恶意策略而倒数

510
00:24:40,025 --> 00:24:43,636
15名中只有一个是善意策略然而

511
00:24:43,961 --> 00:24:46,525
最为宽容的可以在第一次竞赛中

512
00:24:46,548 --> 00:24:48,250
胜出的两报还一报策略

513
00:24:48,612 --> 00:24:51,699
这次却没有成功这是因为本次

514
00:24:51,711 --> 00:24:53,750
竞赛中有了一些更为狡猾的

515
00:24:53,775 --> 00:24:57,074
恶意策略它们善于伪装自己无情地

516
00:24:57,098 --> 00:24:59,987
抛弃那些善良的人这揭晓了这些竞赛

517
00:24:59,987 --> 00:25:02,211
中非常重要的一点成功的

518
00:25:02,223 --> 00:25:05,287
策略取决于你的对手的策略这是

519
00:25:05,311 --> 00:25:07,561
唯一能解释两次竞赛中的不同

520
00:25:07,574 --> 00:25:10,699
结果的理由然而就像我之前

521
00:25:10,711 --> 00:25:12,900
说过的那样这本书并不是

522
00:25:12,912 --> 00:25:16,311
关于计算机程序员的创造力的那么是否

523
00:25:16,311 --> 00:25:18,261
有一个广泛客观的标准来让

524
00:25:18,261 --> 00:25:20,699
我们判断哪些是真正好的策略

525
00:25:21,275 --> 00:25:23,400
前几章的读者们估计已经开始

526
00:25:23,400 --> 00:25:26,061
准备从生物进化稳定策略理论中

527
00:25:26,162 --> 00:25:29,612
寻找答案了当时的我也是阿克塞尔罗德

528
00:25:29,723 --> 00:25:31,525
传播早期结果的小圈子中的一

529
00:25:31,525 --> 00:25:33,811
员我也被邀请在第二次竞赛

530
00:25:33,811 --> 00:25:36,961
中提交策略我并没有参赛但

531
00:25:36,961 --> 00:25:40,625
我给阿克塞尔罗德提了一个建议阿克塞尔罗德

532
00:25:40,737 --> 00:25:43,250
已经开始考虑进化稳定策略这个理论

533
00:25:43,250 --> 00:25:45,686
了但我觉得这个想法太重要

534
00:25:45,686 --> 00:25:47,862
了于是写信给他建议让他

535
00:25:47,875 --> 00:25:51,662
与汉密尔顿联系一下虽然当时阿克塞尔罗德并

536
00:25:51,662 --> 00:25:55,199
不认识汉密尔顿但汉密尔顿正与阿克塞尔罗德

537
00:25:55,299 --> 00:25:57,787
在同一所大学密歇根大学的另一个

538
00:25:57,799 --> 00:26:02,362
系里阿克塞尔罗德迅速联系了汉密尔顿最终

539
00:26:02,787 --> 00:26:04,737
他们合作的结果是一篇卓越

540
00:26:04,737 --> 00:26:07,525
的论文发表在1981年的科学

541
00:26:07,598 --> 00:26:10,098
杂志上也获得了美国科学促进会

542
00:26:10,362 --> 00:26:14,848
AAAS的纽科姆克里夫兰奖NewcombClevelandPrize

543
00:26:15,412 --> 00:26:19,211
阿克塞尔罗德和汉密尔顿除了讨论重复囚徒困境

544
00:26:19,237 --> 00:26:21,549
在生物学上有趣的例子外我

545
00:26:21,549 --> 00:26:23,449
还觉得他们给予了进化稳定策略

546
00:26:23,461 --> 00:26:25,711
方法应有的认可让我们来比较

547
00:26:25,711 --> 00:26:29,561
一下进化稳定策略与阿克塞尔罗德两次竞赛

548
00:26:29,561 --> 00:26:32,912
中的循环赛机制循环赛好比足球联盟中

549
00:26:32,912 --> 00:26:35,461
的比赛每一个策略都与其他

550
00:26:35,473 --> 00:26:38,761
策略对战同等次数策略的最后得分

551
00:26:38,900 --> 00:26:40,636
则是它与所有其他策略对弈

552
00:26:40,636 --> 00:26:43,636
后的所得总分如果一个策略想

553
00:26:43,636 --> 00:26:45,848
要在竞争中成功它必须在

554
00:26:45,875 --> 00:26:48,362
所有提交的策略中最富有竞争力

555
00:26:48,936 --> 00:26:52,112
阿克塞尔罗德将胜过其他对手的策略定义

556
00:26:52,112 --> 00:26:56,287
为强劲针锋相对便是一个强劲的策略

557
00:26:56,862 --> 00:26:59,112
但参与竞赛的策略对手们则

558
00:26:59,125 --> 00:27:02,125
相当主观只取决于参赛者所提交

559
00:27:02,125 --> 00:27:04,362
的策略水平这一点使我们

560
00:27:04,386 --> 00:27:08,487
相当头疼阿克塞尔罗德的第一个竞赛里刚好

561
00:27:08,500 --> 00:27:11,625
参赛的策略基本都是善意策略所以

562
00:27:11,737 --> 00:27:14,711
针锋相对赢得了竞赛而如果两报

563
00:27:14,737 --> 00:27:16,324
还一报参赛了则会赢

564
00:27:16,324 --> 00:27:19,674
了针锋相对但如果几乎所有参赛策略

565
00:27:19,787 --> 00:27:22,261
都为恶意策略情况就不同了

566
00:27:22,824 --> 00:27:24,799
这个假设发生的概率还是很大

567
00:27:24,799 --> 00:27:27,299
的毕竟人们提交的14个策略中

568
00:27:27,299 --> 00:27:30,549
有6个是恶意策略假如13个策略

569
00:27:30,648 --> 00:27:34,162
全为恶意策略针锋相对则不可能成功

570
00:27:34,474 --> 00:27:36,974
因为环境太差了提交策略的

571
00:27:36,987 --> 00:27:39,674
不同决定了策略所赢得的金钱

572
00:27:39,787 --> 00:27:43,636
和它们的排名位置也就是说竞赛结果

573
00:27:43,662 --> 00:27:47,787
将取决于参赛者的心血来潮那么我们

574
00:27:47,799 --> 00:27:50,898
如何减少竞赛的主观性呢答案是

575
00:27:51,199 --> 00:27:54,711
进化稳定策略你也许还记得进化

576
00:27:54,724 --> 00:27:57,299
稳定策略在众多的种群策略中

577
00:27:57,412 --> 00:27:59,912
占有许多席位也一直得到不错的

578
00:27:59,924 --> 00:28:03,961
结果如果说针锋相对是一种进化稳定

579
00:28:03,974 --> 00:28:07,586
策略这便是说针锋相对策略在充满

580
00:28:07,612 --> 00:28:10,011
针锋相对策略的大环境下能得到

581
00:28:10,037 --> 00:28:12,662
不错的结果这便是一种特殊的

582
00:28:12,674 --> 00:28:16,000
强劲作为进化论者我们一直很想

583
00:28:16,011 --> 00:28:18,349
找到一种唯一的可以直接决定结果

584
00:28:18,349 --> 00:28:21,424
的强劲为什么这很重要呢因为

585
00:28:21,436 --> 00:28:24,386
在达尔文主义的世界里成功并不是赢得

586
00:28:24,398 --> 00:28:28,261
金钱而是获得后裔对于一个达尔文主义者

587
00:28:28,561 --> 00:28:30,537
一个成功的策略将是一个在

588
00:28:30,549 --> 00:28:33,699
策略种群中数量众多的策略如果

589
00:28:33,699 --> 00:28:36,074
这个策略要保持成功它必须在

590
00:28:36,099 --> 00:28:38,811
同类众多时也就是充满了自身拷贝

591
00:28:38,811 --> 00:28:40,625
的大环境中得到特别好的

592
00:28:40,636 --> 00:28:41,000
结果

593
00:28:41,099 --> 00:28:45,423
阿克塞尔罗德又模仿自然选择进行了第三场竞赛

594
00:28:45,525 --> 00:28:49,086
来寻找进化稳定策略事实上他并

595
00:28:49,086 --> 00:28:51,598
没有称之为第三次竞赛因为他并没有

596
00:28:51,612 --> 00:28:53,787
邀请新的参赛者而只是使用

597
00:28:53,787 --> 00:28:56,511
了第二次竞赛中的63个策略但

598
00:28:56,511 --> 00:28:58,724
我觉得称它为第三次竞赛比较

599
00:28:58,724 --> 00:29:01,324
合适因为它和前两次循环赛有

600
00:29:01,324 --> 00:29:05,186
根本性的不同阿克塞尔罗德将这63个策略

601
00:29:05,287 --> 00:29:07,849
再次丢给计算机来制造进化演替

602
00:29:07,849 --> 00:29:10,662
的第一代第一代的大环境中由

603
00:29:10,662 --> 00:29:14,561
这63个策略组成结束后赢家不再

604
00:29:14,575 --> 00:29:17,912
得到金钱或者分数而是与其完全相同

605
00:29:17,912 --> 00:29:22,173
的后代世世代代如此传递一些策略逐渐

606
00:29:22,186 --> 00:29:25,398
变得数目稀少甚至完全绝迹另一些

607
00:29:25,412 --> 00:29:28,761
策略则数目众多当环境中策略的

608
00:29:28,773 --> 00:29:31,423
比例出现变化博弈中策略的出

609
00:29:31,423 --> 00:29:34,000
牌也在随之变化最终在

610
00:29:34,023 --> 00:29:37,375
1000代之后种群不再变化环境

611
00:29:37,398 --> 00:29:39,548
也没有再改变稳定的状态已经

612
00:29:39,548 --> 00:29:43,250
形成在此之前各种策略的命运起伏

613
00:29:43,250 --> 00:29:46,400
不定正如我模拟的骗子傻瓜和

614
00:29:46,423 --> 00:29:49,298
斤斤计较者的命运一样一些策略在

615
00:29:49,311 --> 00:29:52,298
博弈开始便已经灭绝大多数则在

616
00:29:52,325 --> 00:29:55,500
200代之后彻底灭绝在那些恶意

617
00:29:55,511 --> 00:29:58,700
策略中有一两个一开始蓬勃发展但

618
00:29:58,711 --> 00:30:00,875
它们的繁荣正如我的模拟预测

619
00:30:00,886 --> 00:30:04,061
一样只是昙花一现唯一活过200代

620
00:30:04,061 --> 00:30:07,237
的一个策略叫作哈灵顿Harrington它的

621
00:30:07,250 --> 00:30:10,973
数目在前150代中直线上升而后

622
00:30:11,000 --> 00:30:13,798
逐渐减少在1000代之后终于

623
00:30:13,811 --> 00:30:17,261
完全灭绝哈灵顿短期繁荣的原因跟

624
00:30:17,261 --> 00:30:19,287
我的骗子是一样的当那些

625
00:30:19,311 --> 00:30:20,586
如两报还一报之类的

626
00:30:20,598 --> 00:30:23,875
老实人过于宽容还在世时它

627
00:30:23,886 --> 00:30:26,612
欺负它们以获得发展但在这些

628
00:30:26,625 --> 00:30:29,650
老实人消失之后哈灵顿失去了猎物

629
00:30:29,936 --> 00:30:31,923
也跟随着它们的命运而灭绝

630
00:30:32,500 --> 00:30:35,750
剩下的策略都类似于针锋相对既

631
00:30:35,750 --> 00:30:39,586
善良又容易被煽动报复针锋相对本身

632
00:30:39,598 --> 00:30:42,423
在第三轮竞赛中6次中有5次

633
00:30:42,423 --> 00:30:45,048
得了第一重复其在第一二次

634
00:30:45,061 --> 00:30:47,875
竞赛时的好运另外5个虽善良

635
00:30:47,973 --> 00:30:49,936
但容易报复的策略则几乎和

636
00:30:49,961 --> 00:30:53,299
针锋相对一样成功在种群数目上还有

637
00:30:53,311 --> 00:30:55,525
一个策略甚至赢了第6次博弈

638
00:30:56,098 --> 00:30:58,636
当所有恶意策略都灭绝后所有

639
00:30:58,636 --> 00:31:01,362
的善良策略与针锋相对都无法辨认

640
00:31:01,375 --> 00:31:04,011
彼此了因为它们都很善良只是

641
00:31:04,025 --> 00:31:06,787
简单地与所有对手合作到底这种

642
00:31:06,811 --> 00:31:09,949
无法辨认的情况使得针锋相对在严格

643
00:31:09,949 --> 00:31:12,174
意义上不是一个真正的进化稳定

644
00:31:12,186 --> 00:31:15,473
策略即使它看起来确实很像一个

645
00:31:15,487 --> 00:31:18,973
策略要成为进化稳定策略意味着当

646
00:31:18,973 --> 00:31:21,211
它是常见策略时它不可被

647
00:31:21,237 --> 00:31:24,936
少数变异策略同化虽然针锋相对不会被

648
00:31:24,961 --> 00:31:27,862
任何恶意策略同化但另一个善良策略

649
00:31:27,886 --> 00:31:30,761
可能做到正如我们所看到的在

650
00:31:30,775 --> 00:31:33,324
善意策略的群体里它们面目模糊

651
00:31:33,612 --> 00:31:38,625
行为相同始终合作因此有一些其他善良

652
00:31:38,636 --> 00:31:41,848
策略比如永远合作这种选择优势不如

653
00:31:41,875 --> 00:31:44,598
针锋相对的策略也可以溜进种群

654
00:31:44,598 --> 00:31:46,973
里而不被发现所以严格地

655
00:31:46,973 --> 00:31:51,086
说针锋相对并不是进化稳定策略你也许

656
00:31:51,098 --> 00:31:54,250
会认为如果世界充满善良我们便

657
00:31:54,250 --> 00:31:57,424
可以认为针锋相对是一个进化稳定策略

658
00:31:57,424 --> 00:32:01,061
了但即使如此接下来的故事也

659
00:32:01,074 --> 00:32:04,412
并不如意永远合作与针锋相对不同

660
00:32:04,836 --> 00:32:06,711
它并不能抵挡一些恶意策略的

661
00:32:06,723 --> 00:32:10,324
入侵比如永远背叛的攻击便可以

662
00:32:10,324 --> 00:32:13,098
打败永远合作它可以每次都得到

663
00:32:13,125 --> 00:32:16,436
背叛诱惑的最高分类似永远背叛

664
00:32:16,461 --> 00:32:19,037
这样的恶意策略会减少过分善良

665
00:32:19,049 --> 00:32:22,586
策略的数目比如永远合作虽然严格

666
00:32:22,586 --> 00:32:26,037
来说针锋相对并不是一个真正的进化稳定

667
00:32:26,049 --> 00:32:28,586
策略但在实际操作中将这

668
00:32:28,586 --> 00:32:32,086
一类基本善意又宽容与针锋相对类似

669
00:32:32,086 --> 00:32:35,136
的策略近似看作进化稳定策略也是

670
00:32:35,150 --> 00:32:38,061
可行的这一类策略里甚至可以

671
00:32:38,074 --> 00:32:41,636
包括一小部分恶意策略阿克塞尔罗德的研究

672
00:32:41,662 --> 00:32:46,311
后继有人罗伯特博伊德与杰弗里洛伯鲍姆的研究

673
00:32:46,311 --> 00:32:49,037
成果是这些后续研究中最为有趣

674
00:32:49,037 --> 00:32:51,112
的他们将两报还一报

675
00:32:51,136 --> 00:32:53,912
与另一个针锋相对多疑版SuspiciousTitfor

676
00:32:53,924 --> 00:32:57,574
Tat的策略组合到一块儿针锋相对多疑

677
00:32:57,574 --> 00:33:00,561
版近似于针锋相对但本质上是

678
00:33:00,561 --> 00:33:02,987
一个恶意策略虽然恶意程度不高

679
00:33:03,537 --> 00:33:06,824
它只在第一回合采取背叛行动之后

680
00:33:06,824 --> 00:33:09,811
的所有出牌与针锋相对完全相同

681
00:33:10,375 --> 00:33:12,561
在一个针锋相对占主要地位的环境

682
00:33:12,561 --> 00:33:15,761
中针锋相对多疑版并不走运因为

683
00:33:15,761 --> 00:33:18,023
它的先行背叛导致了互相背叛

684
00:33:18,023 --> 00:33:20,386
的恶性循环但当它遇上了

685
00:33:20,412 --> 00:33:22,162
两报还一报时这场

686
00:33:22,186 --> 00:33:24,875
冤冤相报因对方的慈爱宽恕化解了

687
00:33:25,074 --> 00:33:28,086
双方都能至少得到满分而针锋相对

688
00:33:28,112 --> 00:33:29,787
多疑版还会因为其最初的

689
00:33:29,799 --> 00:33:32,750
背叛而获得更高的分数博伊德

690
00:33:32,773 --> 00:33:35,737
和洛伯鲍姆的研究结果表明针锋相对的

691
00:33:35,750 --> 00:33:37,787
群体可以被两报还一报

692
00:33:37,811 --> 00:33:40,186
与针锋相对多疑版的组合入侵影响

693
00:33:40,761 --> 00:33:43,086
从进化论角度上说则是两

694
00:33:43,086 --> 00:33:45,136
报还一报与针锋相对多疑版

695
00:33:45,162 --> 00:33:48,362
共生繁荣进而影响了针锋相对的种群

696
00:33:48,936 --> 00:33:52,287
几乎可以肯定这种组合不仅不会消亡

697
00:33:52,599 --> 00:33:55,099
还会以这种方式入侵相对稳定

698
00:33:55,099 --> 00:33:58,737
的种群事实上也许还有很多其他稍微

699
00:33:58,750 --> 00:34:01,375
恶意与极度圣洁策略的组合可以

700
00:34:01,386 --> 00:34:04,761
入侵种群有人也许可以从这里看到

701
00:34:04,862 --> 00:34:05,974
人类生活的对照

702
00:34:06,099 --> 00:34:09,898
阿克塞尔罗德意识到针锋相对并不是严格意义上的

703
00:34:09,923 --> 00:34:12,949
进化稳定策略于是他又创造了

704
00:34:12,961 --> 00:34:16,561
一个术语集体稳定策略由于在真正

705
00:34:16,561 --> 00:34:19,112
的进化稳定策略中可以有不止一个

706
00:34:19,125 --> 00:34:22,811
策略同时达成集体稳定另一方面决定一个

707
00:34:22,824 --> 00:34:25,887
策略是否可以控制种群更取决于其

708
00:34:25,898 --> 00:34:28,849
运气因此永远背叛的策略也可以

709
00:34:28,862 --> 00:34:31,836
和针锋相对一样稳定在一个被永远

710
00:34:31,849 --> 00:34:34,300
背叛控制了的种群中没有任何

711
00:34:34,311 --> 00:34:37,273
其他策略可以取胜我们也可以将

712
00:34:37,286 --> 00:34:40,074
这种系统称为双稳态而将永远

713
00:34:40,086 --> 00:34:43,612
背叛作为其中一个稳定点针锋相对或者

714
00:34:43,625 --> 00:34:46,186
其他最善良宽容策略的组合为

715
00:34:46,211 --> 00:34:48,936
另一个稳定点无论哪一方首先在

716
00:34:48,961 --> 00:34:51,762
种群中达到数量优势都将继续

717
00:34:51,773 --> 00:34:56,324
保持稳定然而这个数量优势如何量化

718
00:34:56,887 --> 00:35:00,273
一个群体中究竟需要多少针锋相对来

719
00:35:00,273 --> 00:35:04,061
保证其战胜永远背叛这取决于银行家

720
00:35:04,086 --> 00:35:05,911
愿意在这场博弈中付出的

721
00:35:05,936 --> 00:35:08,487
具体数额我们可以将此概括为

722
00:35:08,512 --> 00:35:11,875
一个决胜点如果针锋相对可以超过这个

723
00:35:11,887 --> 00:35:15,387
决胜点自然选择便会愈加偏爱针锋相对

724
00:35:15,961 --> 00:35:19,150
另一方面如果永远背叛超出了这个决胜

725
00:35:19,150 --> 00:35:22,599
点自然选择则会更加偏爱它你

726
00:35:22,599 --> 00:35:24,650
也许还记得我们在第10章

727
00:35:24,673 --> 00:35:27,362
斤斤计较者与骗子的故事里也曾

728
00:35:27,375 --> 00:35:30,536
与这个决胜点相遇过于是获胜

729
00:35:30,536 --> 00:35:33,574
的关键显然取决于哪一方首先超过

730
00:35:33,586 --> 00:35:36,862
决胜点而且我们还需要知道有时

731
00:35:36,887 --> 00:35:39,387
主导种群还会变化从一方变成

732
00:35:39,411 --> 00:35:42,349
另一方我们假设现有的种群已经

733
00:35:42,349 --> 00:35:45,036
由永远背叛主导了少数派的

734
00:35:45,061 --> 00:35:48,275
针锋相对难以互相碰面以获得共享利益

735
00:35:48,836 --> 00:35:52,036
自然选择于是将该种群推向了永远

736
00:35:52,048 --> 00:35:55,612
背叛的极致只有该种群通过随机转换

737
00:35:55,936 --> 00:35:58,987
使主导的一方变为针锋相对它才能

738
00:35:59,012 --> 00:36:02,173
继续推进针锋相对的发展使得所有人

739
00:36:02,199 --> 00:36:04,887
都能从银行家或者自然处得到

740
00:36:04,900 --> 00:36:09,012
利益然而种群没有集体意愿也没有

741
00:36:09,036 --> 00:36:12,173
集体意识或目的它们不能控制发展走向

742
00:36:12,737 --> 00:36:15,375
主导方的转换只能发生在自然界

743
00:36:15,375 --> 00:36:18,175
间接力量的作用下这种情况如何

744
00:36:18,175 --> 00:36:21,436
发生呢一种回答是运气但这个

745
00:36:21,436 --> 00:36:24,536
单词只能显示无知它表示由一些

746
00:36:24,561 --> 00:36:27,449
尚未知道未能分辨的方式来决定

747
00:36:28,025 --> 00:36:30,862
我们可以比运气做得更好一些我们可以

748
00:36:30,875 --> 00:36:34,436
想象少数派的针锋相对个体如何通过一个

749
00:36:34,461 --> 00:36:37,711
实际方法来增加其关键数目探索

750
00:36:37,737 --> 00:36:40,737
针锋相对个体如何集合成足够的数量

751
00:36:41,099 --> 00:36:43,400
使它们都可以从银行家处得到

752
00:36:43,411 --> 00:36:47,300
回报这种想法貌似可行但实际上机会

753
00:36:47,300 --> 00:36:50,487
渺茫这些相似的个体如何在小

754
00:36:50,487 --> 00:36:53,362
范围内集合到一起在自然界中

755
00:36:53,612 --> 00:36:56,099
最明显的方式是因基因关系

756
00:36:56,300 --> 00:36:59,862
亲属而集合大多数动物喜欢同自己

757
00:36:59,862 --> 00:37:02,250
的兄弟姐妹与表亲们而不是

758
00:37:02,275 --> 00:37:04,987
种群中其他成员居住在一起这

759
00:37:05,000 --> 00:37:07,911
并不一定是出于选择而是自动跟随

760
00:37:07,936 --> 00:37:10,775
种群中的黏性这里的黏性指

761
00:37:10,775 --> 00:37:13,186
的是任何使个体持续居住于

762
00:37:13,211 --> 00:37:15,737
出生地的趋势比如在人类历史

763
00:37:15,737 --> 00:37:18,074
上大部分地区的人都只居住

764
00:37:18,074 --> 00:37:20,525
在出生地以外几英里的地方虽然

765
00:37:20,550 --> 00:37:24,449
现代社会已经不再如此因此以亲属

766
00:37:24,449 --> 00:37:27,099
关系为线索的小团体逐渐形成

767
00:37:27,661 --> 00:37:29,561
我曾经到访过爱尔兰西海岸

768
00:37:29,661 --> 00:37:31,536
一个偏远的岛令我吃惊的

769
00:37:31,536 --> 00:37:34,637
是那里几乎所有人都拥有巨大

770
00:37:34,637 --> 00:37:37,425
的耳朵其中的原因很难解释为

771
00:37:37,512 --> 00:37:39,925
大耳朵适应当地天气那里岸边的

772
00:37:39,925 --> 00:37:42,400
风特别大这只能是因为岛

773
00:37:42,400 --> 00:37:45,061
上大多数居民都是亲缘相近的亲属

774
00:37:45,637 --> 00:37:48,099
基因相近的亲属们不仅面部特征

775
00:37:48,112 --> 00:37:51,849
相似其他方面也有相近之处比如

776
00:37:52,224 --> 00:37:54,525
他们会因其基因趋势而互相

777
00:37:54,536 --> 00:37:58,786
模仿着采用或不采用针锋相对于是

778
00:37:59,137 --> 00:38:02,262
即使针锋相对在种群整体中已经稀少

779
00:38:02,650 --> 00:38:05,362
它依然可能在局部广泛使用在

780
00:38:05,375 --> 00:38:08,324
这个小圈子里针锋相对的个体可以

781
00:38:08,324 --> 00:38:11,125
互相博弈采取互相合作的方式来

782
00:38:11,137 --> 00:38:14,125
达到数目繁荣即使在总体计算里

783
00:38:14,224 --> 00:38:18,012
它们依然处于弱势地位由此最初仅

784
00:38:18,025 --> 00:38:20,949
占领小片地区的针锋相对个体将随着

785
00:38:20,974 --> 00:38:23,675
小团体的逐渐扩大逐渐向其他

786
00:38:23,675 --> 00:38:26,773
地区分散甚至包括永远背叛群体占

787
00:38:26,773 --> 00:38:29,148
主导的地区如果用区域地理的

788
00:38:29,161 --> 00:38:31,737
方式思考我举的爱尔兰岛的例子

789
00:38:31,849 --> 00:38:34,224
则有些误导因为那里的人被

790
00:38:34,237 --> 00:38:37,398
自然地理隔绝了想象另一个例子在

791
00:38:37,411 --> 00:38:39,711
迁入人口不多的人群中即使

792
00:38:39,724 --> 00:38:41,375
这片地区的人们已经有了

793
00:38:41,398 --> 00:38:44,349
广泛持续的亲缘关系所有人也只

794
00:38:44,362 --> 00:38:48,050
复制近邻而不是远邻的行为回头

795
00:38:48,050 --> 00:38:51,375
看看针锋相对是可以超越决胜点的

796
00:38:51,648 --> 00:38:53,686
它所需的只是这些个体的

797
00:38:53,699 --> 00:38:56,262
聚合这一点在自然选择里可以

798
00:38:56,273 --> 00:38:59,311
很自然地发生这个与生俱来的优点

799
00:38:59,425 --> 00:39:02,387
使得针锋相对即使在数目稀少的时候

800
00:39:02,661 --> 00:39:05,237
也可以成功跨越决胜点而获得

801
00:39:05,237 --> 00:39:09,262
成功但这个跨越只是单向的永远

802
00:39:09,273 --> 00:39:11,887
背叛作为一个真正的进化稳定策略

803
00:39:12,237 --> 00:39:14,512
并不可以使用个体聚合来跨越

804
00:39:14,536 --> 00:39:17,961
决胜点相反的是永远背叛个体

805
00:39:17,961 --> 00:39:20,648
的聚合不仅不能彼此互助而获得

806
00:39:20,675 --> 00:39:23,061
群体繁荣还会使各自的生存

807
00:39:23,061 --> 00:39:27,112
环境更加恶劣它们无法暗自帮助对方

808
00:39:27,211 --> 00:39:29,925
获得银行家的奖赏而只能把对方

809
00:39:29,949 --> 00:39:34,137
也拖下水于是与针锋相对相反永远

810
00:39:34,148 --> 00:39:36,836
背叛在亲属或种群聚合中得不到

811
00:39:36,862 --> 00:39:41,324
任何帮助所以即使针锋相对并非真正的

812
00:39:41,349 --> 00:39:43,811
进化稳定策略它却拥有更高

813
00:39:43,811 --> 00:39:47,074
的稳定性这意味着什么如果我们用

814
00:39:47,099 --> 00:39:49,675
长远的目光来看永远背叛可以在

815
00:39:49,699 --> 00:39:51,786
相当长的一段时间内抵制其他

816
00:39:51,800 --> 00:39:53,750
策略的影响但如果我们等上

817
00:39:53,773 --> 00:39:56,175
很长一段时间也许是几千年后

818
00:39:56,500 --> 00:39:59,211
针锋相对将最终聚集到足够的数目

819
00:39:59,324 --> 00:40:02,887
跨越决胜点其数量终将反弹而

820
00:40:02,911 --> 00:40:05,849
反方向的发展并不可能永远背叛

821
00:40:05,875 --> 00:40:08,762
无法在个体聚集中获得好处因此

822
00:40:08,887 --> 00:40:10,849
也无法得到这种更高的稳定性

823
00:40:11,099 --> 00:40:14,061
如我们之前所见针锋相对是一个

824
00:40:14,086 --> 00:40:16,849
善良的策略这表示它永远不会

825
00:40:16,875 --> 00:40:19,737
首先背叛它又是一个宽容的策略

826
00:40:20,050 --> 00:40:22,737
表示它对过往的恩怨只有短期

827
00:40:22,750 --> 00:40:26,961
记忆阿克塞尔罗德对针锋相对还有另一个令人回味

828
00:40:26,961 --> 00:40:30,125
的定义不嫉妒在阿克塞尔罗德的定义

829
00:40:30,125 --> 00:40:32,648
中嫉妒是希望获得比对手更多

830
00:40:32,648 --> 00:40:35,875
的金钱而不是追求从银行家手中

831
00:40:35,875 --> 00:40:38,625
得到绝对数量较大的收获不嫉妒

832
00:40:38,637 --> 00:40:40,586
表示当对手获得与你一样的

833
00:40:40,599 --> 00:40:43,099
金钱时只要大家都能从银行家

834
00:40:43,099 --> 00:40:45,673
处获得更大收获你也同样

835
00:40:45,673 --> 00:40:49,686
高兴针锋相对从没有赢得比赛它从未

836
00:40:49,699 --> 00:40:51,898
从其对手处获得更多的利益

837
00:40:52,211 --> 00:40:55,686
因为它除了报复之外从未背叛它

838
00:40:55,686 --> 00:40:57,523
能得到的最好结果是与对手

839
00:40:57,548 --> 00:41:00,362
分享平局但它尽量争取在每

840
00:41:00,362 --> 00:41:02,199
一场对弈中都能获得尽量

841
00:41:02,211 --> 00:41:05,586
高的共享分数当我们考虑针锋相对

842
00:41:05,686 --> 00:41:08,324
与其他策略时对手一词其实

843
00:41:08,324 --> 00:41:11,599
并不准确然而令人失望的是

844
00:41:11,949 --> 00:41:14,398
当心理学家在人群中实验重复

845
00:41:14,423 --> 00:41:17,186
囚徒困境的博弈时几乎所有选手

846
00:41:17,211 --> 00:41:19,173
都会嫉妒于是获得的金钱也

847
00:41:19,186 --> 00:41:21,775
并不多这表示许多人在

848
00:41:21,786 --> 00:41:24,686
潜意识中更倾向于击败对手而

849
00:41:24,686 --> 00:41:28,686
不是与他人一同合作击败银行家阿克塞尔罗德

850
00:41:28,686 --> 00:41:31,099
的实验表明这是一个多么严重的

851
00:41:31,112 --> 00:41:33,750
错误但在所有博弈里并不

852
00:41:33,750 --> 00:41:37,048
都是错误博弈理论家将博弈分为零

853
00:41:37,048 --> 00:41:40,286
和与非零和两种零和博弈指一方

854
00:41:40,286 --> 00:41:43,186
的胜出即是对方的损失棋类

855
00:41:43,199 --> 00:41:46,298
游戏便是一种零和博弈因为博弈双方

856
00:41:46,298 --> 00:41:49,275
的目标是胜过对方使对方产生

857
00:41:49,286 --> 00:41:52,836
损失囚徒困境则是一种非零和博弈

858
00:41:53,099 --> 00:41:56,512
在这里银行家支付了金钱博弈双方

859
00:41:56,536 --> 00:41:59,349
可以携手合作一起笑到最后这

860
00:41:59,349 --> 00:42:01,211
让我想起了莎士比亚写过的

861
00:42:01,324 --> 00:42:03,574
一句精彩的台词我们要做

862
00:42:03,574 --> 00:42:05,661
的第一件事就是把所有律师

863
00:42:05,686 --> 00:42:08,811
都先杀了亨利六世在所谓民事

864
00:42:08,824 --> 00:42:11,525
争议中事实上经常有很大空间

865
00:42:11,548 --> 00:42:14,423
可以合作一个看似零和博弈的争议

866
00:42:14,536 --> 00:42:17,061
也许只要加入少许善意便可以转化

867
00:42:17,061 --> 00:42:20,800
为双方互利的非零和博弈下面拿

868
00:42:20,800 --> 00:42:23,711
离婚作为例子一段好的婚姻明显

869
00:42:23,724 --> 00:42:26,375
是一个非零和博弈充满了互助合作

870
00:42:26,375 --> 00:42:29,699
的空间即使它瓦解夫妻依然可以

871
00:42:29,724 --> 00:42:32,786
继续合作以非零和博弈来看待离婚

872
00:42:33,025 --> 00:42:35,811
并从中得到好处如果孩子抚养权

873
00:42:35,811 --> 00:42:38,199
的判决问题并不是一个足够劝服

874
00:42:38,199 --> 00:42:40,612
夫妻合作的理由双方律师的高昂

875
00:42:40,612 --> 00:42:43,012
费用也许更有说服力因为它将

876
00:42:43,012 --> 00:42:46,849
给家庭财政造成巨大创伤那么如果

877
00:42:46,862 --> 00:42:49,625
一对理性文明的夫妻从一开始便一起

878
00:42:49,637 --> 00:42:52,086
雇用同一个律师这是不是更合理

879
00:42:52,086 --> 00:42:54,961
呢答案却是否定的至少在

880
00:42:54,974 --> 00:42:58,199
英格兰还有今天美国几乎50个州中

881
00:42:58,411 --> 00:43:01,400
法律或者更严格地说律师本身

882
00:43:01,400 --> 00:43:03,362
的职业规范并不允许他们这么

883
00:43:03,362 --> 00:43:06,311
做律师只能接受夫妻双方中的

884
00:43:06,411 --> 00:43:08,925
一位作为客户而拒绝另一方

885
00:43:09,161 --> 00:43:11,949
迫使对方去寻找另一个律师或者完全

886
00:43:11,961 --> 00:43:15,000
失去法律服务这便是乐趣的开始

887
00:43:15,574 --> 00:43:18,286
在另一个房间里律师们开始谈

888
00:43:18,387 --> 00:43:20,862
我们和他们这里的我们指的

889
00:43:20,875 --> 00:43:23,250
不是我和我的妻子而是我

890
00:43:23,250 --> 00:43:24,686
和我的律师对抗她与她

891
00:43:24,686 --> 00:43:27,400
的律师法庭上陈述的则是

892
00:43:27,425 --> 00:43:30,849
史密斯诉史密斯英国妻子多用夫姓

893
00:43:31,237 --> 00:43:34,311
无论夫妻双方是否感觉抗拒对方或者

894
00:43:34,324 --> 00:43:37,400
他们是否愿意和睦解决问题法庭已经

895
00:43:37,411 --> 00:43:40,762
假设他们之间存在对抗关系谁能

896
00:43:40,762 --> 00:43:41,925
在这场我赢你便输

897
00:43:41,949 --> 00:43:45,300
的游戏里胜出呢只有律师倒霉

898
00:43:45,300 --> 00:43:46,724
的夫妻被拖进了这么一

899
00:43:46,724 --> 00:43:49,025
场零和博弈中律师们则

900
00:43:49,036 --> 00:43:51,786
可以享有油水肥厚的非零和博弈因为

901
00:43:51,811 --> 00:43:54,262
史密斯夫妇提供了回报而律师们

902
00:43:54,286 --> 00:43:56,836
专业剥削顾客的方式已经通过行业

903
00:43:56,849 --> 00:43:59,675
合作精细地被规范了他们合作

904
00:43:59,675 --> 00:44:02,275
的一种方式是提出知道对方完全

905
00:44:02,286 --> 00:44:04,775
不会接受的提议这可以激发对方

906
00:44:04,875 --> 00:44:06,987
提出另一个明知双方都不会接受的

907
00:44:07,000 --> 00:44:10,961
提议循环往复这些事实合作的对手所

908
00:44:10,961 --> 00:44:12,775
发的每一封律师函每

909
00:44:12,775 --> 00:44:14,949
一个电话都在账单上多加一笔

910
00:44:14,961 --> 00:44:18,750
数目运气不好的话这个过程将持续

911
00:44:18,775 --> 00:44:21,925
几个月甚至几年双方的花费越来越多

912
00:44:22,474 --> 00:44:24,137
律师们并不需要坐在一起

913
00:44:24,161 --> 00:44:27,536
计算这些事情相反他们严格的独立性

914
00:44:27,637 --> 00:44:29,824
正是他们合作的主要方式以此

915
00:44:29,836 --> 00:44:32,762
消耗着顾客的腰包律师们甚至

916
00:44:32,773 --> 00:44:34,561
都没有感觉到他们所做的

917
00:44:34,574 --> 00:44:37,675
一切正是一个非零和博弈就像我们

918
00:44:37,686 --> 00:44:40,099
有时见到的吸血蝙蝠一样他们以

919
00:44:40,112 --> 00:44:42,300
一种精心设计的仪式进行着这

920
00:44:42,300 --> 00:44:45,449
场游戏这个系统无须任何有意识的

921
00:44:45,461 --> 00:44:49,449
计划或者组织已然自成一体它逼迫我们

922
00:44:49,561 --> 00:44:51,849
走进一场零和博弈顾客们

923
00:44:51,875 --> 00:44:54,125
得到了零律师们得到了丰厚

924
00:44:54,125 --> 00:44:56,148
的非零我们该怎么做呢

925
00:44:56,711 --> 00:44:59,786
莎士比亚的方法太过残酷单单改变

926
00:44:59,800 --> 00:45:02,875
法律就简单多了但大多数国会

927
00:45:02,875 --> 00:45:05,699
议员有法律背景只有零和博弈

928
00:45:05,724 --> 00:45:09,711
心理很难想象哪里存在比英国下议院更

929
00:45:09,711 --> 00:45:12,237
具对抗性的氛围了法庭至少还

930
00:45:12,237 --> 00:45:14,711
保持了辩论的斯文因为律师们

931
00:45:14,711 --> 00:45:16,375
可以抱着我博学的朋友将

932
00:45:16,387 --> 00:45:18,012
和我合作而笑到最后的

933
00:45:18,023 --> 00:45:20,836
心理也许那些用心良苦的立法者和

934
00:45:20,849 --> 00:45:23,411
良心发现的律师需要学一点博弈论

935
00:45:23,974 --> 00:45:26,300
只要律师以完全相反的方式工作

936
00:45:26,586 --> 00:45:28,711
劝说顾客们放弃零和博弈的

937
00:45:28,724 --> 00:45:31,237
厮杀就可以从庭外和解的

938
00:45:31,262 --> 00:45:34,762
非零和博弈中得到更多好处那么人类

939
00:45:34,762 --> 00:45:37,250
生活中的其他博弈呢哪些是

940
00:45:37,262 --> 00:45:41,061
零和哪些又是非零和它们并不相同

941
00:45:41,625 --> 00:45:43,849
我们应该在生活的哪些方面追求

942
00:45:43,875 --> 00:45:46,398
零和博弈又在哪些方面追求

943
00:45:46,398 --> 00:45:49,625
非零和博弈呢生活中哪些方面值得

944
00:45:49,637 --> 00:45:52,773
嫉妒哪些又值得合作并打败银行家

945
00:45:52,773 --> 00:45:55,487
呢举个例子当我们和老板

946
00:45:55,512 --> 00:45:58,061
对工资讨价还价时我们是被嫉妒

947
00:45:58,074 --> 00:46:00,862
驱使还是通过合作让我们的真实

948
00:46:00,875 --> 00:46:03,523
收入最大化呢在现实生活中

949
00:46:04,023 --> 00:46:06,000
我们是否把非零和博弈误会为零

950
00:46:06,000 --> 00:46:08,349
和博弈正如我们在那个心理实验

951
00:46:08,349 --> 00:46:11,161
中一样呢我只能简单提出这些

952
00:46:11,186 --> 00:46:13,648
复杂的问题因为他们的答案已经

953
00:46:13,648 --> 00:46:15,250
超出本书涵盖的范围了

954
00:46:16,099 --> 00:46:18,936
足球就是一场零和博弈至少

955
00:46:18,961 --> 00:46:21,862
它一般是这样少数情况下它

956
00:46:21,862 --> 00:46:24,525
能变成一个非零和博弈英式橄榄球

957
00:46:24,824 --> 00:46:28,737
澳大利亚橄榄球美式橄榄球爱尔兰橄榄球则

958
00:46:28,750 --> 00:46:31,449
一直是非零和博弈这在1977年

959
00:46:31,449 --> 00:46:34,273
的英格兰足球联赛中发生过联赛

960
00:46:34,273 --> 00:46:37,324
中的队伍被分为四级俱乐部在

961
00:46:37,324 --> 00:46:40,036
比赛中互相对抗以积分决定它们

962
00:46:40,036 --> 00:46:43,550
的晋级或降级甲级联赛声名远扬

963
00:46:43,961 --> 00:46:46,925
俱乐部可以趁机从巨大观众群中捞

964
00:46:46,925 --> 00:46:50,298
得丰厚利润在赛季结束时甲级

965
00:46:50,298 --> 00:46:53,061
中排名最后的3个俱乐部降级进入

966
00:46:53,086 --> 00:46:55,686
下一赛季的乙级联赛降级

967
00:46:55,711 --> 00:46:58,273
是一个惨痛的命运值得不惜一切

968
00:46:58,286 --> 00:47:02,186
去避免1977年5月8日是本赛季的最后

969
00:47:02,199 --> 00:47:05,161
一天甲级联赛中3个保级名额中

970
00:47:05,161 --> 00:47:07,724
的2个已经被确定第三个正等待

971
00:47:07,737 --> 00:47:11,798
揭晓它将从桑德兰队布里斯托队与考文垂队

972
00:47:11,798 --> 00:47:14,387
中诞生如果桑德兰队输了这场

973
00:47:14,387 --> 00:47:18,262
比赛布里斯托与考文垂只要打成平手便可以

974
00:47:18,286 --> 00:47:21,036
共同留在甲级联赛但如果桑德兰

975
00:47:21,048 --> 00:47:23,525
赢了布里斯托与考文垂比赛中的

976
00:47:23,536 --> 00:47:26,474
输家就会被降级这两场关键

977
00:47:26,487 --> 00:47:30,000
比赛理论上是同时进行的但事实上

978
00:47:30,375 --> 00:47:32,887
布里斯托对考文垂的比赛刚好推迟了

979
00:47:32,911 --> 00:47:36,750
5分钟开始这种情况下桑德兰队的结果

980
00:47:36,862 --> 00:47:39,324
在布里斯托对考文垂的比赛结束前

981
00:47:39,423 --> 00:47:41,536
便为两队所知晓了这

982
00:47:41,536 --> 00:47:42,987
便埋下了这个复杂故事的

983
00:47:43,000 --> 00:47:46,237
伏笔布里斯托与考文垂间的大部分比赛

984
00:47:46,250 --> 00:47:48,887
时间用当时一份新闻报道来说

985
00:47:49,125 --> 00:47:52,911
是迅猛激烈的激动人心赛前双方

986
00:47:52,936 --> 00:47:55,137
各自定下的2个进球的目标在

987
00:47:55,150 --> 00:47:58,574
比赛80分钟时已经达到比赛结束前

988
00:47:58,586 --> 00:48:01,625
2分钟时桑德兰输了的消息迅速

989
00:48:01,637 --> 00:48:04,673
传了过来考文垂的经理迅速让

990
00:48:04,673 --> 00:48:06,811
场边的巨大电子信息屏放出

991
00:48:06,811 --> 00:48:09,849
了这条消息所有22名队员显然

992
00:48:09,862 --> 00:48:12,750
都看到并且意识到无须多事了一个

993
00:48:12,762 --> 00:48:15,286
平局足以让双方都能逃避保级

994
00:48:15,286 --> 00:48:17,900
的命运而如果试图进球会使

995
00:48:17,911 --> 00:48:20,875
情况更糟这意味着把球员从

996
00:48:20,887 --> 00:48:23,949
防守转向进攻将承担战败而降级

997
00:48:23,949 --> 00:48:26,661
的风险我们还是引用那份新闻

998
00:48:26,661 --> 00:48:30,961
报道吧在唐吉利斯DonGillies80分钟

999
00:48:30,961 --> 00:48:33,500
时的进球帮助球队和布里斯托战

1000
00:48:33,500 --> 00:48:36,186
成平手时双方的支持者1秒钟

1001
00:48:36,186 --> 00:48:38,961
前还是分外眼红的仇人1秒钟

1002
00:48:38,961 --> 00:48:41,099
后却迅速加入一场共同的

1003
00:48:41,125 --> 00:48:45,512
狂欢庆祝中裁判查利斯RonChallis无奈

1004
00:48:45,512 --> 00:48:47,250
地看着球员们把球传来

1005
00:48:47,250 --> 00:48:50,061
传去于对手完全没有任何威胁

1006
00:48:50,637 --> 00:48:52,574
之前的零和博弈在外界新闻

1007
00:48:52,574 --> 00:48:55,025
的影响下迅速变成一场非零和

1008
00:48:55,036 --> 00:48:57,775
博弈在我们早先的讨论情况下

1009
00:48:58,061 --> 00:49:00,237
就好比外部的银行家奇迹般地

1010
00:49:00,250 --> 00:49:03,711
出现了使得布里斯托和考文垂从平局

1011
00:49:03,724 --> 00:49:06,862
结果中得到好处类似足球这种观赏

1012
00:49:06,875 --> 00:49:10,186
运动通常是零和博弈理由是观看

1013
00:49:10,199 --> 00:49:12,836
双方的剧烈对抗比友好比赛更为

1014
00:49:12,849 --> 00:49:16,974
激动人心但现实生活无论是人类生活

1015
00:49:17,086 --> 00:49:19,711
或者是植物动物的生活中并非

1016
00:49:19,711 --> 00:49:23,324
为观众所设计事实上现实生活中

1017
00:49:23,324 --> 00:49:26,737
的大部分情况都是非零和博弈社会扮演

1018
00:49:26,737 --> 00:49:29,237
了银行家的角色个人则可以从

1019
00:49:29,262 --> 00:49:32,036
对方的成功中获益我们可以看到

1020
00:49:32,275 --> 00:49:34,250
在自私的基因的基本原理的指导

1021
00:49:34,250 --> 00:49:36,686
下即使在自私的人类世界里

1022
00:49:37,000 --> 00:49:40,911
合作与互助同样促使社会兴旺发展我们

1023
00:49:40,911 --> 00:49:43,512
现在可以从阿克塞尔罗德的定义出发去

1024
00:49:43,512 --> 00:49:46,400
理解好人确实有好报但这

1025
00:49:46,411 --> 00:49:49,050
只能在博弈重复进行下才能发生

1026
00:49:49,612 --> 00:49:52,161
博弈者必须清楚这并不是他们之间

1027
00:49:52,186 --> 00:49:55,262
最后一场博弈用阿克塞尔罗德艰涩的

1028
00:49:55,275 --> 00:49:58,061
用语来说未来的阴影还很长

1029
00:49:58,612 --> 00:50:00,586
但这需要有多长它不

1030
00:50:00,586 --> 00:50:03,862
可以无限长理论上说博弈的长度

1031
00:50:03,887 --> 00:50:06,525
并不重要重要的是博弈双方

1032
00:50:06,550 --> 00:50:08,724
必须都不清楚博弈结束的时间

1033
00:50:09,300 --> 00:50:11,436
假设你我正在进行一场博弈

1034
00:50:11,862 --> 00:50:14,974
我们都知道博弈的重复次数为100回合

1035
00:50:15,400 --> 00:50:18,487
那么我们彼此清楚第100回合将

1036
00:50:18,500 --> 00:50:20,750
等同于一场简单的一次性囚徒

1037
00:50:20,762 --> 00:50:24,186
困境这种情况下最理性的决策

1038
00:50:24,275 --> 00:50:26,436
是我们双方各自在最后一轮

1039
00:50:26,525 --> 00:50:29,800
打出背叛自然我们也彼此能

1040
00:50:29,811 --> 00:50:32,148
预测对方也会背叛这使得最后

1041
00:50:32,161 --> 00:50:34,574
一轮的结果毫无悬念既已

1042
00:50:34,586 --> 00:50:38,137
如此第99轮则相当于一次性博弈

1043
00:50:38,500 --> 00:50:41,324
而双方能做出的唯一理性决策

1044
00:50:41,436 --> 00:50:44,811
则是背叛第98轮同理在

1045
00:50:44,824 --> 00:50:47,574
两个完全理性并假设对方同样理性

1046
00:50:47,574 --> 00:50:49,773
的博弈者处如果他们知道比赛

1047
00:50:49,773 --> 00:50:52,175
的回合数他们只能彼此不停背叛

1048
00:50:52,750 --> 00:50:55,574
于是当博弈理论家谈论重复囚徒困境

1049
00:50:55,599 --> 00:50:58,887
时他们经常假设博弈的终点不可知

1050
00:50:59,099 --> 00:51:02,099
或者只有银行家知道即使博弈的重复

1051
00:51:02,112 --> 00:51:05,599
次数不得而知在现实生活中我们经常

1052
00:51:05,612 --> 00:51:07,949
可以采用统计方法来预测博弈的

1053
00:51:07,974 --> 00:51:10,949
持续时间长度这种预测则成了

1054
00:51:10,974 --> 00:51:13,949
博弈策略中很重要的一部分如果

1055
00:51:13,949 --> 00:51:16,762
我注意到银行家开始坐立不安不停地

1056
00:51:16,786 --> 00:51:18,711
看他的手表我可以猜到此

1057
00:51:18,711 --> 00:51:21,449
游戏即将结束那么我便可以尝试

1058
00:51:21,461 --> 00:51:23,987
背叛如果我发现你也注意到

1059
00:51:24,012 --> 00:51:26,648
银行家的坐立不安我也会开始担心

1060
00:51:26,750 --> 00:51:29,000
你背叛的可能性我也许会过于

1061
00:51:29,012 --> 00:51:32,050
紧张而提前让自己先背叛即使

1062
00:51:32,061 --> 00:51:34,273
我开始担心你也许会担心我

1063
00:51:34,523 --> 00:51:37,300
在一次性与重复囚徒困境博弈中

1064
00:51:37,675 --> 00:51:40,349
数学家简单的直觉也许太过于简单

1065
00:51:40,925 --> 00:51:43,523
每一个选手都可以持续预测博弈

1066
00:51:43,536 --> 00:51:45,974
进行的长度他的估计越长

1067
00:51:46,311 --> 00:51:48,237
他的选择就会越接近数学家

1068
00:51:48,349 --> 00:51:50,887
在重复博弈中的预测更善良

1069
00:51:51,161 --> 00:51:54,675
更宽容更不嫉妒反之他的

1070
00:51:54,686 --> 00:51:56,961
选择就会更接近数学家在一次性

1071
00:51:56,987 --> 00:51:59,362
博弈中的预测更恶劣更不

1072
00:51:59,362 --> 00:51:59,773
宽容

1073
00:52:00,099 --> 00:52:02,436
阿克塞尔罗德对未来的阴影的重要性的

1074
00:52:02,449 --> 00:52:05,461
阐述来自第一次世界大战时形成的自己

1075
00:52:05,461 --> 00:52:08,086
活也让别人活的现象他

1076
00:52:08,086 --> 00:52:11,000
的研究资源来自历史学家与社会学家

1077
00:52:11,112 --> 00:52:15,061
托尼阿什沃思TonyAshworth一战时的

1078
00:52:15,074 --> 00:52:17,800
圣诞节英军与德军有时会

1079
00:52:17,824 --> 00:52:21,612
友好相处在无人区一起喝酒这种现象

1080
00:52:21,711 --> 00:52:25,148
早已为世人所知但事实上更为

1081
00:52:25,161 --> 00:52:28,500
有趣的是这种非正式非官方甚至没有

1082
00:52:28,523 --> 00:52:31,262
口头协定的友好协议这种自己活

1083
00:52:31,436 --> 00:52:33,161
也让别人活的系统早在

1084
00:52:33,186 --> 00:52:36,336
1914年便在前线上下流行持续

1085
00:52:36,336 --> 00:52:39,586
了至少2年一个英国高级将领在

1086
00:52:39,599 --> 00:52:42,224
巡视战壕时曾提及他看到德国

1087
00:52:42,237 --> 00:52:44,661
士兵在英军前线来复枪

1088
00:52:44,673 --> 00:52:46,737
射程内散步时的惊讶我们的

1089
00:52:46,750 --> 00:52:50,048
士兵好像并没有注意我私下决定

1090
00:52:50,161 --> 00:52:52,612
当我们接手它时应该阻止这种

1091
00:52:52,612 --> 00:52:55,012
事情的发生决不能允许这种事情

1092
00:52:55,023 --> 00:52:58,000
出现这些人似乎并不知道这是

1093
00:52:58,012 --> 00:53:00,773
一场战争显然双方都相信自己

1094
00:53:00,773 --> 00:53:03,661
活也让别人活的想法博弈

1095
00:53:03,661 --> 00:53:05,586
论与囚徒困境在当时还未

1096
00:53:05,586 --> 00:53:08,586
出现但如今在事后我们可以清楚

1097
00:53:08,586 --> 00:53:11,811
地理解当时的情况阿克塞尔罗德提供了

1098
00:53:11,824 --> 00:53:14,411
一个精彩的分析在当时的壕堑

1099
00:53:14,411 --> 00:53:16,411
战中每个野战排的未来的

1100
00:53:16,423 --> 00:53:19,586
阴影都很长这便表示每

1101
00:53:19,586 --> 00:53:21,449
支英军的挖掘队伍都可能

1102
00:53:21,461 --> 00:53:23,012
需要与同一支德军队伍

1103
00:53:23,125 --> 00:53:26,936
对峙好几个月另外普通士兵永远不知道

1104
00:53:26,961 --> 00:53:29,724
他们是否或何时会离开因为大家

1105
00:53:29,724 --> 00:53:33,324
都知道军队的决策专断随意变化无常

1106
00:53:33,887 --> 00:53:35,911
在这里未来的阴影长而不定

1107
00:53:36,224 --> 00:53:39,375
促使了针锋相对式合作的开始这种

1108
00:53:39,387 --> 00:53:41,673
情况已经类似于一场囚徒困境

1109
00:53:41,673 --> 00:53:44,375
的博弈了我们还记得要成为

1110
00:53:44,387 --> 00:53:47,150
一场真正的囚徒困境回报必须

1111
00:53:47,150 --> 00:53:50,237
有特定的次序规则双方必须同时

1112
00:53:50,250 --> 00:53:54,048
认为共同合作优于互相背叛在对方

1113
00:53:54,061 --> 00:53:56,673
合作时背叛则为更佳在

1114
00:53:56,686 --> 00:53:59,737
对方背叛时合作为最劣彼此

1115
00:53:59,750 --> 00:54:01,686
背叛则是将军们所喜的

1116
00:54:02,036 --> 00:54:04,262
他们想看到他们的士兵在机会

1117
00:54:04,262 --> 00:54:07,048
到来之时将对方捏得粉身碎骨

1118
00:54:07,625 --> 00:54:09,586
将军们并不愿意看到互助合作

1119
00:54:09,586 --> 00:54:12,625
的场面这对于赢得战争毫无帮助

1120
00:54:13,199 --> 00:54:15,324
但这对于双方的普通士兵而言

1121
00:54:15,425 --> 00:54:17,887
却是求之不得的好事他们并不

1122
00:54:17,887 --> 00:54:21,275
愿意付出生命的代价必须承认他们

1123
00:54:21,375 --> 00:54:24,311
也许认可将军的观点希望己方能

1124
00:54:24,324 --> 00:54:26,974
获得胜利这便是形成囚徒困境的

1125
00:54:27,000 --> 00:54:30,150
第二层回报但获得战争胜利并不是每个

1126
00:54:30,175 --> 00:54:33,150
普通士兵的选择战争的最终结果

1127
00:54:33,262 --> 00:54:35,211
并不太可能从物质上极大

1128
00:54:35,211 --> 00:54:37,536
地惠于个人虽然无论是出自

1129
00:54:37,561 --> 00:54:41,387
爱国主义抑或是遵守纪律你可能觉得

1130
00:54:41,512 --> 00:54:44,099
从背叛循环中逃出去也是不错

1131
00:54:44,099 --> 00:54:46,099
的但与你穿越无人区后

1132
00:54:46,099 --> 00:54:48,625
的某些敌军士兵互助合作则很

1133
00:54:48,625 --> 00:54:51,125
可能影响你本人的命运而且这

1134
00:54:51,125 --> 00:54:53,786
大大优于互相背叛这便使整个

1135
00:54:53,800 --> 00:54:57,324
情况形成一个真正的囚徒困境类似

1136
00:54:57,349 --> 00:55:00,625
针锋相对的行为注定要发生也确实

1137
00:55:00,637 --> 00:55:03,175
发生了在任何战壕前线上的

1138
00:55:03,199 --> 00:55:06,500
局部稳定策略并不一定是针锋相对后者

1139
00:55:06,500 --> 00:55:09,000
是属于善良虽报复但宽容的

1140
00:55:09,025 --> 00:55:11,675
策略家族中的一员这些策略

1141
00:55:11,775 --> 00:55:14,125
即使在理论上也并不完全稳定

1142
00:55:14,500 --> 00:55:17,686
至少很难在兴起时被改变比如

1143
00:55:18,086 --> 00:55:21,112
根据一份当时的记录三次针锋相对

1144
00:55:21,211 --> 00:55:24,199
在一个区域同时形成我们走出深夜的

1145
00:55:24,211 --> 00:55:26,775
战壕德国人也走了出来所以

1146
00:55:26,800 --> 00:55:29,750
出于礼貌我们不该开枪最恶劣的

1147
00:55:29,750 --> 00:55:32,661
事情是枪榴弹它们如果落入战壕就

1148
00:55:32,661 --> 00:55:35,561
会杀死大概9~10个人但除非德国

1149
00:55:35,561 --> 00:55:37,750
人特别吵否则我们不应该使用

1150
00:55:37,750 --> 00:55:40,800
这些武器因为他们也可以采取报复

1151
00:55:41,186 --> 00:55:44,074
我们也许没有一个人可以回去针锋相对

1152
00:55:44,086 --> 00:55:46,224
家族中这些策略有一个很重要

1153
00:55:46,224 --> 00:55:49,286
的共同点背叛的选手将得到惩罚

1154
00:55:49,862 --> 00:55:53,050
复仇的威胁必须始终在此在自己

1155
00:55:53,050 --> 00:55:55,737
活也让别人活系统中报复

1156
00:55:55,750 --> 00:55:59,561
能力的展示通常引人注目双方不断攻击

1157
00:55:59,561 --> 00:56:02,525
敌军不远处的虚拟目标一种如今

1158
00:56:02,625 --> 00:56:04,474
也在西方电影中使用的技巧

1159
00:56:04,737 --> 00:56:07,199
比如射灭蜡烛火焰而不是敌军

1160
00:56:07,211 --> 00:56:10,199
本身以展示其百发百中极具威胁

1161
00:56:10,199 --> 00:56:13,375
的攻击在另一个问题上为什么美国

1162
00:56:13,387 --> 00:56:15,925
罔顾顶尖物理学家们的愿望使用

1163
00:56:15,925 --> 00:56:19,061
了两颗原子弹来毁灭两座城市而

1164
00:56:19,061 --> 00:56:21,336
不是用类似攻击蜡烛的策略这

1165
00:56:21,336 --> 00:56:23,936
一机制也能圆满地回答与

1166
00:56:23,961 --> 00:56:26,550
针锋相对类似的策略都有一个重要

1167
00:56:26,550 --> 00:56:29,824
的特征它们都很宽容这有助于

1168
00:56:29,836 --> 00:56:33,500
减少长期报复恶性循环的产生这位

1169
00:56:33,523 --> 00:56:36,500
英国军官再次戏剧化地描述这种平息报复

1170
00:56:36,500 --> 00:56:38,500
的重要性当我正在与某连

1171
00:56:38,500 --> 00:56:40,862
的人喝茶时我们听到许多喊叫

1172
00:56:40,862 --> 00:56:43,724
声于是出来查看我们看见我们的

1173
00:56:43,724 --> 00:56:45,898
人与德国人各自站在战壕

1174
00:56:45,898 --> 00:56:48,461
前的矮墙上突然炮声骤响

1175
00:56:48,737 --> 00:56:51,625
却无人受伤双方很自然地卧倒

1176
00:56:52,012 --> 00:56:55,237
我们的人开始咒骂德国人这时

1177
00:56:55,336 --> 00:56:57,036
一个勇敢的德国人站起身来

1178
00:56:57,050 --> 00:56:59,786
大喊我们很抱歉我们希望没有

1179
00:56:59,786 --> 00:57:03,211
人受伤我们不是故意的都是那个该死

1180
00:57:03,211 --> 00:57:06,512
的普鲁士大炮阿克塞尔罗德对这个道歉的

1181
00:57:06,523 --> 00:57:09,125
评价是仅将责任推卸给机械

1182
00:57:09,436 --> 00:57:12,012
有效阻止了报复它表达了道德

1183
00:57:12,012 --> 00:57:14,849
上对于辜负信任的歉意也表达

1184
00:57:14,849 --> 00:57:17,648
了对有人可能受伤的关切这

1185
00:57:17,648 --> 00:57:20,211
确实是一个令人钦佩的勇敢的德国

1186
00:57:20,211 --> 00:57:23,762
人阿克塞尔罗德还也强调在保持互相

1187
00:57:23,762 --> 00:57:26,586
信任的稳定状况时预见性与仪式

1188
00:57:26,586 --> 00:57:29,349
感十分重要一个愉快的例子是

1189
00:57:29,724 --> 00:57:32,925
一个德国士兵提到英国大炮每天晚上

1190
00:57:32,949 --> 00:57:35,161
会根据钟点有规律地在前线

1191
00:57:35,175 --> 00:57:38,050
一些地方开火七点钟到了英国人

1192
00:57:38,074 --> 00:57:41,199
开炮了他们十分准时你都可以

1193
00:57:41,224 --> 00:57:43,898
据此来校正手表他们永远有着相同

1194
00:57:43,898 --> 00:57:46,987
的目标非常准确从未在前后左右

1195
00:57:47,012 --> 00:57:49,675
偏移过标志甚至有一些好奇的同伴

1196
00:57:49,875 --> 00:57:52,050
会在七点前一点爬出去看

1197
00:57:52,061 --> 00:57:54,550
英国人开炮根据英军的记录

1198
00:57:54,925 --> 00:57:56,936
德国大炮也在做同样的事情

1199
00:57:57,224 --> 00:58:00,074
德国人选择的目标射击的时间

1200
00:58:00,099 --> 00:58:03,512
与回合都十分规律琼斯上校知道

1201
00:58:03,536 --> 00:58:05,661
每一炮发出的时间他的

1202
00:58:05,675 --> 00:58:09,012
计算十分准确他甚至敢于做一些

1203
00:58:09,036 --> 00:58:11,648
初生牛犊式的行为冒险去到炮击

1204
00:58:11,648 --> 00:58:14,474
的地点因为他知道炮击将在

1205
00:58:14,474 --> 00:58:15,536
他到达前停止

1206
00:58:16,099 --> 00:58:19,262
阿克塞尔罗德对此的评注是这种仪式

1207
00:58:19,262 --> 00:58:21,737
性的炮击与规律性的开火表达

1208
00:58:21,737 --> 00:58:25,112
了双重信息于上级军官它们表达

1209
00:58:25,112 --> 00:58:27,911
了抗争而对于敌军它们传递了

1210
00:58:27,925 --> 00:58:30,786
和平这种自己活也让别人活

1211
00:58:30,800 --> 00:58:33,262
的系统本可以通过口头沟通获得

1212
00:58:33,599 --> 00:58:35,686
由理性的策略家在圆桌上

1213
00:58:35,711 --> 00:58:39,686
讨价还价得到事实上它无法这么做它

1214
00:58:39,699 --> 00:58:41,862
通过人们回应对方行为的方式传递

1215
00:58:42,224 --> 00:58:45,711
在一系列的局部约定中形成阿克塞尔罗德

1216
00:58:45,737 --> 00:58:48,936
计算机中的策略完全没有意识它们

1217
00:58:48,936 --> 00:58:52,461
的善意或恶意宽容或记仇嫉妒

1218
00:58:52,487 --> 00:58:56,061
或大气仅由其行为定义程序员

1219
00:58:56,086 --> 00:58:58,262
也许有其他的想法但这并

1220
00:58:58,262 --> 00:59:01,637
不相关一个策略是否善良仅通过

1221
00:59:01,661 --> 00:59:04,625
行为确认而并非通过其动机因为

1222
00:59:04,637 --> 00:59:07,349
它没有或作者的性格当程序

1223
00:59:07,362 --> 00:59:10,161
运行时这已经成为历史了一个

1224
00:59:10,186 --> 00:59:12,898
计算机程序可以以其策略方式来施

1225
00:59:12,898 --> 00:59:15,887
为它并不需要知道自己的策略如何

1226
00:59:16,099 --> 00:59:19,461
或者任何其他事情我们当然知道策略

1227
00:59:19,461 --> 00:59:22,311
家是否有意识并不相关这本

1228
00:59:22,311 --> 00:59:24,474
书已经提到许多无意识的策略家

1229
00:59:25,036 --> 00:59:27,411
阿克塞尔罗德的程序便是我们在这本

1230
00:59:27,411 --> 00:59:30,224
书里用以思考动植物甚至基因的

1231
00:59:30,250 --> 00:59:33,487
优秀模型我们现在可以问问他那些

1232
00:59:33,487 --> 00:59:35,836
关于宽容善良不嫉妒的成功例子

1233
00:59:35,936 --> 00:59:39,586
与优化结论是否可以用于自然世界答案

1234
00:59:39,586 --> 00:59:43,112
是肯定的自然界一向如此唯一条件

1235
00:59:43,125 --> 00:59:45,936
是自然优势需要设定未来的阴影

1236
00:59:45,949 --> 00:59:48,637
很长的囚徒困境而且是非零和

1237
00:59:48,650 --> 00:59:52,036
博弈这些条件在生物王国中一直

1238
00:59:52,048 --> 00:59:55,025
成立没有人会认为细菌是一个

1239
00:59:55,048 --> 00:59:58,112
有意识的策略家但寄生菌们天衣无缝

1240
00:59:58,112 --> 01:00:00,286
地与它们的寄主演绎着囚徒

1241
01:00:00,298 --> 01:00:03,923
困境我们没有理由不采用阿克塞尔罗德的理论

1242
01:00:04,311 --> 01:00:07,650
善良宽容不嫉妒等等来研究它们

1243
01:00:07,650 --> 01:00:12,286
的策略阿克塞尔罗德和汉密尔顿指出那些无害

1244
01:00:12,311 --> 01:00:14,400
且有益的细菌可以在人们受伤

1245
01:00:14,400 --> 01:00:17,949
时变成有害甚至致命的败血症医生

1246
01:00:17,961 --> 01:00:20,536
会说人体的自然抵抗能力在

1247
01:00:20,548 --> 01:00:23,250
受伤时会下降但也许真实的

1248
01:00:23,250 --> 01:00:26,512
原因正是囚徒困境的博弈在人体

1249
01:00:26,512 --> 01:00:29,824
内细菌是否有所收获同时也不停

1250
01:00:29,836 --> 01:00:32,525
检验其回报呢在人体和细菌

1251
01:00:32,525 --> 01:00:34,775
的博弈中未来的阴影通常很

1252
01:00:34,775 --> 01:00:37,724
长因为一个普通人可以在任何起始

1253
01:00:37,724 --> 01:00:41,286
点活上很多年然而一个严重

1254
01:00:41,300 --> 01:00:43,625
伤者则可能给其寄生菌带来

1255
01:00:43,650 --> 01:00:46,500
较短的未来背叛的诱惑突然

1256
01:00:46,500 --> 01:00:48,487
比互相合作的奖赏更有诱惑

1257
01:00:48,487 --> 01:00:51,550
力当然细菌在它们邪恶的小

1258
01:00:51,550 --> 01:00:54,336
头脑里可没有计算这些东西代

1259
01:00:54,336 --> 01:00:56,750
代细菌的自然选择已经将它们培养

1260
01:00:56,750 --> 01:00:59,561
成一个无意识的生物首要任务是

1261
01:00:59,561 --> 01:01:03,324
以生物化学来维系生命根据阿克塞尔罗德和

1262
01:01:03,336 --> 01:01:05,824
汉密尔顿的分析虽然植物明显没有

1263
01:01:05,836 --> 01:01:09,262
意识但它们懂得复仇无花果树和榕

1264
01:01:09,262 --> 01:01:12,150
小蜂享有紧密合作的关系我们

1265
01:01:12,150 --> 01:01:15,036
所吃的无花果其实不是果实无花果

1266
01:01:15,050 --> 01:01:16,875
顶端有一个小洞如果你可以

1267
01:01:16,887 --> 01:01:18,974
缩小成榕小蜂的尺寸进入

1268
01:01:19,000 --> 01:01:21,099
这个小洞榕小蜂非常小

1269
01:01:21,487 --> 01:01:24,025
小得当我们吃无花果时都不会

1270
01:01:24,036 --> 01:01:26,311
注意到它就可以看见无花果壁

1271
01:01:26,311 --> 01:01:29,737
上有许许多多小花无花果其实是

1272
01:01:29,762 --> 01:01:32,186
花朵们的阴暗温室与授粉房间

1273
01:01:32,561 --> 01:01:34,675
而授粉过程要靠榕小蜂

1274
01:01:34,686 --> 01:01:37,875
来完成无花果树为榕小蜂提供

1275
01:01:37,887 --> 01:01:40,375
栖息地而榕小蜂在这些

1276
01:01:40,387 --> 01:01:42,586
小花里产卵对于榕小蜂

1277
01:01:42,599 --> 01:01:44,974
来说背叛指的是在无花果内

1278
01:01:44,974 --> 01:01:47,824
的许多花朵中产卵使得它们无法

1279
01:01:47,824 --> 01:01:52,961
互相授粉无花果树如何报复呢阿克塞尔罗德和

1280
01:01:52,974 --> 01:01:56,125
汉密尔顿说许多情况下如果榕小

1281
01:01:56,125 --> 01:01:58,362
蜂进入一棵年轻的无花果却

1282
01:01:58,362 --> 01:02:00,961
不为花朵授粉而是在大部分花朵

1283
01:02:00,961 --> 01:02:03,675
中产卵无花果树将除去这颗

1284
01:02:03,699 --> 01:02:06,000
还处于生长中的无花果使得所有

1285
01:02:06,012 --> 01:02:07,625
榕小蜂的后代都走向

1286
01:02:07,625 --> 01:02:12,186
死亡艾瑞克费希尔则在海鲈鱼一种

1287
01:02:12,211 --> 01:02:14,862
雌雄同体的鱼身上发现了一个奇怪

1288
01:02:14,862 --> 01:02:17,974
的现象正好说明了自然界的针锋相对

1289
01:02:18,550 --> 01:02:21,387
与我们不同这种鱼的性别不是

1290
01:02:21,387 --> 01:02:23,275
由生命孕育时的染色体决定的

1291
01:02:23,836 --> 01:02:25,949
每一条鱼都有雄性与雌性

1292
01:02:25,949 --> 01:02:28,800
的功能交配时可以选择产生卵子

1293
01:02:28,824 --> 01:02:31,550
或精子他们双双缔结一夫一

1294
01:02:31,550 --> 01:02:34,800
妻的组合轮流交换性别分饰雌雄

1295
01:02:34,811 --> 01:02:38,199
角色我们也许可以推测由于雄性角色

1296
01:02:38,224 --> 01:02:41,112
相对方便海鲈鱼也许更愿意饰演

1297
01:02:41,137 --> 01:02:45,750
雄性角色而逃离合作关系也就是说如果其中

1298
01:02:45,762 --> 01:02:48,949
一条鱼可以成功劝服伴侣持续饰演

1299
01:02:48,974 --> 01:02:51,175
雌性角色它就可以逃离其对

1300
01:02:51,186 --> 01:02:53,349
孵卵生产的责任而将资源

1301
01:02:53,375 --> 01:02:55,949
投入其他事情比如和其他鱼交配

1302
01:02:55,949 --> 01:02:59,887
等事实上费希尔却发现海鲈鱼以

1303
01:02:59,898 --> 01:03:02,536
一种严格的轮换机制进行其繁衍

1304
01:03:02,550 --> 01:03:07,512
过程这就是我们所预料的针锋相对这个博弈

1305
01:03:07,625 --> 01:03:10,336
正是一个真正的囚徒博弈虽然有些

1306
01:03:10,349 --> 01:03:13,250
复杂但这说明了鲈鱼们为何

1307
01:03:13,262 --> 01:03:16,898
采取这个策略在这里合作表示在

1308
01:03:16,911 --> 01:03:19,425
轮到其产卵时扮演雌性角色

1309
01:03:19,750 --> 01:03:21,637
背叛则是在轮到时试图

1310
01:03:21,648 --> 01:03:25,050
扮演雄性角色这种背叛很容易引起

1311
01:03:25,061 --> 01:03:27,862
报复伴侣可能会在下一次拒绝

1312
01:03:27,875 --> 01:03:30,911
扮演雌性角色或者她可以直接中断

1313
01:03:30,936 --> 01:03:34,311
伴侣关系费希尔确实也发现了那些

1314
01:03:34,336 --> 01:03:36,925
性别角色担当次数不等的伴侣容易

1315
01:03:36,936 --> 01:03:40,175
分手社会学家和心理学家会提出一个

1316
01:03:40,186 --> 01:03:43,336
问题为什么有人会愿意捐赠血液在

1317
01:03:43,349 --> 01:03:46,887
英国等国家血液捐赠为无偿我

1318
01:03:46,887 --> 01:03:48,836
不觉得这个答案在互惠或伪装

1319
01:03:48,836 --> 01:03:51,211
的自私下有那么简单当这些

1320
01:03:51,237 --> 01:03:54,411
长期血液捐赠者需要输血时他们

1321
01:03:54,425 --> 01:03:56,836
并未得到任何优先次序也没有

1322
01:03:56,836 --> 01:03:59,387
人给他们颁发金星奖章也许我

1323
01:03:59,398 --> 01:04:01,987
过于天真了但我觉得这是一种

1324
01:04:02,012 --> 01:04:05,661
真正的纯粹的无私利他主义这是因为

1325
01:04:05,762 --> 01:04:08,387
吸血蝙蝠之间的血液共享刚好符合

1326
01:04:08,411 --> 01:04:13,061
阿克塞尔罗德的模型GS威尔金森GS

1327
01:04:13,148 --> 01:04:15,523
Wilkinson的研究表明了这一点

1328
01:04:16,099 --> 01:04:19,423
吸血蝙蝠以在夜里吸血为生它们

1329
01:04:19,436 --> 01:04:21,750
要得到食物并不容易但每每

1330
01:04:21,762 --> 01:04:25,487
得到的都是大餐当黎明降临一些

1331
01:04:25,512 --> 01:04:27,425
不走运的蝙蝠可能会空着

1332
01:04:27,425 --> 01:04:29,936
肚子回家另一些则可能找到一个

1333
01:04:29,949 --> 01:04:33,586
受害者吸了充足的血液第二天晚上

1334
01:04:33,887 --> 01:04:36,336
同样的故事又在上演在这种

1335
01:04:36,349 --> 01:04:39,436
情况下一个互助的利他主义是可能

1336
01:04:39,449 --> 01:04:42,699
产生的威尔金森发现那些在夜里吸

1337
01:04:42,699 --> 01:04:44,961
饱血液的幸运儿确实会将一些

1338
01:04:44,987 --> 01:04:47,411
血液返流捐赠给不走运的同伴

1339
01:04:47,987 --> 01:04:51,362
威尔金森观察了110例血液捐赠其中有

1340
01:04:51,375 --> 01:04:54,824
77次是母亲喂养孩子而大部分其他

1341
01:04:54,824 --> 01:04:57,487
的血液捐赠发生在近亲中在

1342
01:04:57,500 --> 01:05:00,048
完全没有血缘的蝙蝠中一些血液

1343
01:05:00,061 --> 01:05:03,237
捐赠的例子依然存在血浓于水的说法

1344
01:05:03,250 --> 01:05:07,112
看来并不完全符合事实但是这些

1345
01:05:07,125 --> 01:05:09,523
共享血液的蝙蝠也经常是室友

1346
01:05:09,798 --> 01:05:12,586
它们有许多机会与对方持续打交道

1347
01:05:12,849 --> 01:05:15,298
这正是重复囚徒博弈所必须满足

1348
01:05:15,298 --> 01:05:18,036
的条件但囚徒博弈的其他条件

1349
01:05:18,036 --> 01:05:21,048
呢表12-4的回报表格显示了

1350
01:05:21,061 --> 01:05:23,887
我们对此的预期表12-4吸血

1351
01:05:23,887 --> 01:05:26,449
蝙蝠的血液捐赠在各种情况下

1352
01:05:26,561 --> 01:05:28,474
我的回报吸血蝙蝠的情况真

1353
01:05:28,474 --> 01:05:31,025
的和这张表格一样吗威尔金森

1354
01:05:31,137 --> 01:05:32,762
对那些饿肚子的蝙蝠的体重

1355
01:05:32,775 --> 01:05:36,798
下降速率进行计算通过对饱食饥肠

1356
01:05:36,900 --> 01:05:39,173
与处于中间段的蝙蝠饿死速率

1357
01:05:39,275 --> 01:05:42,012
进行分别计算他算得血液得以

1358
01:05:42,025 --> 01:05:44,525
维持生命的时间他发现了一个

1359
01:05:44,548 --> 01:05:46,911
并不惊奇的结论这些速率并

1360
01:05:46,911 --> 01:05:50,161
不相等取决于蝙蝠的饥饿程度比

1361
01:05:50,161 --> 01:05:53,074
起吃饱喝足的蝙蝠相同的血液量

1362
01:05:53,173 --> 01:05:55,586
可以为饥肠辘辘的生命维持更多的

1363
01:05:55,599 --> 01:05:59,336
时间也就是说虽然捐血可以增加捐赠

1364
01:05:59,336 --> 01:06:02,237
者饿死的速率但救助濒死生命的意义

1365
01:06:02,349 --> 01:06:05,074
要大得多这似乎表示蝙蝠

1366
01:06:05,074 --> 01:06:07,923
的情况确实符合囚徒困境的规则

1367
01:06:08,500 --> 01:06:10,336
将血液捐赠给同伴中的所

1368
01:06:10,336 --> 01:06:12,637
需者比留着自用更为珍贵

1369
01:06:13,211 --> 01:06:15,875
在雌蝙蝠吸血蝙蝠的社交范围

1370
01:06:15,900 --> 01:06:18,911
为雌性饥肠辘辘的夜里可以从伙伴

1371
01:06:18,911 --> 01:06:22,362
的捐赠中获益良多当然如果雌

1372
01:06:22,362 --> 01:06:25,362
蝙蝠选择背叛拒绝给同伴捐赠血液

1373
01:06:25,675 --> 01:06:28,300
逃离互助的责任雌蝙蝠可以受益

1374
01:06:28,300 --> 01:06:31,762
更多在这里逃离互助责任只在

1375
01:06:31,775 --> 01:06:35,086
蝙蝠确实采取针锋相对策略时才有意义

1376
01:06:35,650 --> 01:06:38,862
那么针锋相对在演化中的其他条件

1377
01:06:38,961 --> 01:06:42,161
是否能满足呢重要的是这些

1378
01:06:42,175 --> 01:06:45,737
蝙蝠是否能够互相辨别呢威尔金森的

1379
01:06:45,762 --> 01:06:48,161
实验结果是肯定的他俘虏了

1380
01:06:48,175 --> 01:06:50,599
一只蝙蝠将其与同伴隔离

1381
01:06:50,836 --> 01:06:53,411
并饿了雌蝙蝠一夜其他同伴

1382
01:06:53,436 --> 01:06:55,661
则得以饱食当这只不幸的

1383
01:06:55,675 --> 01:06:59,387
俘虏返回巢穴时威尔金森就观察是否

1384
01:06:59,387 --> 01:07:02,574
有任何蝙蝠给予其食物这个实验

1385
01:07:02,599 --> 01:07:05,599
重复了许多次不同的蝙蝠轮流作为

1386
01:07:05,625 --> 01:07:08,061
饥饿的俘虏又被送返俘虏

1387
01:07:08,061 --> 01:07:10,500
的蝙蝠们来自相隔数英里的两个

1388
01:07:10,512 --> 01:07:14,074
巢穴两个独立的组织如果蝙蝠可以

1389
01:07:14,086 --> 01:07:16,324
辨别它们的朋友这只饥饿的

1390
01:07:16,336 --> 01:07:18,800
蝙蝠将可以从也只能从自己

1391
01:07:18,800 --> 01:07:21,686
的巢穴中获得帮助这正是事实

1392
01:07:22,250 --> 01:07:24,336
在观察到的13个血液捐赠者

1393
01:07:24,336 --> 01:07:26,900
中12个捐赠者是饥饿者的

1394
01:07:26,911 --> 01:07:30,362
老朋友来自同一个巢穴来自不同巢穴

1395
01:07:30,362 --> 01:07:32,461
的新朋友只喂养了1次饥饿

1396
01:07:32,461 --> 01:07:35,599
的蝙蝠这也许是个巧合但当

1397
01:07:35,599 --> 01:07:37,599
我们计算这个范例时它发生的

1398
01:07:37,612 --> 01:07:40,237
概率只小于我们可以信心十足地

1399
01:07:40,250 --> 01:07:43,961
总结蝙蝠确实更偏爱帮助老朋友而

1400
01:07:43,961 --> 01:07:46,925
不是另一个巢穴的陌生人吸血蝙蝠是

1401
01:07:46,936 --> 01:07:49,887
神秘的对于维多利亚哥特小说的迷恋

1402
01:07:49,887 --> 01:07:52,487
者来说它们经常是在夜里恐吓

1403
01:07:52,500 --> 01:07:56,086
他人吸食血液牺牲无辜生命以满足

1404
01:07:56,112 --> 01:07:58,875
私欲的黑暗力量再加上其他维多利亚

1405
01:07:58,887 --> 01:08:01,411
时期的神秘事件以及蝙蝠天生鲜红的

1406
01:08:01,425 --> 01:08:04,974
牙齿和爪子吸血鬼蝙蝠不正是自然界

1407
01:08:05,000 --> 01:08:07,125
自私基因的最令人恐惧的力量

1408
01:08:07,125 --> 01:08:10,887
的化身吗我对于这些神秘事件嗤之以鼻

1409
01:08:11,461 --> 01:08:13,625
如果我们想知道一个事件背后的

1410
01:08:13,637 --> 01:08:17,711
真相就需要研究达尔文主义赋予我们的

1411
01:08:17,823 --> 01:08:20,073
并不是对一个特定生物的详细描述

1412
01:08:20,448 --> 01:08:22,787
而是一个更微妙却更有价值

1413
01:08:22,787 --> 01:08:25,412
的工具对原理的理解如果我们

1414
01:08:25,425 --> 01:08:27,800
一定要加进一个神秘事件那便是

1415
01:08:27,811 --> 01:08:30,724
真相关于吸血蝙蝠高尚品格的故事

1416
01:08:31,300 --> 01:08:35,625
对于蝙蝠自身血并不浓于水它们超越亲属

1417
01:08:35,636 --> 01:08:38,350
关系在忠诚的朋友间形成它们

1418
01:08:38,375 --> 01:08:41,850
长久坚实的纽带吸血蝙蝠可以讲述

1419
01:08:41,862 --> 01:08:44,412
一个新的神秘故事一个关于共享

1420
01:08:44,649 --> 01:08:47,800
互助合作的故事它们昭示这一个

1421
01:08:47,823 --> 01:08:50,225
善良的思想即使我们都由自私

1422
01:08:50,225 --> 01:08:52,375
的基因掌舵好人终有好报