1 00:00:00,100 --> 00:00:01,862 第12章好人终有好报 2 00:00:01,887 --> 00:00:04,637 好人垫后这句俗语似乎来自 3 00:00:04,650 --> 00:00:07,599 棒球界不过有些权威人士声称它 4 00:00:07,599 --> 00:00:11,336 有其他内涵美国生物学家加勒特哈丁 5 00:00:11,625 --> 00:00:14,224 GarrettHardin用这句俗语来总结 6 00:00:14,250 --> 00:00:17,411 社会生物学或者自私的基因其中的贴切 7 00:00:17,437 --> 00:00:21,324 不言而喻在达尔文主义中好人是那些愿意 8 00:00:21,336 --> 00:00:24,461 自身付出代价帮助种群中其他成员 9 00:00:24,475 --> 00:00:26,812 个体以此使他们的基因传 10 00:00:26,812 --> 00:00:29,836 到下一代的人这么看来好人的 11 00:00:29,850 --> 00:00:32,987 数目注定要减少善良在达尔文主义里 12 00:00:33,100 --> 00:00:36,298 终将灭亡这里的好人还有另一种 13 00:00:36,325 --> 00:00:39,112 专有解释和俗语中的含义相差 14 00:00:39,137 --> 00:00:41,411 并不远但在这种解释里 15 00:00:41,811 --> 00:00:43,911 好人则能得好报在这 16 00:00:43,911 --> 00:00:46,262 一章节里我将阐释这个相对 17 00:00:46,274 --> 00:00:48,686 乐观的结论想想第10章 18 00:00:48,686 --> 00:00:51,686 里的斤斤计较者那些鸟儿显然以 19 00:00:51,712 --> 00:00:54,000 利他的方式互相帮助但对那些 20 00:00:54,000 --> 00:00:56,575 曾经拒绝帮助他人的鸟它们却 21 00:00:56,575 --> 00:01:00,298 怀恨在心以牙还牙地拒绝给予帮助比起 22 00:01:00,311 --> 00:01:03,250 傻瓜那些无私奉献却遭遇剥削的 23 00:01:03,262 --> 00:01:06,686 个体和骗子那些互相无情剥削而 24 00:01:06,700 --> 00:01:09,599 共同毁灭的个体斤斤计较者在种群 25 00:01:09,599 --> 00:01:12,212 中占优势因为它们可以将更多基因 26 00:01:12,311 --> 00:01:15,512 传递给后代斤斤计较者的故事表达 27 00:01:15,512 --> 00:01:19,287 了一个重要原则罗伯特特里弗斯将此 28 00:01:19,299 --> 00:01:22,900 称为互惠利他理论在清洁工鱼第 29 00:01:22,900 --> 00:01:25,936 10章的例子里互惠利他不仅 30 00:01:25,950 --> 00:01:28,349 局限于单个物种还存在于所有 31 00:01:28,361 --> 00:01:31,474 共生关系中类似的例子还有蚂蚁 32 00:01:31,474 --> 00:01:33,587 为它们的奶牛蚜虫挤奶第 33 00:01:33,587 --> 00:01:35,750 10章当第10章写就 34 00:01:35,750 --> 00:01:40,500 时美国政治科学家罗伯特阿克塞尔罗德将互惠 35 00:01:40,500 --> 00:01:43,025 利他的概念延伸至更为激动人心的 36 00:01:43,037 --> 00:01:48,186 方向阿克塞尔罗德曾与威廉唐纳汉密尔顿合作 37 00:01:48,549 --> 00:01:50,436 后者的名字在这本书里 38 00:01:50,549 --> 00:01:53,212 已经出现无数次了开篇已经暗示 39 00:01:53,212 --> 00:01:56,462 过正是阿克塞尔罗德赋予了好人一个专有 40 00:01:56,474 --> 00:02:01,212 含义如同许多其他政治科学家经济学家数学家 41 00:02:01,311 --> 00:02:04,650 与心理学家一样阿克塞尔罗德对囚徒困境 42 00:02:04,674 --> 00:02:06,962 这一简单的博弈游戏很感兴趣 43 00:02:07,537 --> 00:02:10,473 这个游戏极其简单但我知道许多 44 00:02:10,486 --> 00:02:13,650 聪明人完全误解了游戏以为其复杂 45 00:02:13,662 --> 00:02:17,361 无比不过它的简单也带有欺骗性 46 00:02:17,925 --> 00:02:20,836 图书馆里关于这个博弈衍生物的书籍 47 00:02:20,949 --> 00:02:24,175 多如牛毛许多有影响力的人认为 48 00:02:24,275 --> 00:02:26,175 它是解决战略防御规划问题的 49 00:02:26,187 --> 00:02:29,312 钥匙这个模型需被仔细研究以 50 00:02:29,312 --> 00:02:32,525 阻止第三次世界大战的发生而作为一个 51 00:02:32,550 --> 00:02:35,687 生物学家我站在阿克塞尔罗德与汉密尔顿 52 00:02:35,699 --> 00:02:38,836 一边许多野生动物和植物正以其 53 00:02:38,861 --> 00:02:42,111 演化进程精确无误地进行着囚徒困境 54 00:02:42,137 --> 00:02:44,875 的博弈在其原始的人类版本中 55 00:02:45,187 --> 00:02:48,287 囚徒博弈是这样的一个银行家判定 56 00:02:48,312 --> 00:02:51,025 两位玩家的输赢并付与赢家报酬 57 00:02:51,598 --> 00:02:53,775 假设我们便是这两位玩家当我们 58 00:02:53,787 --> 00:02:56,562 开始博弈时虽然我们将看到对立 59 00:02:56,586 --> 00:02:58,037 是我们最不应该做的我们 60 00:02:58,037 --> 00:03:00,425 手中各有两张卡分别为合作 61 00:03:00,537 --> 00:03:03,086 与背叛我们各自选定一张牌 62 00:03:03,361 --> 00:03:05,550 面朝下摆放在桌子上这样 63 00:03:05,550 --> 00:03:07,361 我们都不知道对方的选择也 64 00:03:07,361 --> 00:03:09,525 不会为对方选择所影响这便 65 00:03:09,537 --> 00:03:12,861 等同于我们同时行动然后我们等待 66 00:03:12,887 --> 00:03:15,699 银行家来翻牌我们的输赢不仅 67 00:03:15,711 --> 00:03:18,262 取决于我们出的牌还取决于对方 68 00:03:18,287 --> 00:03:21,300 打出的牌其悬念在于虽然 69 00:03:21,300 --> 00:03:23,336 我们清楚自己的出牌却并 70 00:03:23,336 --> 00:03:25,425 不知道对方的出牌我们都 71 00:03:25,425 --> 00:03:28,187 只能等银行家来揭晓结果我们一共 72 00:03:28,187 --> 00:03:31,675 有2×2=4张牌于是也便有 73 00:03:31,699 --> 00:03:34,000 4种可能的结果为向这个 74 00:03:34,000 --> 00:03:37,050 游戏的发源地北美致敬我们以美元 75 00:03:37,062 --> 00:03:40,111 来表示这4种输赢结果结果 76 00:03:40,111 --> 00:03:43,625 1我们俩都选择了合作银行家给 77 00:03:43,625 --> 00:03:47,211 我们每个人300美元这个不菲的总数是 78 00:03:47,211 --> 00:03:50,562 对相互合作的奖赏结果2我们 79 00:03:50,562 --> 00:03:53,723 俩都选择了背叛银行家对每个人罚款 80 00:03:53,750 --> 00:03:57,900 10美元这是对相互背叛的惩罚结果 81 00:03:57,900 --> 00:04:02,062 3你选择合作我选择背叛银行家 82 00:04:02,086 --> 00:04:05,312 付给我500美元这是背叛的诱惑罚 83 00:04:05,312 --> 00:04:09,848 了你傻瓜100美元结果4你选择 84 00:04:09,861 --> 00:04:13,550 背叛我选择合作银行家将背叛的 85 00:04:13,562 --> 00:04:15,812 诱惑付给了你而罚了我 86 00:04:15,812 --> 00:04:19,024 这个傻瓜100美元结果3与4明显 87 00:04:19,036 --> 00:04:22,387 互为镜像一个玩家得到好处则 88 00:04:22,387 --> 00:04:25,375 有另一个玩家将付出代价在结果 89 00:04:25,399 --> 00:04:27,675 1与2里我们俩得到相同的 90 00:04:27,687 --> 00:04:29,937 结果而结果1对我们俩都 91 00:04:29,937 --> 00:04:33,036 有好处这里金钱的具体数目并不要紧 92 00:04:33,387 --> 00:04:35,850 重要的是这个博弈里囚徒困境 93 00:04:35,875 --> 00:04:38,961 结果的排列顺序背叛的诱惑相互 94 00:04:38,961 --> 00:04:41,961 合作的奖赏相互背叛的惩罚失败 95 00:04:41,961 --> 00:04:45,411 的代价严格来说这个博弈还有另一个 96 00:04:45,425 --> 00:04:48,100 条件背叛的诱惑与失败的代价 97 00:04:48,100 --> 00:04:50,687 的平均值不可高于相互合作的奖赏 98 00:04:51,262 --> 00:04:53,350 我们将在后边附加条件里提到 99 00:04:53,375 --> 00:04:56,312 这个原因这四种结果总结于表 100 00:04:56,312 --> 00:04:59,687 12—1里表12-1我在囚徒困境博弈 101 00:04:59,687 --> 00:05:02,612 里各种结果的输赢状况那么为什么 102 00:05:02,637 --> 00:05:05,161 这是一个困境看看这张输赢状况 103 00:05:05,161 --> 00:05:07,661 的表格想象一下我在与你 104 00:05:07,675 --> 00:05:09,937 博弈时脑海中盘旋着的想法 105 00:05:10,512 --> 00:05:13,899 我知道你只有两张牌合作或者 106 00:05:13,911 --> 00:05:16,350 背叛让我们按次序来想想 107 00:05:16,911 --> 00:05:19,600 如果你打出背叛这表示我们 108 00:05:19,612 --> 00:05:21,036 将看向表格中的右边一 109 00:05:21,036 --> 00:05:23,086 列我能打出最好的牌 110 00:05:23,187 --> 00:05:25,250 也只能是背叛虽然我也将 111 00:05:25,262 --> 00:05:27,800 接受相互背叛的惩罚但我知道 112 00:05:28,336 --> 00:05:31,312 如果选择了合作失败者的代价只会 113 00:05:31,324 --> 00:05:34,137 更高而如果你选择了合作看 114 00:05:34,137 --> 00:05:36,925 向左边一列我最好的结果也只能 115 00:05:36,925 --> 00:05:39,824 是选择背叛如果我们合作了我们 116 00:05:39,824 --> 00:05:42,112 都能得到300美元但如果我选择 117 00:05:42,125 --> 00:05:45,149 背叛我将得到更多500美元这里 118 00:05:45,149 --> 00:05:47,300 的结论是无论你选择哪张 119 00:05:47,300 --> 00:05:50,086 牌我最好的选择是永远背叛 120 00:05:50,100 --> 00:05:52,149 我已经运用我无懈可击的逻辑算 121 00:05:52,149 --> 00:05:55,387 出无论你如何选择我都必须背叛 122 00:05:55,961 --> 00:05:57,875 而你也将算出同样的 123 00:05:57,887 --> 00:06:01,211 结果于是当两个理性的对手相对 124 00:06:01,211 --> 00:06:04,425 时他们将同时背叛也将同时 125 00:06:04,524 --> 00:06:07,711 被罚款获得一个较低的分数虽然 126 00:06:07,737 --> 00:06:11,000 每个人都心知肚明如果他们彼此选择合作 127 00:06:11,312 --> 00:06:12,937 两人都将得到较高的相互 128 00:06:12,949 --> 00:06:15,500 合作的奖赏我们的例子里是 129 00:06:15,512 --> 00:06:18,762 300美元这就是为什么这个博弈被 130 00:06:18,762 --> 00:06:22,475 称为困境自相矛盾得令人恼火这也就是 131 00:06:22,487 --> 00:06:25,461 为什么人们开始提出必须有一个法律 132 00:06:25,562 --> 00:06:28,336 来对付这个问题囚徒来自一个特殊 133 00:06:28,336 --> 00:06:30,975 的想象中的例子上述例子中 134 00:06:30,975 --> 00:06:33,949 的现金被监狱的刑罚取代两个 135 00:06:33,975 --> 00:06:36,161 在监狱中的囚徒姑且称他们 136 00:06:36,161 --> 00:06:39,350 为彼得森与莫里亚蒂有共同犯罪的嫌疑 137 00:06:39,923 --> 00:06:42,062 囚徒们各自被关押在单独的 138 00:06:42,074 --> 00:06:44,449 牢房里并各自被劝诱背叛他 139 00:06:44,449 --> 00:06:47,350 的同伙将所有犯罪证据栽赃对方 140 00:06:47,923 --> 00:06:50,574 他们的判决结果将取决于两个囚徒 141 00:06:50,574 --> 00:06:52,812 的行为而双方都不知道对方 142 00:06:52,812 --> 00:06:56,162 的选择如果彼得森将所有罪过都 143 00:06:56,173 --> 00:06:59,798 推向莫里亚蒂而莫里亚蒂始终保持沉默与 144 00:06:59,798 --> 00:07:02,312 他从前的朋友现在的叛徒合作 145 00:07:02,586 --> 00:07:06,662 莫里亚蒂将接受重罚而彼得森得以无罪释放 146 00:07:06,824 --> 00:07:09,649 享受背叛的诱惑如果两人互相 147 00:07:09,662 --> 00:07:12,324 背叛便都将获罪但可以因为 148 00:07:12,348 --> 00:07:15,537 供认不讳而得到轻判这便是互相背叛 149 00:07:15,537 --> 00:07:18,625 的惩罚如果两人互相与对方 150 00:07:18,723 --> 00:07:22,399 而不是当局合作闭口不谈过往所得证据 151 00:07:22,423 --> 00:07:23,762 将不足以把两人判以 152 00:07:23,762 --> 00:07:25,912 重罪则两人也都将得到 153 00:07:25,923 --> 00:07:29,012 轻判得到互相合作的奖赏虽然 154 00:07:29,024 --> 00:07:32,086 将牢狱刑罚称为奖赏有点儿奇怪但 155 00:07:32,086 --> 00:07:34,473 比起漫长的铁窗生涯犯人们 156 00:07:34,500 --> 00:07:36,824 肯定会将此看作奖赏的你 157 00:07:36,836 --> 00:07:39,723 可以发现虽然这里的回报不是美元 158 00:07:39,812 --> 00:07:42,861 而是牢狱刑罚博弈的主要特征依然 159 00:07:42,861 --> 00:07:45,812 保存着看看四个结果可取性的排列 160 00:07:45,812 --> 00:07:48,598 顺序如果你将自己放在任何 161 00:07:48,611 --> 00:07:51,111 一个囚徒的位置上假设两人 162 00:07:51,211 --> 00:07:53,162 都以理性的自我利益为动机 163 00:07:53,574 --> 00:07:56,949 你将看到两人都只能背叛对方而 164 00:07:56,961 --> 00:08:00,236 同样接受沉重的刑罚有没有逃离困境 165 00:08:00,236 --> 00:08:03,537 的方法呢双方都知道无论对方 166 00:08:03,562 --> 00:08:06,486 如何选择他们能做出的最好的选择 167 00:08:06,586 --> 00:08:09,912 都是背叛但他们也都知道如果 168 00:08:09,925 --> 00:08:12,723 双方都选择合作任何一方都可以 169 00:08:12,723 --> 00:08:16,512 得到更多的好处如果如果如果能 170 00:08:16,512 --> 00:08:19,250 有一个办法让他们达成共识能 171 00:08:19,250 --> 00:08:21,774 有一个办法让双方都坚信对方 172 00:08:21,774 --> 00:08:24,037 可以被信任不至于奔向那个自私的 173 00:08:24,050 --> 00:08:26,500 奖赏能有一个方法来维持双方 174 00:08:26,512 --> 00:08:28,973 共识在囚徒困境这个简单博弈里 175 00:08:29,324 --> 00:08:32,500 没有任何方法可以达成信任除非其中 176 00:08:32,500 --> 00:08:34,924 一方是一个虔诚的傻瓜善良得 177 00:08:34,949 --> 00:08:38,424 根本不可能适应这个世界这个博弈注定 178 00:08:38,437 --> 00:08:42,287 将以相互背叛相互损伤告终然而 179 00:08:42,723 --> 00:08:45,449 这个博弈还有另一个版本重复博弈的 180 00:08:45,473 --> 00:08:49,287 囚徒困境这个重复博弈更为复杂但 181 00:08:49,299 --> 00:08:52,736 复杂性里孕育着希望重复博弈只是 182 00:08:52,750 --> 00:08:55,236 简单将上述博弈与同一个对手 183 00:08:55,336 --> 00:08:58,125 无限次重复你我再次在银行家 184 00:08:58,136 --> 00:09:01,274 面前左右相对再次拥有手中的两张牌 185 00:09:01,562 --> 00:09:04,174 合作与背叛我们再次各自打出 186 00:09:04,187 --> 00:09:07,287 一张牌由银行家根据上述规则 187 00:09:07,399 --> 00:09:09,799 给出奖赏与惩罚但这一次 188 00:09:09,812 --> 00:09:12,687 对弈不再是博弈的终结我们捡 189 00:09:12,687 --> 00:09:14,674 起手中的牌准备着下一 190 00:09:14,674 --> 00:09:17,074 轮下一轮的游戏给予我们 191 00:09:17,086 --> 00:09:20,375 机会来重新建立信任与怀疑实施 192 00:09:20,386 --> 00:09:23,774 对抗或和解给予报复或宽恕在 193 00:09:23,774 --> 00:09:26,000 这无限长的博弈里我们最 194 00:09:26,000 --> 00:09:28,761 重要的任务是赢了银行家而 195 00:09:28,761 --> 00:09:32,361 不是对方在10次博弈后理论上我 196 00:09:32,473 --> 00:09:35,062 也许可以获得最多5000美元但 197 00:09:35,074 --> 00:09:37,736 只有在你完全愚不可及或者大公无私地 198 00:09:37,761 --> 00:09:39,836 每次都打出合作的时候我 199 00:09:39,836 --> 00:09:42,461 才有可能每次都得到最高奖赏背叛 200 00:09:42,461 --> 00:09:44,875 的诱惑在更实际一点儿的情况 201 00:09:44,875 --> 00:09:47,149 里我们各自都在10次对弈中 202 00:09:47,250 --> 00:09:49,674 打出合作并各自从银行家里 203 00:09:49,787 --> 00:09:53,199 得到3000美元这样我们并不 204 00:09:53,199 --> 00:09:55,787 需要特别大公无私因为我们彼此都能 205 00:09:55,787 --> 00:09:57,912 从对方过往的行为中知道对方 206 00:09:57,937 --> 00:10:00,774 可以信任我们事实上也在监管着 207 00:10:00,774 --> 00:10:03,261 对方的行为还有另一个也可能发生 208 00:10:03,261 --> 00:10:06,100 的结果我们彼此不信任对方在 209 00:10:06,112 --> 00:10:08,024 10次对弈中都打出了背叛 210 00:10:08,399 --> 00:10:11,011 银行家则从每个人处得到了100美元 211 00:10:11,586 --> 00:10:13,687 最可能发生的是我们并不 212 00:10:13,687 --> 00:10:16,086 完全信任对方打出了各种次序 213 00:10:16,086 --> 00:10:18,237 的合作与背叛双方都得到了 214 00:10:18,261 --> 00:10:20,211 并不多的金钱在第10 215 00:10:20,211 --> 00:10:22,824 章中那些互相从对方羽毛中 216 00:10:22,937 --> 00:10:25,125 捉出蜱虫的鸟正是进行一 217 00:10:25,125 --> 00:10:28,049 场囚徒困境的重复博弈这怎么 218 00:10:28,049 --> 00:10:30,912 进行呢你应该还记得对于鸟 219 00:10:30,912 --> 00:10:33,774 来说从自己身上清除蜱虫非常重要 220 00:10:34,136 --> 00:10:36,037 但它无法自己清除头部的蜱虫 221 00:10:36,412 --> 00:10:38,886 只能依靠同伴来帮助它而让 222 00:10:38,886 --> 00:10:41,674 它同样报答对方也是公平的但 223 00:10:41,687 --> 00:10:44,074 这项工作耗费了许多时间精力 224 00:10:44,449 --> 00:10:47,037 鸟类在这方面并不宽裕如果 225 00:10:47,037 --> 00:10:49,174 某只鸟能以欺骗方式从 226 00:10:49,187 --> 00:10:51,324 这个小圈子中逃出来让别人 227 00:10:51,336 --> 00:10:54,812 清除自己的蜱虫而拒绝互惠互利它 228 00:10:54,824 --> 00:10:57,037 则能得到所有实惠而不需 229 00:10:57,037 --> 00:10:59,737 支付任何代价如果你将这些回报 230 00:10:59,750 --> 00:11:03,274 结果排列一下次序你将发现这 231 00:11:03,274 --> 00:11:06,687 正是真实的囚徒困境博弈互相合作 232 00:11:06,799 --> 00:11:09,237 以清除彼此的蜱虫固然是好事 233 00:11:09,612 --> 00:11:11,549 但还有着更好的诱惑促使 234 00:11:11,549 --> 00:11:14,649 你拒绝支付互惠的代价互相背叛 235 00:11:14,750 --> 00:11:17,725 以拒绝清除蜱虫固然不是好事但 236 00:11:17,725 --> 00:11:19,475 也没有比花精力帮别人除 237 00:11:19,475 --> 00:11:22,199 虫而自己无人理睬更不好表 238 00:11:22,199 --> 00:11:25,899 12—2展示了这个回报结果表12-2 239 00:11:25,912 --> 00:11:28,586 鸟类清除蜱虫的博弈我从各种 240 00:11:28,600 --> 00:11:29,836 结果中得到的回报 241 00:11:30,100 --> 00:11:32,548 但这只是一个例子如果你继续 242 00:11:32,562 --> 00:11:35,062 思考你更会发现从人类到 243 00:11:35,075 --> 00:11:38,125 动植物生活中充满了囚徒困境的 244 00:11:38,149 --> 00:11:42,799 重复博弈植物是的记得我们谈到策略 245 00:11:42,799 --> 00:11:45,511 时我们没有提到有意识的策略但 246 00:11:45,524 --> 00:11:47,611 我们之后可能会提及但我们提及 247 00:11:47,611 --> 00:11:50,500 了梅纳德史密斯的意识这便是一种 248 00:11:50,524 --> 00:11:53,062 预定基因的策略我们之后还会 249 00:11:53,073 --> 00:11:57,049 提到植物动物甚至细菌它们都在 250 00:11:57,062 --> 00:12:00,125 进行着囚徒困境的重复博弈现在 251 00:12:00,549 --> 00:12:03,350 先让我们详细探索一下为何重复 252 00:12:03,361 --> 00:12:06,812 博弈如此重要在简单博弈里我们 253 00:12:06,825 --> 00:12:09,298 可以预见背叛是唯一的理性策略 254 00:12:09,875 --> 00:12:12,537 但重复博弈并不相同它提供 255 00:12:12,537 --> 00:12:15,798 了许多选择范围简单博弈里只有 256 00:12:15,798 --> 00:12:19,986 两种策略合作或是背叛但重复博弈 257 00:12:20,100 --> 00:12:22,399 可以有很多我们想象得到的策略 258 00:12:22,673 --> 00:12:25,225 并没有任何一个是绝对的最佳 259 00:12:25,236 --> 00:12:28,812 方案比如大部分时间合作而在随机 260 00:12:28,812 --> 00:12:32,136 的时间里背叛这个策略便是成千上万 261 00:12:32,136 --> 00:12:34,111 的策略里中的一个也可以 262 00:12:34,125 --> 00:12:36,673 基于过往历史来选择策略我的 263 00:12:36,700 --> 00:12:39,849 斤斤计较者正是一个例子这种鸟对 264 00:12:39,861 --> 00:12:42,099 脸部有很好的记忆力尽管它 265 00:12:42,111 --> 00:12:44,361 基本采取合作策略但它也会 266 00:12:44,375 --> 00:12:46,700 背叛那些曾经背叛过它的对手 267 00:12:47,274 --> 00:12:50,312 还有一些其他策略可能更为宽容或者 268 00:12:50,325 --> 00:12:53,636 有更短期的记忆显然重复博弈 269 00:12:53,636 --> 00:12:55,711 里可用的策略之多取决于我们 270 00:12:55,711 --> 00:12:58,511 的创造力但我们能够算出哪个 271 00:12:58,524 --> 00:13:01,649 是最佳方案吗阿克塞尔罗德也这么问 272 00:13:01,649 --> 00:13:03,750 自己他想出了一个很具 273 00:13:03,761 --> 00:13:07,187 娱乐性的方案举行一场竞赛他广发 274 00:13:07,187 --> 00:13:09,599 通知让博弈论的专家们来 275 00:13:09,611 --> 00:13:12,774 提交策略在这里策略指的是 276 00:13:12,798 --> 00:13:16,162 事先确定的行动规则所以竞争者 277 00:13:16,187 --> 00:13:20,261 可以用计算机语言编程加入博弈阿克塞尔罗德 278 00:13:20,361 --> 00:13:23,274 总共收到了14个策略为了得到更 279 00:13:23,274 --> 00:13:24,923 好的结果他还加了第 280 00:13:24,923 --> 00:13:28,761 15个策略取名为随机这个策略只是 281 00:13:28,774 --> 00:13:31,399 简单地随机出合作或背叛牌 282 00:13:31,662 --> 00:13:34,625 基本等于无策略如果任何一个其他 283 00:13:34,636 --> 00:13:36,812 策略比随机策略的结果更坏 284 00:13:37,224 --> 00:13:40,461 这一定是个非常差的策略阿克塞尔罗德 285 00:13:40,562 --> 00:13:43,098 将这15个策略翻译成一种常用 286 00:13:43,098 --> 00:13:46,000 的计算机语言在一台大型计算机中 287 00:13:46,111 --> 00:13:49,574 设定这些策略互相博弈每个策略轮流 288 00:13:49,586 --> 00:13:52,787 与其他策略包括它自己进行重复 289 00:13:52,799 --> 00:13:58,187 博弈15个策略总共组成15×15=225个排列 290 00:13:58,187 --> 00:14:01,586 组合在计算机上轮番进行每一个 291 00:14:01,598 --> 00:14:04,750 组合需要进行200回合的博弈所有 292 00:14:04,761 --> 00:14:07,437 输赢累积计算以得出最终的赢家 293 00:14:08,011 --> 00:14:10,875 这里我们不关心某一个策略是否 294 00:14:10,875 --> 00:14:13,774 优于另一个策略我们只关心哪个策略 295 00:14:13,875 --> 00:14:16,037 在与15个对手博弈后最终赢得 296 00:14:16,062 --> 00:14:18,961 最多的钱在这里钱指的 297 00:14:18,961 --> 00:14:21,562 是赢得的分数相互合作的奖赏 298 00:14:21,562 --> 00:14:24,437 为3分背叛的诱惑为5分互相 299 00:14:24,449 --> 00:14:26,986 背叛的惩罚为1分相当于我们早先 300 00:14:27,000 --> 00:14:28,937 例子中的轻判失败的代价 301 00:14:28,961 --> 00:14:30,986 为0分等同于之前例子中的 302 00:14:31,000 --> 00:14:35,312 重罚表12-3阿克塞尔罗德的计算机竞赛我 303 00:14:35,312 --> 00:14:37,336 在各种结果中所得的回报无论 304 00:14:37,336 --> 00:14:39,761 是哪一种策略理论上它们能得到 305 00:14:39,761 --> 00:14:42,625 的最高总分都是15000分每 306 00:14:42,625 --> 00:14:45,549 一回合5分15个对手共有200回合 307 00:14:45,875 --> 00:14:49,261 最低分则是0分不用说这两个 308 00:14:49,261 --> 00:14:52,861 极端都没有实现实际上一个策略如果 309 00:14:52,875 --> 00:14:55,111 能超过15个对手中的平均水平 310 00:14:55,424 --> 00:14:57,924 最多也只能获得比600分高出 311 00:14:57,924 --> 00:15:00,625 一些的分数因为如果双方决定持续 312 00:15:00,636 --> 00:15:03,199 合作每人在200场博弈中都 313 00:15:03,199 --> 00:15:06,537 能得到3分总共便是600分我们可以 314 00:15:06,549 --> 00:15:09,674 将600分作为基准分将所有分数 315 00:15:09,787 --> 00:15:12,586 表达为600分的百分比这么算来 316 00:15:12,986 --> 00:15:15,287 理论上面对一个对手的最高分将 317 00:15:15,287 --> 00:15:19,699 是166%1000分但事实上没有 318 00:15:19,711 --> 00:15:22,299 任何一个策略的平均分超过600分 319 00:15:22,861 --> 00:15:25,562 要知道竞赛中的博弈者并不是 320 00:15:25,574 --> 00:15:28,549 人类而是计算机事先设定好的程序 321 00:15:29,125 --> 00:15:31,074 而基因在这些程序的作者里 322 00:15:31,187 --> 00:15:34,211 事先设定了程序使得它们身体力行地 323 00:15:34,223 --> 00:15:36,586 扮演同样的角色想想第4 324 00:15:36,586 --> 00:15:39,299 章中的计算机对弈与仙女座超级 325 00:15:39,312 --> 00:15:42,500 计算机你可以将这些策略想象成 326 00:15:42,524 --> 00:15:45,562 这些作者的微型代理虽然一个作者 327 00:15:45,662 --> 00:15:47,987 原本可以提交一个以上的策略但 328 00:15:47,987 --> 00:15:50,574 这其实是作弊这表示作者将 329 00:15:50,574 --> 00:15:53,225 在竞争本身中加入策略使得其中 330 00:15:53,237 --> 00:15:55,687 一个角色从另一个角色的牺牲中 331 00:15:55,787 --> 00:15:59,287 得到合作的好处阿克塞尔罗德应该不会接受 332 00:15:59,299 --> 00:16:01,537 这一点有一些交上来的策略 333 00:16:01,562 --> 00:16:04,250 很聪明当然它们远没有其作者 334 00:16:04,261 --> 00:16:08,000 聪明然而最后胜出的策略却是 335 00:16:08,011 --> 00:16:10,612 一个最简单的而且看起来最不 336 00:16:10,612 --> 00:16:13,737 聪明的一个这个策略被称为针锋相对 337 00:16:13,924 --> 00:16:16,287 TitforTat它来自多伦多一位 338 00:16:16,287 --> 00:16:20,125 著名心理学家和博弈学家阿纳托尔拉波波特 339 00:16:20,399 --> 00:16:24,399 AnatolRapoport教授这个策略在第一回合时 340 00:16:24,511 --> 00:16:27,149 采取合作行动然后在接下来的所有 341 00:16:27,162 --> 00:16:29,500 步骤里只是简单复制对手上一 342 00:16:29,500 --> 00:16:32,011 步的行动有了针锋相对策略的 343 00:16:32,024 --> 00:16:36,199 博弈将如何进行呢一如寻常下一步的 344 00:16:36,211 --> 00:16:39,562 出牌完全取决于对手假设另一 345 00:16:39,574 --> 00:16:42,524 对手也选择了针锋相对的策略每一个 346 00:16:42,537 --> 00:16:45,461 策略不止与其他14个对手竞争也 347 00:16:45,461 --> 00:16:48,024 与自己博弈双方都选择以合作 348 00:16:48,136 --> 00:16:51,336 开场第二步中双方都复制对方上 349 00:16:51,336 --> 00:16:54,375 一步的策略仍然采取合作这样 350 00:16:54,750 --> 00:16:58,336 博弈双方持续合作直到游戏结束双方 351 00:16:58,336 --> 00:17:00,761 都能获得100%的600分基准分 352 00:17:01,100 --> 00:17:04,375 那么假设针锋相对与另一个策略老实人 353 00:17:04,386 --> 00:17:09,299 探测器NaiveProber开始博弈事实上老实人 354 00:17:09,311 --> 00:17:12,261 探测器并没有出现在阿克塞尔罗德的博弈 355 00:17:12,275 --> 00:17:14,500 竞赛中但它依然是一个富有 356 00:17:14,511 --> 00:17:17,375 指导性的策略这个策略基本等同 357 00:17:17,375 --> 00:17:20,148 于针锋相对但每隔一会儿比如在 358 00:17:20,162 --> 00:17:22,574 每十步中任意选择一步这个 359 00:17:22,586 --> 00:17:24,724 策略会打出恶意的背叛牌 360 00:17:24,949 --> 00:17:27,112 而获得最高的分数背叛的诱惑 361 00:17:27,686 --> 00:17:29,574 如果老实人探测器不打出其 362 00:17:29,586 --> 00:17:32,424 试探的背叛牌博弈双方便是两个 363 00:17:32,449 --> 00:17:35,011 针锋相对打出一场漫长且互利 364 00:17:35,011 --> 00:17:37,724 的合作牌彼此安稳地获得100% 365 00:17:37,724 --> 00:17:40,511 的基准分但突然间假设在 366 00:17:40,537 --> 00:17:43,450 第8回合老实人探测器出其不意地 367 00:17:43,474 --> 00:17:46,436 背叛了针锋相对却依然不知情地 368 00:17:46,436 --> 00:17:48,936 坚持合作也便只能付出失败者的 369 00:17:48,936 --> 00:17:52,186 代价得到0分而老实人探测器能 370 00:17:52,186 --> 00:17:54,923 得到最高成绩5分但在下一步里 371 00:17:55,250 --> 00:17:58,000 针锋相对开始报复复制了对手上一 372 00:17:58,000 --> 00:17:59,950 步的行动打出了背叛牌 373 00:18:00,325 --> 00:18:03,061 而老实人探测器盲目地继续原本 374 00:18:03,075 --> 00:18:05,311 设定的程序复制对手上一步 375 00:18:05,311 --> 00:18:08,125 的合作牌于是它只能获得0分 376 00:18:08,237 --> 00:18:12,211 而针锋相对得到5分再下一步老实人 377 00:18:12,223 --> 00:18:14,737 探测器极其不公正地又开始了 378 00:18:14,750 --> 00:18:19,325 报复背叛了针锋相对反之亦然在每一 379 00:18:19,325 --> 00:18:21,798 轮交替报复的回合里双方各自 380 00:18:21,811 --> 00:18:25,037 平均获得2.5分5分与0分的平均值 381 00:18:25,612 --> 00:18:28,798 这依然低于双方持续双向合作所 382 00:18:28,798 --> 00:18:31,575 能轻而易举获得的3分这也是本章 383 00:18:31,575 --> 00:18:33,737 前文中尚未解释的特殊情况 384 00:18:33,761 --> 00:18:37,136 的原因于是当老实人探测器与 385 00:18:37,150 --> 00:18:40,461 针锋相对开始博弈双方都未能获得两个 386 00:18:40,487 --> 00:18:43,348 针锋相对博弈时所得的分数而如果 387 00:18:43,375 --> 00:18:45,973 老实人探测器互相对弈其结果只 388 00:18:45,973 --> 00:18:48,936 可能更坏因为这种以牙还牙的冤冤相报 389 00:18:49,048 --> 00:18:51,336 可能开始得更早让我们再 390 00:18:51,336 --> 00:18:55,237 来考虑另一个叫愧疚探测器RemorsefulProber 391 00:18:55,436 --> 00:18:58,275 的策略这个策略有点类似于老实 392 00:18:58,275 --> 00:19:01,325 人探测器但它可以主动终止循环 393 00:19:01,325 --> 00:19:03,798 于双方间的交互背叛这便 394 00:19:03,811 --> 00:19:06,950 需要一种比针锋相对或老实人探测器 395 00:19:06,973 --> 00:19:09,723 更长的记忆愧疚探测器能记住 396 00:19:09,723 --> 00:19:12,799 自己是否刚刚主动背叛或者只是为了 397 00:19:12,811 --> 00:19:16,186 报复如果是后者它便愧疚地 398 00:19:16,299 --> 00:19:18,799 让对手得到一次反击的机会而 399 00:19:18,799 --> 00:19:21,223 不加以报复这便将此循环 400 00:19:21,250 --> 00:19:24,525 报复行为终结在萌芽状态如果你 401 00:19:24,525 --> 00:19:27,711 在想象中旁观愧疚探测器与针锋相对 402 00:19:27,711 --> 00:19:30,574 的博弈你会发现可能的循环 403 00:19:30,586 --> 00:19:34,261 报复行动不攻自破博弈中大部分时间都 404 00:19:34,261 --> 00:19:37,049 采取互相合作使得双方都能获得 405 00:19:37,074 --> 00:19:39,436 相应的高分在与针锋相对的 406 00:19:39,449 --> 00:19:42,174 博弈中愧疚探测器能获得比老实 407 00:19:42,174 --> 00:19:44,461 人探测器更高的分数但依然 408 00:19:44,461 --> 00:19:46,862 没有针锋相对与自己对弈的分数高 409 00:19:47,424 --> 00:19:50,125 阿克塞尔罗德的竞赛里还有一些比老实 410 00:19:50,125 --> 00:19:52,511 人探测器与愧疚探测器更为复杂的 411 00:19:52,525 --> 00:19:55,336 策略但它们平均分都比针锋相对 412 00:19:55,348 --> 00:19:58,924 低事实上最失败的策略除了随机 413 00:19:59,074 --> 00:20:01,223 是最复杂的那一个作者为 414 00:20:01,324 --> 00:20:04,362 匿名这个作者的身份引发了一些 415 00:20:04,386 --> 00:20:08,987 饶有兴趣的猜测五角大楼的高层中央情报局的 416 00:20:09,000 --> 00:20:14,625 首脑国务卿基辛格阿克塞尔罗德自己我们也许永远 417 00:20:14,636 --> 00:20:17,311 也不会知道不是每个策略的细节 418 00:20:17,412 --> 00:20:19,386 都值得研究这本书也不 419 00:20:19,386 --> 00:20:22,000 谈计算机程序员的创造力但我们可以 420 00:20:22,000 --> 00:20:24,211 给这些策略归类并检验这些类别 421 00:20:24,211 --> 00:20:27,811 的成功率阿克塞尔罗德认为最重要的类别 422 00:20:27,811 --> 00:20:31,737 是善良善良类别指的是那些 423 00:20:31,761 --> 00:20:35,761 从不率先背叛的策略针锋相对便是其中 424 00:20:35,775 --> 00:20:38,162 一个例子它虽然也采取背叛的 425 00:20:38,174 --> 00:20:40,174 行动但它只在报复中这么 426 00:20:40,174 --> 00:20:43,449 做老实人探测器与愧疚探测器也 427 00:20:43,461 --> 00:20:46,511 偶尔采取背叛但这种行为是主动 428 00:20:46,525 --> 00:20:49,500 起意挑衅的属于恶意的策略这 429 00:20:49,500 --> 00:20:52,174 场竞赛中的15个策略中有8个 430 00:20:52,186 --> 00:20:55,848 属于善良策略令人吃惊的是策略中 431 00:20:55,848 --> 00:20:57,824 的前8名也是这8个善意的 432 00:20:57,836 --> 00:21:02,348 策略针锋相对的平均分504.5分达到我们 433 00:21:02,375 --> 00:21:05,150 600分基准分的84%是一个很 434 00:21:05,150 --> 00:21:08,186 好的分数其他善良策略所得分数 435 00:21:08,287 --> 00:21:11,949 要比针锋相对少一些从83.4%到 436 00:21:11,961 --> 00:21:15,900 78.6%不等排名中接下来的则是 437 00:21:15,900 --> 00:21:19,924 由格雷斯卡普Graaskamp所获得的66.8% 438 00:21:20,148 --> 00:21:21,737 与高分们有很大差距 439 00:21:22,125 --> 00:21:23,787 而这已经是所有恶意策略中 440 00:21:23,787 --> 00:21:26,162 的最高分了令人信服的结果 441 00:21:26,162 --> 00:21:28,924 表明好人在这个博弈中可以胜出 442 00:21:29,500 --> 00:21:32,511 阿克塞尔罗德提出的另一个术语则是宽容 443 00:21:33,074 --> 00:21:36,537 一个宽容的策略只有短期记忆虽然 444 00:21:36,561 --> 00:21:38,699 它也采取报复行为但它会 445 00:21:38,699 --> 00:21:42,162 很快遗忘对手的劣迹针锋相对便是一个 446 00:21:42,186 --> 00:21:44,699 宽容的策略面对背叛时它毫不 447 00:21:44,699 --> 00:21:47,000 手软但之后则过去的让它 448 00:21:47,011 --> 00:21:49,811 过去第10章中的斤斤计较者 449 00:21:49,836 --> 00:21:51,849 则是一个完全相反的例子它 450 00:21:51,849 --> 00:21:54,625 的记忆持续了整个博弈永不宽恕 451 00:21:54,648 --> 00:21:57,561 曾经背叛过它的对手在阿克塞尔罗德 452 00:21:57,561 --> 00:22:00,336 的竞赛中有一个策略与斤斤计较 453 00:22:00,336 --> 00:22:02,436 者完全相同由一位名叫 454 00:22:02,461 --> 00:22:06,436 弗里德曼Friedman的选手提供这一个善良 455 00:22:06,461 --> 00:22:08,237 而绝不宽恕的策略结果并不 456 00:22:08,237 --> 00:22:10,686 算佳成绩在所有善良策略里 457 00:22:10,686 --> 00:22:13,724 排倒数第二即便对手已经有悔改 458 00:22:13,737 --> 00:22:15,699 之意它也不愿意打破相互 459 00:22:15,711 --> 00:22:18,750 背叛的恶性循环因此无法取得很高 460 00:22:18,750 --> 00:22:22,412 的分数针锋相对并不是最宽容的策略 461 00:22:22,987 --> 00:22:24,449 我们还可以设计一个两报还 462 00:22:24,449 --> 00:22:26,912 一报TitforTwoTats的策略 463 00:22:27,237 --> 00:22:29,612 允许对手连续两次背叛后才开始 464 00:22:29,625 --> 00:22:32,162 报复这似乎显得过分大度坦荡了 465 00:22:32,724 --> 00:22:35,737 阿克塞尔罗德算出只要在竞赛中有 466 00:22:35,761 --> 00:22:37,299 两报还一报策略的存在 467 00:22:37,586 --> 00:22:39,612 它便一定会获得冠军因为它 468 00:22:39,625 --> 00:22:41,750 可以有效避免长期的互相伤害 469 00:22:42,099 --> 00:22:44,523 于是我们算出了赢家策略的 470 00:22:44,548 --> 00:22:47,798 两个特点善良与宽容这几乎是 471 00:22:47,798 --> 00:22:50,598 一个乌托邦式的结论善良与宽容 472 00:22:50,699 --> 00:22:53,424 能得到好报许多专家曾试图 473 00:22:53,436 --> 00:22:55,936 在恶意策略里耍点儿花招认为 474 00:22:55,936 --> 00:22:58,549 这可能得到高分即使那些提交 475 00:22:58,574 --> 00:23:00,912 善良策略的专家也未曾敢如 476 00:23:00,936 --> 00:23:04,148 针锋相对一般宽容所有人都对这个 477 00:23:04,148 --> 00:23:07,799 结论十分惊讶阿克塞尔罗德又举办了第二次 478 00:23:07,811 --> 00:23:11,061 竞赛这次他收到了62个策略再 479 00:23:11,061 --> 00:23:13,787 加上随机策略总共便有了63个 480 00:23:13,799 --> 00:23:17,023 策略这一次博弈中的回合数 481 00:23:17,136 --> 00:23:19,836 不再固定为200而改为开放式 482 00:23:19,836 --> 00:23:22,000 的不定数我之后会解释这么做 483 00:23:22,000 --> 00:23:24,586 的理由我们依然将得分评判为 484 00:23:24,612 --> 00:23:27,474 基准分永远合作分数的百分比不过 485 00:23:27,474 --> 00:23:29,724 现在基准分需要更为复杂的计算 486 00:23:29,961 --> 00:23:32,648 并不再是固定的600分第二次竞赛 487 00:23:32,648 --> 00:23:34,711 的程序员们都得到了第一次竞赛 488 00:23:34,711 --> 00:23:38,250 的结果还收到了阿克塞尔罗德对针锋相对 489 00:23:38,336 --> 00:23:41,761 与善良宽容策略获胜的分析这么 490 00:23:41,761 --> 00:23:43,936 做是为了让参赛者们能 491 00:23:43,936 --> 00:23:46,037 从某种方向上了解比赛的 492 00:23:46,061 --> 00:23:49,673 背景信息来权衡自己的判断事实上 493 00:23:50,025 --> 00:23:53,711 这些参赛者分成两种思路第一种参赛 494 00:23:53,711 --> 00:23:56,848 者认为已经有足够证据证明善良 495 00:23:56,862 --> 00:23:59,798 与宽容确实是获胜因素他们便 496 00:23:59,825 --> 00:24:02,150 随即提交了善良与宽容的策略 497 00:24:02,723 --> 00:24:06,173 参赛者约翰梅纳德史密斯提交了一个 498 00:24:06,200 --> 00:24:07,848 最为宽容的三报还一报 499 00:24:08,136 --> 00:24:11,086 TitforThreeTats的策略另一 500 00:24:11,086 --> 00:24:13,625 组参赛者则认为既然对手们 501 00:24:13,650 --> 00:24:16,287 已经读过了阿克塞尔罗德的分析估计 502 00:24:16,298 --> 00:24:18,886 都会提交善良宽容的策略他们 503 00:24:18,900 --> 00:24:21,400 于是便提交了恶意的策略以期 504 00:24:21,412 --> 00:24:24,450 在善意对手中占到便宜然而 505 00:24:24,886 --> 00:24:27,450 恶意再一次没有得到好报阿纳托尔 506 00:24:27,473 --> 00:24:30,311 提交的针锋相对策略再一次成为赢家 507 00:24:30,625 --> 00:24:34,275 获得了满分的96%善意策略再 508 00:24:34,275 --> 00:24:37,000 一次赢了恶意策略前15名中 509 00:24:37,112 --> 00:24:40,011 只有一个策略是恶意策略而倒数 510 00:24:40,025 --> 00:24:43,636 15名中只有一个是善意策略然而 511 00:24:43,961 --> 00:24:46,525 最为宽容的可以在第一次竞赛中 512 00:24:46,548 --> 00:24:48,250 胜出的两报还一报策略 513 00:24:48,612 --> 00:24:51,699 这次却没有成功这是因为本次 514 00:24:51,711 --> 00:24:53,750 竞赛中有了一些更为狡猾的 515 00:24:53,775 --> 00:24:57,074 恶意策略它们善于伪装自己无情地 516 00:24:57,098 --> 00:24:59,987 抛弃那些善良的人这揭晓了这些竞赛 517 00:24:59,987 --> 00:25:02,211 中非常重要的一点成功的 518 00:25:02,223 --> 00:25:05,287 策略取决于你的对手的策略这是 519 00:25:05,311 --> 00:25:07,561 唯一能解释两次竞赛中的不同 520 00:25:07,574 --> 00:25:10,699 结果的理由然而就像我之前 521 00:25:10,711 --> 00:25:12,900 说过的那样这本书并不是 522 00:25:12,912 --> 00:25:16,311 关于计算机程序员的创造力的那么是否 523 00:25:16,311 --> 00:25:18,261 有一个广泛客观的标准来让 524 00:25:18,261 --> 00:25:20,699 我们判断哪些是真正好的策略 525 00:25:21,275 --> 00:25:23,400 前几章的读者们估计已经开始 526 00:25:23,400 --> 00:25:26,061 准备从生物进化稳定策略理论中 527 00:25:26,162 --> 00:25:29,612 寻找答案了当时的我也是阿克塞尔罗德 528 00:25:29,723 --> 00:25:31,525 传播早期结果的小圈子中的一 529 00:25:31,525 --> 00:25:33,811 员我也被邀请在第二次竞赛 530 00:25:33,811 --> 00:25:36,961 中提交策略我并没有参赛但 531 00:25:36,961 --> 00:25:40,625 我给阿克塞尔罗德提了一个建议阿克塞尔罗德 532 00:25:40,737 --> 00:25:43,250 已经开始考虑进化稳定策略这个理论 533 00:25:43,250 --> 00:25:45,686 了但我觉得这个想法太重要 534 00:25:45,686 --> 00:25:47,862 了于是写信给他建议让他 535 00:25:47,875 --> 00:25:51,662 与汉密尔顿联系一下虽然当时阿克塞尔罗德并 536 00:25:51,662 --> 00:25:55,199 不认识汉密尔顿但汉密尔顿正与阿克塞尔罗德 537 00:25:55,299 --> 00:25:57,787 在同一所大学密歇根大学的另一个 538 00:25:57,799 --> 00:26:02,362 系里阿克塞尔罗德迅速联系了汉密尔顿最终 539 00:26:02,787 --> 00:26:04,737 他们合作的结果是一篇卓越 540 00:26:04,737 --> 00:26:07,525 的论文发表在1981年的科学 541 00:26:07,598 --> 00:26:10,098 杂志上也获得了美国科学促进会 542 00:26:10,362 --> 00:26:14,848 AAAS的纽科姆克里夫兰奖NewcombClevelandPrize 543 00:26:15,412 --> 00:26:19,211 阿克塞尔罗德和汉密尔顿除了讨论重复囚徒困境 544 00:26:19,237 --> 00:26:21,549 在生物学上有趣的例子外我 545 00:26:21,549 --> 00:26:23,449 还觉得他们给予了进化稳定策略 546 00:26:23,461 --> 00:26:25,711 方法应有的认可让我们来比较 547 00:26:25,711 --> 00:26:29,561 一下进化稳定策略与阿克塞尔罗德两次竞赛 548 00:26:29,561 --> 00:26:32,912 中的循环赛机制循环赛好比足球联盟中 549 00:26:32,912 --> 00:26:35,461 的比赛每一个策略都与其他 550 00:26:35,473 --> 00:26:38,761 策略对战同等次数策略的最后得分 551 00:26:38,900 --> 00:26:40,636 则是它与所有其他策略对弈 552 00:26:40,636 --> 00:26:43,636 后的所得总分如果一个策略想 553 00:26:43,636 --> 00:26:45,848 要在竞争中成功它必须在 554 00:26:45,875 --> 00:26:48,362 所有提交的策略中最富有竞争力 555 00:26:48,936 --> 00:26:52,112 阿克塞尔罗德将胜过其他对手的策略定义 556 00:26:52,112 --> 00:26:56,287 为强劲针锋相对便是一个强劲的策略 557 00:26:56,862 --> 00:26:59,112 但参与竞赛的策略对手们则 558 00:26:59,125 --> 00:27:02,125 相当主观只取决于参赛者所提交 559 00:27:02,125 --> 00:27:04,362 的策略水平这一点使我们 560 00:27:04,386 --> 00:27:08,487 相当头疼阿克塞尔罗德的第一个竞赛里刚好 561 00:27:08,500 --> 00:27:11,625 参赛的策略基本都是善意策略所以 562 00:27:11,737 --> 00:27:14,711 针锋相对赢得了竞赛而如果两报 563 00:27:14,737 --> 00:27:16,324 还一报参赛了则会赢 564 00:27:16,324 --> 00:27:19,674 了针锋相对但如果几乎所有参赛策略 565 00:27:19,787 --> 00:27:22,261 都为恶意策略情况就不同了 566 00:27:22,824 --> 00:27:24,799 这个假设发生的概率还是很大 567 00:27:24,799 --> 00:27:27,299 的毕竟人们提交的14个策略中 568 00:27:27,299 --> 00:27:30,549 有6个是恶意策略假如13个策略 569 00:27:30,648 --> 00:27:34,162 全为恶意策略针锋相对则不可能成功 570 00:27:34,474 --> 00:27:36,974 因为环境太差了提交策略的 571 00:27:36,987 --> 00:27:39,674 不同决定了策略所赢得的金钱 572 00:27:39,787 --> 00:27:43,636 和它们的排名位置也就是说竞赛结果 573 00:27:43,662 --> 00:27:47,787 将取决于参赛者的心血来潮那么我们 574 00:27:47,799 --> 00:27:50,898 如何减少竞赛的主观性呢答案是 575 00:27:51,199 --> 00:27:54,711 进化稳定策略你也许还记得进化 576 00:27:54,724 --> 00:27:57,299 稳定策略在众多的种群策略中 577 00:27:57,412 --> 00:27:59,912 占有许多席位也一直得到不错的 578 00:27:59,924 --> 00:28:03,961 结果如果说针锋相对是一种进化稳定 579 00:28:03,974 --> 00:28:07,586 策略这便是说针锋相对策略在充满 580 00:28:07,612 --> 00:28:10,011 针锋相对策略的大环境下能得到 581 00:28:10,037 --> 00:28:12,662 不错的结果这便是一种特殊的 582 00:28:12,674 --> 00:28:16,000 强劲作为进化论者我们一直很想 583 00:28:16,011 --> 00:28:18,349 找到一种唯一的可以直接决定结果 584 00:28:18,349 --> 00:28:21,424 的强劲为什么这很重要呢因为 585 00:28:21,436 --> 00:28:24,386 在达尔文主义的世界里成功并不是赢得 586 00:28:24,398 --> 00:28:28,261 金钱而是获得后裔对于一个达尔文主义者 587 00:28:28,561 --> 00:28:30,537 一个成功的策略将是一个在 588 00:28:30,549 --> 00:28:33,699 策略种群中数量众多的策略如果 589 00:28:33,699 --> 00:28:36,074 这个策略要保持成功它必须在 590 00:28:36,099 --> 00:28:38,811 同类众多时也就是充满了自身拷贝 591 00:28:38,811 --> 00:28:40,625 的大环境中得到特别好的 592 00:28:40,636 --> 00:28:41,000 结果 593 00:28:41,099 --> 00:28:45,423 阿克塞尔罗德又模仿自然选择进行了第三场竞赛 594 00:28:45,525 --> 00:28:49,086 来寻找进化稳定策略事实上他并 595 00:28:49,086 --> 00:28:51,598 没有称之为第三次竞赛因为他并没有 596 00:28:51,612 --> 00:28:53,787 邀请新的参赛者而只是使用 597 00:28:53,787 --> 00:28:56,511 了第二次竞赛中的63个策略但 598 00:28:56,511 --> 00:28:58,724 我觉得称它为第三次竞赛比较 599 00:28:58,724 --> 00:29:01,324 合适因为它和前两次循环赛有 600 00:29:01,324 --> 00:29:05,186 根本性的不同阿克塞尔罗德将这63个策略 601 00:29:05,287 --> 00:29:07,849 再次丢给计算机来制造进化演替 602 00:29:07,849 --> 00:29:10,662 的第一代第一代的大环境中由 603 00:29:10,662 --> 00:29:14,561 这63个策略组成结束后赢家不再 604 00:29:14,575 --> 00:29:17,912 得到金钱或者分数而是与其完全相同 605 00:29:17,912 --> 00:29:22,173 的后代世世代代如此传递一些策略逐渐 606 00:29:22,186 --> 00:29:25,398 变得数目稀少甚至完全绝迹另一些 607 00:29:25,412 --> 00:29:28,761 策略则数目众多当环境中策略的 608 00:29:28,773 --> 00:29:31,423 比例出现变化博弈中策略的出 609 00:29:31,423 --> 00:29:34,000 牌也在随之变化最终在 610 00:29:34,023 --> 00:29:37,375 1000代之后种群不再变化环境 611 00:29:37,398 --> 00:29:39,548 也没有再改变稳定的状态已经 612 00:29:39,548 --> 00:29:43,250 形成在此之前各种策略的命运起伏 613 00:29:43,250 --> 00:29:46,400 不定正如我模拟的骗子傻瓜和 614 00:29:46,423 --> 00:29:49,298 斤斤计较者的命运一样一些策略在 615 00:29:49,311 --> 00:29:52,298 博弈开始便已经灭绝大多数则在 616 00:29:52,325 --> 00:29:55,500 200代之后彻底灭绝在那些恶意 617 00:29:55,511 --> 00:29:58,700 策略中有一两个一开始蓬勃发展但 618 00:29:58,711 --> 00:30:00,875 它们的繁荣正如我的模拟预测 619 00:30:00,886 --> 00:30:04,061 一样只是昙花一现唯一活过200代 620 00:30:04,061 --> 00:30:07,237 的一个策略叫作哈灵顿Harrington它的 621 00:30:07,250 --> 00:30:10,973 数目在前150代中直线上升而后 622 00:30:11,000 --> 00:30:13,798 逐渐减少在1000代之后终于 623 00:30:13,811 --> 00:30:17,261 完全灭绝哈灵顿短期繁荣的原因跟 624 00:30:17,261 --> 00:30:19,287 我的骗子是一样的当那些 625 00:30:19,311 --> 00:30:20,586 如两报还一报之类的 626 00:30:20,598 --> 00:30:23,875 老实人过于宽容还在世时它 627 00:30:23,886 --> 00:30:26,612 欺负它们以获得发展但在这些 628 00:30:26,625 --> 00:30:29,650 老实人消失之后哈灵顿失去了猎物 629 00:30:29,936 --> 00:30:31,923 也跟随着它们的命运而灭绝 630 00:30:32,500 --> 00:30:35,750 剩下的策略都类似于针锋相对既 631 00:30:35,750 --> 00:30:39,586 善良又容易被煽动报复针锋相对本身 632 00:30:39,598 --> 00:30:42,423 在第三轮竞赛中6次中有5次 633 00:30:42,423 --> 00:30:45,048 得了第一重复其在第一二次 634 00:30:45,061 --> 00:30:47,875 竞赛时的好运另外5个虽善良 635 00:30:47,973 --> 00:30:49,936 但容易报复的策略则几乎和 636 00:30:49,961 --> 00:30:53,299 针锋相对一样成功在种群数目上还有 637 00:30:53,311 --> 00:30:55,525 一个策略甚至赢了第6次博弈 638 00:30:56,098 --> 00:30:58,636 当所有恶意策略都灭绝后所有 639 00:30:58,636 --> 00:31:01,362 的善良策略与针锋相对都无法辨认 640 00:31:01,375 --> 00:31:04,011 彼此了因为它们都很善良只是 641 00:31:04,025 --> 00:31:06,787 简单地与所有对手合作到底这种 642 00:31:06,811 --> 00:31:09,949 无法辨认的情况使得针锋相对在严格 643 00:31:09,949 --> 00:31:12,174 意义上不是一个真正的进化稳定 644 00:31:12,186 --> 00:31:15,473 策略即使它看起来确实很像一个 645 00:31:15,487 --> 00:31:18,973 策略要成为进化稳定策略意味着当 646 00:31:18,973 --> 00:31:21,211 它是常见策略时它不可被 647 00:31:21,237 --> 00:31:24,936 少数变异策略同化虽然针锋相对不会被 648 00:31:24,961 --> 00:31:27,862 任何恶意策略同化但另一个善良策略 649 00:31:27,886 --> 00:31:30,761 可能做到正如我们所看到的在 650 00:31:30,775 --> 00:31:33,324 善意策略的群体里它们面目模糊 651 00:31:33,612 --> 00:31:38,625 行为相同始终合作因此有一些其他善良 652 00:31:38,636 --> 00:31:41,848 策略比如永远合作这种选择优势不如 653 00:31:41,875 --> 00:31:44,598 针锋相对的策略也可以溜进种群 654 00:31:44,598 --> 00:31:46,973 里而不被发现所以严格地 655 00:31:46,973 --> 00:31:51,086 说针锋相对并不是进化稳定策略你也许 656 00:31:51,098 --> 00:31:54,250 会认为如果世界充满善良我们便 657 00:31:54,250 --> 00:31:57,424 可以认为针锋相对是一个进化稳定策略 658 00:31:57,424 --> 00:32:01,061 了但即使如此接下来的故事也 659 00:32:01,074 --> 00:32:04,412 并不如意永远合作与针锋相对不同 660 00:32:04,836 --> 00:32:06,711 它并不能抵挡一些恶意策略的 661 00:32:06,723 --> 00:32:10,324 入侵比如永远背叛的攻击便可以 662 00:32:10,324 --> 00:32:13,098 打败永远合作它可以每次都得到 663 00:32:13,125 --> 00:32:16,436 背叛诱惑的最高分类似永远背叛 664 00:32:16,461 --> 00:32:19,037 这样的恶意策略会减少过分善良 665 00:32:19,049 --> 00:32:22,586 策略的数目比如永远合作虽然严格 666 00:32:22,586 --> 00:32:26,037 来说针锋相对并不是一个真正的进化稳定 667 00:32:26,049 --> 00:32:28,586 策略但在实际操作中将这 668 00:32:28,586 --> 00:32:32,086 一类基本善意又宽容与针锋相对类似 669 00:32:32,086 --> 00:32:35,136 的策略近似看作进化稳定策略也是 670 00:32:35,150 --> 00:32:38,061 可行的这一类策略里甚至可以 671 00:32:38,074 --> 00:32:41,636 包括一小部分恶意策略阿克塞尔罗德的研究 672 00:32:41,662 --> 00:32:46,311 后继有人罗伯特博伊德与杰弗里洛伯鲍姆的研究 673 00:32:46,311 --> 00:32:49,037 成果是这些后续研究中最为有趣 674 00:32:49,037 --> 00:32:51,112 的他们将两报还一报 675 00:32:51,136 --> 00:32:53,912 与另一个针锋相对多疑版SuspiciousTitfor 676 00:32:53,924 --> 00:32:57,574 Tat的策略组合到一块儿针锋相对多疑 677 00:32:57,574 --> 00:33:00,561 版近似于针锋相对但本质上是 678 00:33:00,561 --> 00:33:02,987 一个恶意策略虽然恶意程度不高 679 00:33:03,537 --> 00:33:06,824 它只在第一回合采取背叛行动之后 680 00:33:06,824 --> 00:33:09,811 的所有出牌与针锋相对完全相同 681 00:33:10,375 --> 00:33:12,561 在一个针锋相对占主要地位的环境 682 00:33:12,561 --> 00:33:15,761 中针锋相对多疑版并不走运因为 683 00:33:15,761 --> 00:33:18,023 它的先行背叛导致了互相背叛 684 00:33:18,023 --> 00:33:20,386 的恶性循环但当它遇上了 685 00:33:20,412 --> 00:33:22,162 两报还一报时这场 686 00:33:22,186 --> 00:33:24,875 冤冤相报因对方的慈爱宽恕化解了 687 00:33:25,074 --> 00:33:28,086 双方都能至少得到满分而针锋相对 688 00:33:28,112 --> 00:33:29,787 多疑版还会因为其最初的 689 00:33:29,799 --> 00:33:32,750 背叛而获得更高的分数博伊德 690 00:33:32,773 --> 00:33:35,737 和洛伯鲍姆的研究结果表明针锋相对的 691 00:33:35,750 --> 00:33:37,787 群体可以被两报还一报 692 00:33:37,811 --> 00:33:40,186 与针锋相对多疑版的组合入侵影响 693 00:33:40,761 --> 00:33:43,086 从进化论角度上说则是两 694 00:33:43,086 --> 00:33:45,136 报还一报与针锋相对多疑版 695 00:33:45,162 --> 00:33:48,362 共生繁荣进而影响了针锋相对的种群 696 00:33:48,936 --> 00:33:52,287 几乎可以肯定这种组合不仅不会消亡 697 00:33:52,599 --> 00:33:55,099 还会以这种方式入侵相对稳定 698 00:33:55,099 --> 00:33:58,737 的种群事实上也许还有很多其他稍微 699 00:33:58,750 --> 00:34:01,375 恶意与极度圣洁策略的组合可以 700 00:34:01,386 --> 00:34:04,761 入侵种群有人也许可以从这里看到 701 00:34:04,862 --> 00:34:05,974 人类生活的对照 702 00:34:06,099 --> 00:34:09,898 阿克塞尔罗德意识到针锋相对并不是严格意义上的 703 00:34:09,923 --> 00:34:12,949 进化稳定策略于是他又创造了 704 00:34:12,961 --> 00:34:16,561 一个术语集体稳定策略由于在真正 705 00:34:16,561 --> 00:34:19,112 的进化稳定策略中可以有不止一个 706 00:34:19,125 --> 00:34:22,811 策略同时达成集体稳定另一方面决定一个 707 00:34:22,824 --> 00:34:25,887 策略是否可以控制种群更取决于其 708 00:34:25,898 --> 00:34:28,849 运气因此永远背叛的策略也可以 709 00:34:28,862 --> 00:34:31,836 和针锋相对一样稳定在一个被永远 710 00:34:31,849 --> 00:34:34,300 背叛控制了的种群中没有任何 711 00:34:34,311 --> 00:34:37,273 其他策略可以取胜我们也可以将 712 00:34:37,286 --> 00:34:40,074 这种系统称为双稳态而将永远 713 00:34:40,086 --> 00:34:43,612 背叛作为其中一个稳定点针锋相对或者 714 00:34:43,625 --> 00:34:46,186 其他最善良宽容策略的组合为 715 00:34:46,211 --> 00:34:48,936 另一个稳定点无论哪一方首先在 716 00:34:48,961 --> 00:34:51,762 种群中达到数量优势都将继续 717 00:34:51,773 --> 00:34:56,324 保持稳定然而这个数量优势如何量化 718 00:34:56,887 --> 00:35:00,273 一个群体中究竟需要多少针锋相对来 719 00:35:00,273 --> 00:35:04,061 保证其战胜永远背叛这取决于银行家 720 00:35:04,086 --> 00:35:05,911 愿意在这场博弈中付出的 721 00:35:05,936 --> 00:35:08,487 具体数额我们可以将此概括为 722 00:35:08,512 --> 00:35:11,875 一个决胜点如果针锋相对可以超过这个 723 00:35:11,887 --> 00:35:15,387 决胜点自然选择便会愈加偏爱针锋相对 724 00:35:15,961 --> 00:35:19,150 另一方面如果永远背叛超出了这个决胜 725 00:35:19,150 --> 00:35:22,599 点自然选择则会更加偏爱它你 726 00:35:22,599 --> 00:35:24,650 也许还记得我们在第10章 727 00:35:24,673 --> 00:35:27,362 斤斤计较者与骗子的故事里也曾 728 00:35:27,375 --> 00:35:30,536 与这个决胜点相遇过于是获胜 729 00:35:30,536 --> 00:35:33,574 的关键显然取决于哪一方首先超过 730 00:35:33,586 --> 00:35:36,862 决胜点而且我们还需要知道有时 731 00:35:36,887 --> 00:35:39,387 主导种群还会变化从一方变成 732 00:35:39,411 --> 00:35:42,349 另一方我们假设现有的种群已经 733 00:35:42,349 --> 00:35:45,036 由永远背叛主导了少数派的 734 00:35:45,061 --> 00:35:48,275 针锋相对难以互相碰面以获得共享利益 735 00:35:48,836 --> 00:35:52,036 自然选择于是将该种群推向了永远 736 00:35:52,048 --> 00:35:55,612 背叛的极致只有该种群通过随机转换 737 00:35:55,936 --> 00:35:58,987 使主导的一方变为针锋相对它才能 738 00:35:59,012 --> 00:36:02,173 继续推进针锋相对的发展使得所有人 739 00:36:02,199 --> 00:36:04,887 都能从银行家或者自然处得到 740 00:36:04,900 --> 00:36:09,012 利益然而种群没有集体意愿也没有 741 00:36:09,036 --> 00:36:12,173 集体意识或目的它们不能控制发展走向 742 00:36:12,737 --> 00:36:15,375 主导方的转换只能发生在自然界 743 00:36:15,375 --> 00:36:18,175 间接力量的作用下这种情况如何 744 00:36:18,175 --> 00:36:21,436 发生呢一种回答是运气但这个 745 00:36:21,436 --> 00:36:24,536 单词只能显示无知它表示由一些 746 00:36:24,561 --> 00:36:27,449 尚未知道未能分辨的方式来决定 747 00:36:28,025 --> 00:36:30,862 我们可以比运气做得更好一些我们可以 748 00:36:30,875 --> 00:36:34,436 想象少数派的针锋相对个体如何通过一个 749 00:36:34,461 --> 00:36:37,711 实际方法来增加其关键数目探索 750 00:36:37,737 --> 00:36:40,737 针锋相对个体如何集合成足够的数量 751 00:36:41,099 --> 00:36:43,400 使它们都可以从银行家处得到 752 00:36:43,411 --> 00:36:47,300 回报这种想法貌似可行但实际上机会 753 00:36:47,300 --> 00:36:50,487 渺茫这些相似的个体如何在小 754 00:36:50,487 --> 00:36:53,362 范围内集合到一起在自然界中 755 00:36:53,612 --> 00:36:56,099 最明显的方式是因基因关系 756 00:36:56,300 --> 00:36:59,862 亲属而集合大多数动物喜欢同自己 757 00:36:59,862 --> 00:37:02,250 的兄弟姐妹与表亲们而不是 758 00:37:02,275 --> 00:37:04,987 种群中其他成员居住在一起这 759 00:37:05,000 --> 00:37:07,911 并不一定是出于选择而是自动跟随 760 00:37:07,936 --> 00:37:10,775 种群中的黏性这里的黏性指 761 00:37:10,775 --> 00:37:13,186 的是任何使个体持续居住于 762 00:37:13,211 --> 00:37:15,737 出生地的趋势比如在人类历史 763 00:37:15,737 --> 00:37:18,074 上大部分地区的人都只居住 764 00:37:18,074 --> 00:37:20,525 在出生地以外几英里的地方虽然 765 00:37:20,550 --> 00:37:24,449 现代社会已经不再如此因此以亲属 766 00:37:24,449 --> 00:37:27,099 关系为线索的小团体逐渐形成 767 00:37:27,661 --> 00:37:29,561 我曾经到访过爱尔兰西海岸 768 00:37:29,661 --> 00:37:31,536 一个偏远的岛令我吃惊的 769 00:37:31,536 --> 00:37:34,637 是那里几乎所有人都拥有巨大 770 00:37:34,637 --> 00:37:37,425 的耳朵其中的原因很难解释为 771 00:37:37,512 --> 00:37:39,925 大耳朵适应当地天气那里岸边的 772 00:37:39,925 --> 00:37:42,400 风特别大这只能是因为岛 773 00:37:42,400 --> 00:37:45,061 上大多数居民都是亲缘相近的亲属 774 00:37:45,637 --> 00:37:48,099 基因相近的亲属们不仅面部特征 775 00:37:48,112 --> 00:37:51,849 相似其他方面也有相近之处比如 776 00:37:52,224 --> 00:37:54,525 他们会因其基因趋势而互相 777 00:37:54,536 --> 00:37:58,786 模仿着采用或不采用针锋相对于是 778 00:37:59,137 --> 00:38:02,262 即使针锋相对在种群整体中已经稀少 779 00:38:02,650 --> 00:38:05,362 它依然可能在局部广泛使用在 780 00:38:05,375 --> 00:38:08,324 这个小圈子里针锋相对的个体可以 781 00:38:08,324 --> 00:38:11,125 互相博弈采取互相合作的方式来 782 00:38:11,137 --> 00:38:14,125 达到数目繁荣即使在总体计算里 783 00:38:14,224 --> 00:38:18,012 它们依然处于弱势地位由此最初仅 784 00:38:18,025 --> 00:38:20,949 占领小片地区的针锋相对个体将随着 785 00:38:20,974 --> 00:38:23,675 小团体的逐渐扩大逐渐向其他 786 00:38:23,675 --> 00:38:26,773 地区分散甚至包括永远背叛群体占 787 00:38:26,773 --> 00:38:29,148 主导的地区如果用区域地理的 788 00:38:29,161 --> 00:38:31,737 方式思考我举的爱尔兰岛的例子 789 00:38:31,849 --> 00:38:34,224 则有些误导因为那里的人被 790 00:38:34,237 --> 00:38:37,398 自然地理隔绝了想象另一个例子在 791 00:38:37,411 --> 00:38:39,711 迁入人口不多的人群中即使 792 00:38:39,724 --> 00:38:41,375 这片地区的人们已经有了 793 00:38:41,398 --> 00:38:44,349 广泛持续的亲缘关系所有人也只 794 00:38:44,362 --> 00:38:48,050 复制近邻而不是远邻的行为回头 795 00:38:48,050 --> 00:38:51,375 看看针锋相对是可以超越决胜点的 796 00:38:51,648 --> 00:38:53,686 它所需的只是这些个体的 797 00:38:53,699 --> 00:38:56,262 聚合这一点在自然选择里可以 798 00:38:56,273 --> 00:38:59,311 很自然地发生这个与生俱来的优点 799 00:38:59,425 --> 00:39:02,387 使得针锋相对即使在数目稀少的时候 800 00:39:02,661 --> 00:39:05,237 也可以成功跨越决胜点而获得 801 00:39:05,237 --> 00:39:09,262 成功但这个跨越只是单向的永远 802 00:39:09,273 --> 00:39:11,887 背叛作为一个真正的进化稳定策略 803 00:39:12,237 --> 00:39:14,512 并不可以使用个体聚合来跨越 804 00:39:14,536 --> 00:39:17,961 决胜点相反的是永远背叛个体 805 00:39:17,961 --> 00:39:20,648 的聚合不仅不能彼此互助而获得 806 00:39:20,675 --> 00:39:23,061 群体繁荣还会使各自的生存 807 00:39:23,061 --> 00:39:27,112 环境更加恶劣它们无法暗自帮助对方 808 00:39:27,211 --> 00:39:29,925 获得银行家的奖赏而只能把对方 809 00:39:29,949 --> 00:39:34,137 也拖下水于是与针锋相对相反永远 810 00:39:34,148 --> 00:39:36,836 背叛在亲属或种群聚合中得不到 811 00:39:36,862 --> 00:39:41,324 任何帮助所以即使针锋相对并非真正的 812 00:39:41,349 --> 00:39:43,811 进化稳定策略它却拥有更高 813 00:39:43,811 --> 00:39:47,074 的稳定性这意味着什么如果我们用 814 00:39:47,099 --> 00:39:49,675 长远的目光来看永远背叛可以在 815 00:39:49,699 --> 00:39:51,786 相当长的一段时间内抵制其他 816 00:39:51,800 --> 00:39:53,750 策略的影响但如果我们等上 817 00:39:53,773 --> 00:39:56,175 很长一段时间也许是几千年后 818 00:39:56,500 --> 00:39:59,211 针锋相对将最终聚集到足够的数目 819 00:39:59,324 --> 00:40:02,887 跨越决胜点其数量终将反弹而 820 00:40:02,911 --> 00:40:05,849 反方向的发展并不可能永远背叛 821 00:40:05,875 --> 00:40:08,762 无法在个体聚集中获得好处因此 822 00:40:08,887 --> 00:40:10,849 也无法得到这种更高的稳定性 823 00:40:11,099 --> 00:40:14,061 如我们之前所见针锋相对是一个 824 00:40:14,086 --> 00:40:16,849 善良的策略这表示它永远不会 825 00:40:16,875 --> 00:40:19,737 首先背叛它又是一个宽容的策略 826 00:40:20,050 --> 00:40:22,737 表示它对过往的恩怨只有短期 827 00:40:22,750 --> 00:40:26,961 记忆阿克塞尔罗德对针锋相对还有另一个令人回味 828 00:40:26,961 --> 00:40:30,125 的定义不嫉妒在阿克塞尔罗德的定义 829 00:40:30,125 --> 00:40:32,648 中嫉妒是希望获得比对手更多 830 00:40:32,648 --> 00:40:35,875 的金钱而不是追求从银行家手中 831 00:40:35,875 --> 00:40:38,625 得到绝对数量较大的收获不嫉妒 832 00:40:38,637 --> 00:40:40,586 表示当对手获得与你一样的 833 00:40:40,599 --> 00:40:43,099 金钱时只要大家都能从银行家 834 00:40:43,099 --> 00:40:45,673 处获得更大收获你也同样 835 00:40:45,673 --> 00:40:49,686 高兴针锋相对从没有赢得比赛它从未 836 00:40:49,699 --> 00:40:51,898 从其对手处获得更多的利益 837 00:40:52,211 --> 00:40:55,686 因为它除了报复之外从未背叛它 838 00:40:55,686 --> 00:40:57,523 能得到的最好结果是与对手 839 00:40:57,548 --> 00:41:00,362 分享平局但它尽量争取在每 840 00:41:00,362 --> 00:41:02,199 一场对弈中都能获得尽量 841 00:41:02,211 --> 00:41:05,586 高的共享分数当我们考虑针锋相对 842 00:41:05,686 --> 00:41:08,324 与其他策略时对手一词其实 843 00:41:08,324 --> 00:41:11,599 并不准确然而令人失望的是 844 00:41:11,949 --> 00:41:14,398 当心理学家在人群中实验重复 845 00:41:14,423 --> 00:41:17,186 囚徒困境的博弈时几乎所有选手 846 00:41:17,211 --> 00:41:19,173 都会嫉妒于是获得的金钱也 847 00:41:19,186 --> 00:41:21,775 并不多这表示许多人在 848 00:41:21,786 --> 00:41:24,686 潜意识中更倾向于击败对手而 849 00:41:24,686 --> 00:41:28,686 不是与他人一同合作击败银行家阿克塞尔罗德 850 00:41:28,686 --> 00:41:31,099 的实验表明这是一个多么严重的 851 00:41:31,112 --> 00:41:33,750 错误但在所有博弈里并不 852 00:41:33,750 --> 00:41:37,048 都是错误博弈理论家将博弈分为零 853 00:41:37,048 --> 00:41:40,286 和与非零和两种零和博弈指一方 854 00:41:40,286 --> 00:41:43,186 的胜出即是对方的损失棋类 855 00:41:43,199 --> 00:41:46,298 游戏便是一种零和博弈因为博弈双方 856 00:41:46,298 --> 00:41:49,275 的目标是胜过对方使对方产生 857 00:41:49,286 --> 00:41:52,836 损失囚徒困境则是一种非零和博弈 858 00:41:53,099 --> 00:41:56,512 在这里银行家支付了金钱博弈双方 859 00:41:56,536 --> 00:41:59,349 可以携手合作一起笑到最后这 860 00:41:59,349 --> 00:42:01,211 让我想起了莎士比亚写过的 861 00:42:01,324 --> 00:42:03,574 一句精彩的台词我们要做 862 00:42:03,574 --> 00:42:05,661 的第一件事就是把所有律师 863 00:42:05,686 --> 00:42:08,811 都先杀了亨利六世在所谓民事 864 00:42:08,824 --> 00:42:11,525 争议中事实上经常有很大空间 865 00:42:11,548 --> 00:42:14,423 可以合作一个看似零和博弈的争议 866 00:42:14,536 --> 00:42:17,061 也许只要加入少许善意便可以转化 867 00:42:17,061 --> 00:42:20,800 为双方互利的非零和博弈下面拿 868 00:42:20,800 --> 00:42:23,711 离婚作为例子一段好的婚姻明显 869 00:42:23,724 --> 00:42:26,375 是一个非零和博弈充满了互助合作 870 00:42:26,375 --> 00:42:29,699 的空间即使它瓦解夫妻依然可以 871 00:42:29,724 --> 00:42:32,786 继续合作以非零和博弈来看待离婚 872 00:42:33,025 --> 00:42:35,811 并从中得到好处如果孩子抚养权 873 00:42:35,811 --> 00:42:38,199 的判决问题并不是一个足够劝服 874 00:42:38,199 --> 00:42:40,612 夫妻合作的理由双方律师的高昂 875 00:42:40,612 --> 00:42:43,012 费用也许更有说服力因为它将 876 00:42:43,012 --> 00:42:46,849 给家庭财政造成巨大创伤那么如果 877 00:42:46,862 --> 00:42:49,625 一对理性文明的夫妻从一开始便一起 878 00:42:49,637 --> 00:42:52,086 雇用同一个律师这是不是更合理 879 00:42:52,086 --> 00:42:54,961 呢答案却是否定的至少在 880 00:42:54,974 --> 00:42:58,199 英格兰还有今天美国几乎50个州中 881 00:42:58,411 --> 00:43:01,400 法律或者更严格地说律师本身 882 00:43:01,400 --> 00:43:03,362 的职业规范并不允许他们这么 883 00:43:03,362 --> 00:43:06,311 做律师只能接受夫妻双方中的 884 00:43:06,411 --> 00:43:08,925 一位作为客户而拒绝另一方 885 00:43:09,161 --> 00:43:11,949 迫使对方去寻找另一个律师或者完全 886 00:43:11,961 --> 00:43:15,000 失去法律服务这便是乐趣的开始 887 00:43:15,574 --> 00:43:18,286 在另一个房间里律师们开始谈 888 00:43:18,387 --> 00:43:20,862 我们和他们这里的我们指的 889 00:43:20,875 --> 00:43:23,250 不是我和我的妻子而是我 890 00:43:23,250 --> 00:43:24,686 和我的律师对抗她与她 891 00:43:24,686 --> 00:43:27,400 的律师法庭上陈述的则是 892 00:43:27,425 --> 00:43:30,849 史密斯诉史密斯英国妻子多用夫姓 893 00:43:31,237 --> 00:43:34,311 无论夫妻双方是否感觉抗拒对方或者 894 00:43:34,324 --> 00:43:37,400 他们是否愿意和睦解决问题法庭已经 895 00:43:37,411 --> 00:43:40,762 假设他们之间存在对抗关系谁能 896 00:43:40,762 --> 00:43:41,925 在这场我赢你便输 897 00:43:41,949 --> 00:43:45,300 的游戏里胜出呢只有律师倒霉 898 00:43:45,300 --> 00:43:46,724 的夫妻被拖进了这么一 899 00:43:46,724 --> 00:43:49,025 场零和博弈中律师们则 900 00:43:49,036 --> 00:43:51,786 可以享有油水肥厚的非零和博弈因为 901 00:43:51,811 --> 00:43:54,262 史密斯夫妇提供了回报而律师们 902 00:43:54,286 --> 00:43:56,836 专业剥削顾客的方式已经通过行业 903 00:43:56,849 --> 00:43:59,675 合作精细地被规范了他们合作 904 00:43:59,675 --> 00:44:02,275 的一种方式是提出知道对方完全 905 00:44:02,286 --> 00:44:04,775 不会接受的提议这可以激发对方 906 00:44:04,875 --> 00:44:06,987 提出另一个明知双方都不会接受的 907 00:44:07,000 --> 00:44:10,961 提议循环往复这些事实合作的对手所 908 00:44:10,961 --> 00:44:12,775 发的每一封律师函每 909 00:44:12,775 --> 00:44:14,949 一个电话都在账单上多加一笔 910 00:44:14,961 --> 00:44:18,750 数目运气不好的话这个过程将持续 911 00:44:18,775 --> 00:44:21,925 几个月甚至几年双方的花费越来越多 912 00:44:22,474 --> 00:44:24,137 律师们并不需要坐在一起 913 00:44:24,161 --> 00:44:27,536 计算这些事情相反他们严格的独立性 914 00:44:27,637 --> 00:44:29,824 正是他们合作的主要方式以此 915 00:44:29,836 --> 00:44:32,762 消耗着顾客的腰包律师们甚至 916 00:44:32,773 --> 00:44:34,561 都没有感觉到他们所做的 917 00:44:34,574 --> 00:44:37,675 一切正是一个非零和博弈就像我们 918 00:44:37,686 --> 00:44:40,099 有时见到的吸血蝙蝠一样他们以 919 00:44:40,112 --> 00:44:42,300 一种精心设计的仪式进行着这 920 00:44:42,300 --> 00:44:45,449 场游戏这个系统无须任何有意识的 921 00:44:45,461 --> 00:44:49,449 计划或者组织已然自成一体它逼迫我们 922 00:44:49,561 --> 00:44:51,849 走进一场零和博弈顾客们 923 00:44:51,875 --> 00:44:54,125 得到了零律师们得到了丰厚 924 00:44:54,125 --> 00:44:56,148 的非零我们该怎么做呢 925 00:44:56,711 --> 00:44:59,786 莎士比亚的方法太过残酷单单改变 926 00:44:59,800 --> 00:45:02,875 法律就简单多了但大多数国会 927 00:45:02,875 --> 00:45:05,699 议员有法律背景只有零和博弈 928 00:45:05,724 --> 00:45:09,711 心理很难想象哪里存在比英国下议院更 929 00:45:09,711 --> 00:45:12,237 具对抗性的氛围了法庭至少还 930 00:45:12,237 --> 00:45:14,711 保持了辩论的斯文因为律师们 931 00:45:14,711 --> 00:45:16,375 可以抱着我博学的朋友将 932 00:45:16,387 --> 00:45:18,012 和我合作而笑到最后的 933 00:45:18,023 --> 00:45:20,836 心理也许那些用心良苦的立法者和 934 00:45:20,849 --> 00:45:23,411 良心发现的律师需要学一点博弈论 935 00:45:23,974 --> 00:45:26,300 只要律师以完全相反的方式工作 936 00:45:26,586 --> 00:45:28,711 劝说顾客们放弃零和博弈的 937 00:45:28,724 --> 00:45:31,237 厮杀就可以从庭外和解的 938 00:45:31,262 --> 00:45:34,762 非零和博弈中得到更多好处那么人类 939 00:45:34,762 --> 00:45:37,250 生活中的其他博弈呢哪些是 940 00:45:37,262 --> 00:45:41,061 零和哪些又是非零和它们并不相同 941 00:45:41,625 --> 00:45:43,849 我们应该在生活的哪些方面追求 942 00:45:43,875 --> 00:45:46,398 零和博弈又在哪些方面追求 943 00:45:46,398 --> 00:45:49,625 非零和博弈呢生活中哪些方面值得 944 00:45:49,637 --> 00:45:52,773 嫉妒哪些又值得合作并打败银行家 945 00:45:52,773 --> 00:45:55,487 呢举个例子当我们和老板 946 00:45:55,512 --> 00:45:58,061 对工资讨价还价时我们是被嫉妒 947 00:45:58,074 --> 00:46:00,862 驱使还是通过合作让我们的真实 948 00:46:00,875 --> 00:46:03,523 收入最大化呢在现实生活中 949 00:46:04,023 --> 00:46:06,000 我们是否把非零和博弈误会为零 950 00:46:06,000 --> 00:46:08,349 和博弈正如我们在那个心理实验 951 00:46:08,349 --> 00:46:11,161 中一样呢我只能简单提出这些 952 00:46:11,186 --> 00:46:13,648 复杂的问题因为他们的答案已经 953 00:46:13,648 --> 00:46:15,250 超出本书涵盖的范围了 954 00:46:16,099 --> 00:46:18,936 足球就是一场零和博弈至少 955 00:46:18,961 --> 00:46:21,862 它一般是这样少数情况下它 956 00:46:21,862 --> 00:46:24,525 能变成一个非零和博弈英式橄榄球 957 00:46:24,824 --> 00:46:28,737 澳大利亚橄榄球美式橄榄球爱尔兰橄榄球则 958 00:46:28,750 --> 00:46:31,449 一直是非零和博弈这在1977年 959 00:46:31,449 --> 00:46:34,273 的英格兰足球联赛中发生过联赛 960 00:46:34,273 --> 00:46:37,324 中的队伍被分为四级俱乐部在 961 00:46:37,324 --> 00:46:40,036 比赛中互相对抗以积分决定它们 962 00:46:40,036 --> 00:46:43,550 的晋级或降级甲级联赛声名远扬 963 00:46:43,961 --> 00:46:46,925 俱乐部可以趁机从巨大观众群中捞 964 00:46:46,925 --> 00:46:50,298 得丰厚利润在赛季结束时甲级 965 00:46:50,298 --> 00:46:53,061 中排名最后的3个俱乐部降级进入 966 00:46:53,086 --> 00:46:55,686 下一赛季的乙级联赛降级 967 00:46:55,711 --> 00:46:58,273 是一个惨痛的命运值得不惜一切 968 00:46:58,286 --> 00:47:02,186 去避免1977年5月8日是本赛季的最后 969 00:47:02,199 --> 00:47:05,161 一天甲级联赛中3个保级名额中 970 00:47:05,161 --> 00:47:07,724 的2个已经被确定第三个正等待 971 00:47:07,737 --> 00:47:11,798 揭晓它将从桑德兰队布里斯托队与考文垂队 972 00:47:11,798 --> 00:47:14,387 中诞生如果桑德兰队输了这场 973 00:47:14,387 --> 00:47:18,262 比赛布里斯托与考文垂只要打成平手便可以 974 00:47:18,286 --> 00:47:21,036 共同留在甲级联赛但如果桑德兰 975 00:47:21,048 --> 00:47:23,525 赢了布里斯托与考文垂比赛中的 976 00:47:23,536 --> 00:47:26,474 输家就会被降级这两场关键 977 00:47:26,487 --> 00:47:30,000 比赛理论上是同时进行的但事实上 978 00:47:30,375 --> 00:47:32,887 布里斯托对考文垂的比赛刚好推迟了 979 00:47:32,911 --> 00:47:36,750 5分钟开始这种情况下桑德兰队的结果 980 00:47:36,862 --> 00:47:39,324 在布里斯托对考文垂的比赛结束前 981 00:47:39,423 --> 00:47:41,536 便为两队所知晓了这 982 00:47:41,536 --> 00:47:42,987 便埋下了这个复杂故事的 983 00:47:43,000 --> 00:47:46,237 伏笔布里斯托与考文垂间的大部分比赛 984 00:47:46,250 --> 00:47:48,887 时间用当时一份新闻报道来说 985 00:47:49,125 --> 00:47:52,911 是迅猛激烈的激动人心赛前双方 986 00:47:52,936 --> 00:47:55,137 各自定下的2个进球的目标在 987 00:47:55,150 --> 00:47:58,574 比赛80分钟时已经达到比赛结束前 988 00:47:58,586 --> 00:48:01,625 2分钟时桑德兰输了的消息迅速 989 00:48:01,637 --> 00:48:04,673 传了过来考文垂的经理迅速让 990 00:48:04,673 --> 00:48:06,811 场边的巨大电子信息屏放出 991 00:48:06,811 --> 00:48:09,849 了这条消息所有22名队员显然 992 00:48:09,862 --> 00:48:12,750 都看到并且意识到无须多事了一个 993 00:48:12,762 --> 00:48:15,286 平局足以让双方都能逃避保级 994 00:48:15,286 --> 00:48:17,900 的命运而如果试图进球会使 995 00:48:17,911 --> 00:48:20,875 情况更糟这意味着把球员从 996 00:48:20,887 --> 00:48:23,949 防守转向进攻将承担战败而降级 997 00:48:23,949 --> 00:48:26,661 的风险我们还是引用那份新闻 998 00:48:26,661 --> 00:48:30,961 报道吧在唐吉利斯DonGillies80分钟 999 00:48:30,961 --> 00:48:33,500 时的进球帮助球队和布里斯托战 1000 00:48:33,500 --> 00:48:36,186 成平手时双方的支持者1秒钟 1001 00:48:36,186 --> 00:48:38,961 前还是分外眼红的仇人1秒钟 1002 00:48:38,961 --> 00:48:41,099 后却迅速加入一场共同的 1003 00:48:41,125 --> 00:48:45,512 狂欢庆祝中裁判查利斯RonChallis无奈 1004 00:48:45,512 --> 00:48:47,250 地看着球员们把球传来 1005 00:48:47,250 --> 00:48:50,061 传去于对手完全没有任何威胁 1006 00:48:50,637 --> 00:48:52,574 之前的零和博弈在外界新闻 1007 00:48:52,574 --> 00:48:55,025 的影响下迅速变成一场非零和 1008 00:48:55,036 --> 00:48:57,775 博弈在我们早先的讨论情况下 1009 00:48:58,061 --> 00:49:00,237 就好比外部的银行家奇迹般地 1010 00:49:00,250 --> 00:49:03,711 出现了使得布里斯托和考文垂从平局 1011 00:49:03,724 --> 00:49:06,862 结果中得到好处类似足球这种观赏 1012 00:49:06,875 --> 00:49:10,186 运动通常是零和博弈理由是观看 1013 00:49:10,199 --> 00:49:12,836 双方的剧烈对抗比友好比赛更为 1014 00:49:12,849 --> 00:49:16,974 激动人心但现实生活无论是人类生活 1015 00:49:17,086 --> 00:49:19,711 或者是植物动物的生活中并非 1016 00:49:19,711 --> 00:49:23,324 为观众所设计事实上现实生活中 1017 00:49:23,324 --> 00:49:26,737 的大部分情况都是非零和博弈社会扮演 1018 00:49:26,737 --> 00:49:29,237 了银行家的角色个人则可以从 1019 00:49:29,262 --> 00:49:32,036 对方的成功中获益我们可以看到 1020 00:49:32,275 --> 00:49:34,250 在自私的基因的基本原理的指导 1021 00:49:34,250 --> 00:49:36,686 下即使在自私的人类世界里 1022 00:49:37,000 --> 00:49:40,911 合作与互助同样促使社会兴旺发展我们 1023 00:49:40,911 --> 00:49:43,512 现在可以从阿克塞尔罗德的定义出发去 1024 00:49:43,512 --> 00:49:46,400 理解好人确实有好报但这 1025 00:49:46,411 --> 00:49:49,050 只能在博弈重复进行下才能发生 1026 00:49:49,612 --> 00:49:52,161 博弈者必须清楚这并不是他们之间 1027 00:49:52,186 --> 00:49:55,262 最后一场博弈用阿克塞尔罗德艰涩的 1028 00:49:55,275 --> 00:49:58,061 用语来说未来的阴影还很长 1029 00:49:58,612 --> 00:50:00,586 但这需要有多长它不 1030 00:50:00,586 --> 00:50:03,862 可以无限长理论上说博弈的长度 1031 00:50:03,887 --> 00:50:06,525 并不重要重要的是博弈双方 1032 00:50:06,550 --> 00:50:08,724 必须都不清楚博弈结束的时间 1033 00:50:09,300 --> 00:50:11,436 假设你我正在进行一场博弈 1034 00:50:11,862 --> 00:50:14,974 我们都知道博弈的重复次数为100回合 1035 00:50:15,400 --> 00:50:18,487 那么我们彼此清楚第100回合将 1036 00:50:18,500 --> 00:50:20,750 等同于一场简单的一次性囚徒 1037 00:50:20,762 --> 00:50:24,186 困境这种情况下最理性的决策 1038 00:50:24,275 --> 00:50:26,436 是我们双方各自在最后一轮 1039 00:50:26,525 --> 00:50:29,800 打出背叛自然我们也彼此能 1040 00:50:29,811 --> 00:50:32,148 预测对方也会背叛这使得最后 1041 00:50:32,161 --> 00:50:34,574 一轮的结果毫无悬念既已 1042 00:50:34,586 --> 00:50:38,137 如此第99轮则相当于一次性博弈 1043 00:50:38,500 --> 00:50:41,324 而双方能做出的唯一理性决策 1044 00:50:41,436 --> 00:50:44,811 则是背叛第98轮同理在 1045 00:50:44,824 --> 00:50:47,574 两个完全理性并假设对方同样理性 1046 00:50:47,574 --> 00:50:49,773 的博弈者处如果他们知道比赛 1047 00:50:49,773 --> 00:50:52,175 的回合数他们只能彼此不停背叛 1048 00:50:52,750 --> 00:50:55,574 于是当博弈理论家谈论重复囚徒困境 1049 00:50:55,599 --> 00:50:58,887 时他们经常假设博弈的终点不可知 1050 00:50:59,099 --> 00:51:02,099 或者只有银行家知道即使博弈的重复 1051 00:51:02,112 --> 00:51:05,599 次数不得而知在现实生活中我们经常 1052 00:51:05,612 --> 00:51:07,949 可以采用统计方法来预测博弈的 1053 00:51:07,974 --> 00:51:10,949 持续时间长度这种预测则成了 1054 00:51:10,974 --> 00:51:13,949 博弈策略中很重要的一部分如果 1055 00:51:13,949 --> 00:51:16,762 我注意到银行家开始坐立不安不停地 1056 00:51:16,786 --> 00:51:18,711 看他的手表我可以猜到此 1057 00:51:18,711 --> 00:51:21,449 游戏即将结束那么我便可以尝试 1058 00:51:21,461 --> 00:51:23,987 背叛如果我发现你也注意到 1059 00:51:24,012 --> 00:51:26,648 银行家的坐立不安我也会开始担心 1060 00:51:26,750 --> 00:51:29,000 你背叛的可能性我也许会过于 1061 00:51:29,012 --> 00:51:32,050 紧张而提前让自己先背叛即使 1062 00:51:32,061 --> 00:51:34,273 我开始担心你也许会担心我 1063 00:51:34,523 --> 00:51:37,300 在一次性与重复囚徒困境博弈中 1064 00:51:37,675 --> 00:51:40,349 数学家简单的直觉也许太过于简单 1065 00:51:40,925 --> 00:51:43,523 每一个选手都可以持续预测博弈 1066 00:51:43,536 --> 00:51:45,974 进行的长度他的估计越长 1067 00:51:46,311 --> 00:51:48,237 他的选择就会越接近数学家 1068 00:51:48,349 --> 00:51:50,887 在重复博弈中的预测更善良 1069 00:51:51,161 --> 00:51:54,675 更宽容更不嫉妒反之他的 1070 00:51:54,686 --> 00:51:56,961 选择就会更接近数学家在一次性 1071 00:51:56,987 --> 00:51:59,362 博弈中的预测更恶劣更不 1072 00:51:59,362 --> 00:51:59,773 宽容 1073 00:52:00,099 --> 00:52:02,436 阿克塞尔罗德对未来的阴影的重要性的 1074 00:52:02,449 --> 00:52:05,461 阐述来自第一次世界大战时形成的自己 1075 00:52:05,461 --> 00:52:08,086 活也让别人活的现象他 1076 00:52:08,086 --> 00:52:11,000 的研究资源来自历史学家与社会学家 1077 00:52:11,112 --> 00:52:15,061 托尼阿什沃思TonyAshworth一战时的 1078 00:52:15,074 --> 00:52:17,800 圣诞节英军与德军有时会 1079 00:52:17,824 --> 00:52:21,612 友好相处在无人区一起喝酒这种现象 1080 00:52:21,711 --> 00:52:25,148 早已为世人所知但事实上更为 1081 00:52:25,161 --> 00:52:28,500 有趣的是这种非正式非官方甚至没有 1082 00:52:28,523 --> 00:52:31,262 口头协定的友好协议这种自己活 1083 00:52:31,436 --> 00:52:33,161 也让别人活的系统早在 1084 00:52:33,186 --> 00:52:36,336 1914年便在前线上下流行持续 1085 00:52:36,336 --> 00:52:39,586 了至少2年一个英国高级将领在 1086 00:52:39,599 --> 00:52:42,224 巡视战壕时曾提及他看到德国 1087 00:52:42,237 --> 00:52:44,661 士兵在英军前线来复枪 1088 00:52:44,673 --> 00:52:46,737 射程内散步时的惊讶我们的 1089 00:52:46,750 --> 00:52:50,048 士兵好像并没有注意我私下决定 1090 00:52:50,161 --> 00:52:52,612 当我们接手它时应该阻止这种 1091 00:52:52,612 --> 00:52:55,012 事情的发生决不能允许这种事情 1092 00:52:55,023 --> 00:52:58,000 出现这些人似乎并不知道这是 1093 00:52:58,012 --> 00:53:00,773 一场战争显然双方都相信自己 1094 00:53:00,773 --> 00:53:03,661 活也让别人活的想法博弈 1095 00:53:03,661 --> 00:53:05,586 论与囚徒困境在当时还未 1096 00:53:05,586 --> 00:53:08,586 出现但如今在事后我们可以清楚 1097 00:53:08,586 --> 00:53:11,811 地理解当时的情况阿克塞尔罗德提供了 1098 00:53:11,824 --> 00:53:14,411 一个精彩的分析在当时的壕堑 1099 00:53:14,411 --> 00:53:16,411 战中每个野战排的未来的 1100 00:53:16,423 --> 00:53:19,586 阴影都很长这便表示每 1101 00:53:19,586 --> 00:53:21,449 支英军的挖掘队伍都可能 1102 00:53:21,461 --> 00:53:23,012 需要与同一支德军队伍 1103 00:53:23,125 --> 00:53:26,936 对峙好几个月另外普通士兵永远不知道 1104 00:53:26,961 --> 00:53:29,724 他们是否或何时会离开因为大家 1105 00:53:29,724 --> 00:53:33,324 都知道军队的决策专断随意变化无常 1106 00:53:33,887 --> 00:53:35,911 在这里未来的阴影长而不定 1107 00:53:36,224 --> 00:53:39,375 促使了针锋相对式合作的开始这种 1108 00:53:39,387 --> 00:53:41,673 情况已经类似于一场囚徒困境 1109 00:53:41,673 --> 00:53:44,375 的博弈了我们还记得要成为 1110 00:53:44,387 --> 00:53:47,150 一场真正的囚徒困境回报必须 1111 00:53:47,150 --> 00:53:50,237 有特定的次序规则双方必须同时 1112 00:53:50,250 --> 00:53:54,048 认为共同合作优于互相背叛在对方 1113 00:53:54,061 --> 00:53:56,673 合作时背叛则为更佳在 1114 00:53:56,686 --> 00:53:59,737 对方背叛时合作为最劣彼此 1115 00:53:59,750 --> 00:54:01,686 背叛则是将军们所喜的 1116 00:54:02,036 --> 00:54:04,262 他们想看到他们的士兵在机会 1117 00:54:04,262 --> 00:54:07,048 到来之时将对方捏得粉身碎骨 1118 00:54:07,625 --> 00:54:09,586 将军们并不愿意看到互助合作 1119 00:54:09,586 --> 00:54:12,625 的场面这对于赢得战争毫无帮助 1120 00:54:13,199 --> 00:54:15,324 但这对于双方的普通士兵而言 1121 00:54:15,425 --> 00:54:17,887 却是求之不得的好事他们并不 1122 00:54:17,887 --> 00:54:21,275 愿意付出生命的代价必须承认他们 1123 00:54:21,375 --> 00:54:24,311 也许认可将军的观点希望己方能 1124 00:54:24,324 --> 00:54:26,974 获得胜利这便是形成囚徒困境的 1125 00:54:27,000 --> 00:54:30,150 第二层回报但获得战争胜利并不是每个 1126 00:54:30,175 --> 00:54:33,150 普通士兵的选择战争的最终结果 1127 00:54:33,262 --> 00:54:35,211 并不太可能从物质上极大 1128 00:54:35,211 --> 00:54:37,536 地惠于个人虽然无论是出自 1129 00:54:37,561 --> 00:54:41,387 爱国主义抑或是遵守纪律你可能觉得 1130 00:54:41,512 --> 00:54:44,099 从背叛循环中逃出去也是不错 1131 00:54:44,099 --> 00:54:46,099 的但与你穿越无人区后 1132 00:54:46,099 --> 00:54:48,625 的某些敌军士兵互助合作则很 1133 00:54:48,625 --> 00:54:51,125 可能影响你本人的命运而且这 1134 00:54:51,125 --> 00:54:53,786 大大优于互相背叛这便使整个 1135 00:54:53,800 --> 00:54:57,324 情况形成一个真正的囚徒困境类似 1136 00:54:57,349 --> 00:55:00,625 针锋相对的行为注定要发生也确实 1137 00:55:00,637 --> 00:55:03,175 发生了在任何战壕前线上的 1138 00:55:03,199 --> 00:55:06,500 局部稳定策略并不一定是针锋相对后者 1139 00:55:06,500 --> 00:55:09,000 是属于善良虽报复但宽容的 1140 00:55:09,025 --> 00:55:11,675 策略家族中的一员这些策略 1141 00:55:11,775 --> 00:55:14,125 即使在理论上也并不完全稳定 1142 00:55:14,500 --> 00:55:17,686 至少很难在兴起时被改变比如 1143 00:55:18,086 --> 00:55:21,112 根据一份当时的记录三次针锋相对 1144 00:55:21,211 --> 00:55:24,199 在一个区域同时形成我们走出深夜的 1145 00:55:24,211 --> 00:55:26,775 战壕德国人也走了出来所以 1146 00:55:26,800 --> 00:55:29,750 出于礼貌我们不该开枪最恶劣的 1147 00:55:29,750 --> 00:55:32,661 事情是枪榴弹它们如果落入战壕就 1148 00:55:32,661 --> 00:55:35,561 会杀死大概9~10个人但除非德国 1149 00:55:35,561 --> 00:55:37,750 人特别吵否则我们不应该使用 1150 00:55:37,750 --> 00:55:40,800 这些武器因为他们也可以采取报复 1151 00:55:41,186 --> 00:55:44,074 我们也许没有一个人可以回去针锋相对 1152 00:55:44,086 --> 00:55:46,224 家族中这些策略有一个很重要 1153 00:55:46,224 --> 00:55:49,286 的共同点背叛的选手将得到惩罚 1154 00:55:49,862 --> 00:55:53,050 复仇的威胁必须始终在此在自己 1155 00:55:53,050 --> 00:55:55,737 活也让别人活系统中报复 1156 00:55:55,750 --> 00:55:59,561 能力的展示通常引人注目双方不断攻击 1157 00:55:59,561 --> 00:56:02,525 敌军不远处的虚拟目标一种如今 1158 00:56:02,625 --> 00:56:04,474 也在西方电影中使用的技巧 1159 00:56:04,737 --> 00:56:07,199 比如射灭蜡烛火焰而不是敌军 1160 00:56:07,211 --> 00:56:10,199 本身以展示其百发百中极具威胁 1161 00:56:10,199 --> 00:56:13,375 的攻击在另一个问题上为什么美国 1162 00:56:13,387 --> 00:56:15,925 罔顾顶尖物理学家们的愿望使用 1163 00:56:15,925 --> 00:56:19,061 了两颗原子弹来毁灭两座城市而 1164 00:56:19,061 --> 00:56:21,336 不是用类似攻击蜡烛的策略这 1165 00:56:21,336 --> 00:56:23,936 一机制也能圆满地回答与 1166 00:56:23,961 --> 00:56:26,550 针锋相对类似的策略都有一个重要 1167 00:56:26,550 --> 00:56:29,824 的特征它们都很宽容这有助于 1168 00:56:29,836 --> 00:56:33,500 减少长期报复恶性循环的产生这位 1169 00:56:33,523 --> 00:56:36,500 英国军官再次戏剧化地描述这种平息报复 1170 00:56:36,500 --> 00:56:38,500 的重要性当我正在与某连 1171 00:56:38,500 --> 00:56:40,862 的人喝茶时我们听到许多喊叫 1172 00:56:40,862 --> 00:56:43,724 声于是出来查看我们看见我们的 1173 00:56:43,724 --> 00:56:45,898 人与德国人各自站在战壕 1174 00:56:45,898 --> 00:56:48,461 前的矮墙上突然炮声骤响 1175 00:56:48,737 --> 00:56:51,625 却无人受伤双方很自然地卧倒 1176 00:56:52,012 --> 00:56:55,237 我们的人开始咒骂德国人这时 1177 00:56:55,336 --> 00:56:57,036 一个勇敢的德国人站起身来 1178 00:56:57,050 --> 00:56:59,786 大喊我们很抱歉我们希望没有 1179 00:56:59,786 --> 00:57:03,211 人受伤我们不是故意的都是那个该死 1180 00:57:03,211 --> 00:57:06,512 的普鲁士大炮阿克塞尔罗德对这个道歉的 1181 00:57:06,523 --> 00:57:09,125 评价是仅将责任推卸给机械 1182 00:57:09,436 --> 00:57:12,012 有效阻止了报复它表达了道德 1183 00:57:12,012 --> 00:57:14,849 上对于辜负信任的歉意也表达 1184 00:57:14,849 --> 00:57:17,648 了对有人可能受伤的关切这 1185 00:57:17,648 --> 00:57:20,211 确实是一个令人钦佩的勇敢的德国 1186 00:57:20,211 --> 00:57:23,762 人阿克塞尔罗德还也强调在保持互相 1187 00:57:23,762 --> 00:57:26,586 信任的稳定状况时预见性与仪式 1188 00:57:26,586 --> 00:57:29,349 感十分重要一个愉快的例子是 1189 00:57:29,724 --> 00:57:32,925 一个德国士兵提到英国大炮每天晚上 1190 00:57:32,949 --> 00:57:35,161 会根据钟点有规律地在前线 1191 00:57:35,175 --> 00:57:38,050 一些地方开火七点钟到了英国人 1192 00:57:38,074 --> 00:57:41,199 开炮了他们十分准时你都可以 1193 00:57:41,224 --> 00:57:43,898 据此来校正手表他们永远有着相同 1194 00:57:43,898 --> 00:57:46,987 的目标非常准确从未在前后左右 1195 00:57:47,012 --> 00:57:49,675 偏移过标志甚至有一些好奇的同伴 1196 00:57:49,875 --> 00:57:52,050 会在七点前一点爬出去看 1197 00:57:52,061 --> 00:57:54,550 英国人开炮根据英军的记录 1198 00:57:54,925 --> 00:57:56,936 德国大炮也在做同样的事情 1199 00:57:57,224 --> 00:58:00,074 德国人选择的目标射击的时间 1200 00:58:00,099 --> 00:58:03,512 与回合都十分规律琼斯上校知道 1201 00:58:03,536 --> 00:58:05,661 每一炮发出的时间他的 1202 00:58:05,675 --> 00:58:09,012 计算十分准确他甚至敢于做一些 1203 00:58:09,036 --> 00:58:11,648 初生牛犊式的行为冒险去到炮击 1204 00:58:11,648 --> 00:58:14,474 的地点因为他知道炮击将在 1205 00:58:14,474 --> 00:58:15,536 他到达前停止 1206 00:58:16,099 --> 00:58:19,262 阿克塞尔罗德对此的评注是这种仪式 1207 00:58:19,262 --> 00:58:21,737 性的炮击与规律性的开火表达 1208 00:58:21,737 --> 00:58:25,112 了双重信息于上级军官它们表达 1209 00:58:25,112 --> 00:58:27,911 了抗争而对于敌军它们传递了 1210 00:58:27,925 --> 00:58:30,786 和平这种自己活也让别人活 1211 00:58:30,800 --> 00:58:33,262 的系统本可以通过口头沟通获得 1212 00:58:33,599 --> 00:58:35,686 由理性的策略家在圆桌上 1213 00:58:35,711 --> 00:58:39,686 讨价还价得到事实上它无法这么做它 1214 00:58:39,699 --> 00:58:41,862 通过人们回应对方行为的方式传递 1215 00:58:42,224 --> 00:58:45,711 在一系列的局部约定中形成阿克塞尔罗德 1216 00:58:45,737 --> 00:58:48,936 计算机中的策略完全没有意识它们 1217 00:58:48,936 --> 00:58:52,461 的善意或恶意宽容或记仇嫉妒 1218 00:58:52,487 --> 00:58:56,061 或大气仅由其行为定义程序员 1219 00:58:56,086 --> 00:58:58,262 也许有其他的想法但这并 1220 00:58:58,262 --> 00:59:01,637 不相关一个策略是否善良仅通过 1221 00:59:01,661 --> 00:59:04,625 行为确认而并非通过其动机因为 1222 00:59:04,637 --> 00:59:07,349 它没有或作者的性格当程序 1223 00:59:07,362 --> 00:59:10,161 运行时这已经成为历史了一个 1224 00:59:10,186 --> 00:59:12,898 计算机程序可以以其策略方式来施 1225 00:59:12,898 --> 00:59:15,887 为它并不需要知道自己的策略如何 1226 00:59:16,099 --> 00:59:19,461 或者任何其他事情我们当然知道策略 1227 00:59:19,461 --> 00:59:22,311 家是否有意识并不相关这本 1228 00:59:22,311 --> 00:59:24,474 书已经提到许多无意识的策略家 1229 00:59:25,036 --> 00:59:27,411 阿克塞尔罗德的程序便是我们在这本 1230 00:59:27,411 --> 00:59:30,224 书里用以思考动植物甚至基因的 1231 00:59:30,250 --> 00:59:33,487 优秀模型我们现在可以问问他那些 1232 00:59:33,487 --> 00:59:35,836 关于宽容善良不嫉妒的成功例子 1233 00:59:35,936 --> 00:59:39,586 与优化结论是否可以用于自然世界答案 1234 00:59:39,586 --> 00:59:43,112 是肯定的自然界一向如此唯一条件 1235 00:59:43,125 --> 00:59:45,936 是自然优势需要设定未来的阴影 1236 00:59:45,949 --> 00:59:48,637 很长的囚徒困境而且是非零和 1237 00:59:48,650 --> 00:59:52,036 博弈这些条件在生物王国中一直 1238 00:59:52,048 --> 00:59:55,025 成立没有人会认为细菌是一个 1239 00:59:55,048 --> 00:59:58,112 有意识的策略家但寄生菌们天衣无缝 1240 00:59:58,112 --> 01:00:00,286 地与它们的寄主演绎着囚徒 1241 01:00:00,298 --> 01:00:03,923 困境我们没有理由不采用阿克塞尔罗德的理论 1242 01:00:04,311 --> 01:00:07,650 善良宽容不嫉妒等等来研究它们 1243 01:00:07,650 --> 01:00:12,286 的策略阿克塞尔罗德和汉密尔顿指出那些无害 1244 01:00:12,311 --> 01:00:14,400 且有益的细菌可以在人们受伤 1245 01:00:14,400 --> 01:00:17,949 时变成有害甚至致命的败血症医生 1246 01:00:17,961 --> 01:00:20,536 会说人体的自然抵抗能力在 1247 01:00:20,548 --> 01:00:23,250 受伤时会下降但也许真实的 1248 01:00:23,250 --> 01:00:26,512 原因正是囚徒困境的博弈在人体 1249 01:00:26,512 --> 01:00:29,824 内细菌是否有所收获同时也不停 1250 01:00:29,836 --> 01:00:32,525 检验其回报呢在人体和细菌 1251 01:00:32,525 --> 01:00:34,775 的博弈中未来的阴影通常很 1252 01:00:34,775 --> 01:00:37,724 长因为一个普通人可以在任何起始 1253 01:00:37,724 --> 01:00:41,286 点活上很多年然而一个严重 1254 01:00:41,300 --> 01:00:43,625 伤者则可能给其寄生菌带来 1255 01:00:43,650 --> 01:00:46,500 较短的未来背叛的诱惑突然 1256 01:00:46,500 --> 01:00:48,487 比互相合作的奖赏更有诱惑 1257 01:00:48,487 --> 01:00:51,550 力当然细菌在它们邪恶的小 1258 01:00:51,550 --> 01:00:54,336 头脑里可没有计算这些东西代 1259 01:00:54,336 --> 01:00:56,750 代细菌的自然选择已经将它们培养 1260 01:00:56,750 --> 01:00:59,561 成一个无意识的生物首要任务是 1261 01:00:59,561 --> 01:01:03,324 以生物化学来维系生命根据阿克塞尔罗德和 1262 01:01:03,336 --> 01:01:05,824 汉密尔顿的分析虽然植物明显没有 1263 01:01:05,836 --> 01:01:09,262 意识但它们懂得复仇无花果树和榕 1264 01:01:09,262 --> 01:01:12,150 小蜂享有紧密合作的关系我们 1265 01:01:12,150 --> 01:01:15,036 所吃的无花果其实不是果实无花果 1266 01:01:15,050 --> 01:01:16,875 顶端有一个小洞如果你可以 1267 01:01:16,887 --> 01:01:18,974 缩小成榕小蜂的尺寸进入 1268 01:01:19,000 --> 01:01:21,099 这个小洞榕小蜂非常小 1269 01:01:21,487 --> 01:01:24,025 小得当我们吃无花果时都不会 1270 01:01:24,036 --> 01:01:26,311 注意到它就可以看见无花果壁 1271 01:01:26,311 --> 01:01:29,737 上有许许多多小花无花果其实是 1272 01:01:29,762 --> 01:01:32,186 花朵们的阴暗温室与授粉房间 1273 01:01:32,561 --> 01:01:34,675 而授粉过程要靠榕小蜂 1274 01:01:34,686 --> 01:01:37,875 来完成无花果树为榕小蜂提供 1275 01:01:37,887 --> 01:01:40,375 栖息地而榕小蜂在这些 1276 01:01:40,387 --> 01:01:42,586 小花里产卵对于榕小蜂 1277 01:01:42,599 --> 01:01:44,974 来说背叛指的是在无花果内 1278 01:01:44,974 --> 01:01:47,824 的许多花朵中产卵使得它们无法 1279 01:01:47,824 --> 01:01:52,961 互相授粉无花果树如何报复呢阿克塞尔罗德和 1280 01:01:52,974 --> 01:01:56,125 汉密尔顿说许多情况下如果榕小 1281 01:01:56,125 --> 01:01:58,362 蜂进入一棵年轻的无花果却 1282 01:01:58,362 --> 01:02:00,961 不为花朵授粉而是在大部分花朵 1283 01:02:00,961 --> 01:02:03,675 中产卵无花果树将除去这颗 1284 01:02:03,699 --> 01:02:06,000 还处于生长中的无花果使得所有 1285 01:02:06,012 --> 01:02:07,625 榕小蜂的后代都走向 1286 01:02:07,625 --> 01:02:12,186 死亡艾瑞克费希尔则在海鲈鱼一种 1287 01:02:12,211 --> 01:02:14,862 雌雄同体的鱼身上发现了一个奇怪 1288 01:02:14,862 --> 01:02:17,974 的现象正好说明了自然界的针锋相对 1289 01:02:18,550 --> 01:02:21,387 与我们不同这种鱼的性别不是 1290 01:02:21,387 --> 01:02:23,275 由生命孕育时的染色体决定的 1291 01:02:23,836 --> 01:02:25,949 每一条鱼都有雄性与雌性 1292 01:02:25,949 --> 01:02:28,800 的功能交配时可以选择产生卵子 1293 01:02:28,824 --> 01:02:31,550 或精子他们双双缔结一夫一 1294 01:02:31,550 --> 01:02:34,800 妻的组合轮流交换性别分饰雌雄 1295 01:02:34,811 --> 01:02:38,199 角色我们也许可以推测由于雄性角色 1296 01:02:38,224 --> 01:02:41,112 相对方便海鲈鱼也许更愿意饰演 1297 01:02:41,137 --> 01:02:45,750 雄性角色而逃离合作关系也就是说如果其中 1298 01:02:45,762 --> 01:02:48,949 一条鱼可以成功劝服伴侣持续饰演 1299 01:02:48,974 --> 01:02:51,175 雌性角色它就可以逃离其对 1300 01:02:51,186 --> 01:02:53,349 孵卵生产的责任而将资源 1301 01:02:53,375 --> 01:02:55,949 投入其他事情比如和其他鱼交配 1302 01:02:55,949 --> 01:02:59,887 等事实上费希尔却发现海鲈鱼以 1303 01:02:59,898 --> 01:03:02,536 一种严格的轮换机制进行其繁衍 1304 01:03:02,550 --> 01:03:07,512 过程这就是我们所预料的针锋相对这个博弈 1305 01:03:07,625 --> 01:03:10,336 正是一个真正的囚徒博弈虽然有些 1306 01:03:10,349 --> 01:03:13,250 复杂但这说明了鲈鱼们为何 1307 01:03:13,262 --> 01:03:16,898 采取这个策略在这里合作表示在 1308 01:03:16,911 --> 01:03:19,425 轮到其产卵时扮演雌性角色 1309 01:03:19,750 --> 01:03:21,637 背叛则是在轮到时试图 1310 01:03:21,648 --> 01:03:25,050 扮演雄性角色这种背叛很容易引起 1311 01:03:25,061 --> 01:03:27,862 报复伴侣可能会在下一次拒绝 1312 01:03:27,875 --> 01:03:30,911 扮演雌性角色或者她可以直接中断 1313 01:03:30,936 --> 01:03:34,311 伴侣关系费希尔确实也发现了那些 1314 01:03:34,336 --> 01:03:36,925 性别角色担当次数不等的伴侣容易 1315 01:03:36,936 --> 01:03:40,175 分手社会学家和心理学家会提出一个 1316 01:03:40,186 --> 01:03:43,336 问题为什么有人会愿意捐赠血液在 1317 01:03:43,349 --> 01:03:46,887 英国等国家血液捐赠为无偿我 1318 01:03:46,887 --> 01:03:48,836 不觉得这个答案在互惠或伪装 1319 01:03:48,836 --> 01:03:51,211 的自私下有那么简单当这些 1320 01:03:51,237 --> 01:03:54,411 长期血液捐赠者需要输血时他们 1321 01:03:54,425 --> 01:03:56,836 并未得到任何优先次序也没有 1322 01:03:56,836 --> 01:03:59,387 人给他们颁发金星奖章也许我 1323 01:03:59,398 --> 01:04:01,987 过于天真了但我觉得这是一种 1324 01:04:02,012 --> 01:04:05,661 真正的纯粹的无私利他主义这是因为 1325 01:04:05,762 --> 01:04:08,387 吸血蝙蝠之间的血液共享刚好符合 1326 01:04:08,411 --> 01:04:13,061 阿克塞尔罗德的模型GS威尔金森GS 1327 01:04:13,148 --> 01:04:15,523 Wilkinson的研究表明了这一点 1328 01:04:16,099 --> 01:04:19,423 吸血蝙蝠以在夜里吸血为生它们 1329 01:04:19,436 --> 01:04:21,750 要得到食物并不容易但每每 1330 01:04:21,762 --> 01:04:25,487 得到的都是大餐当黎明降临一些 1331 01:04:25,512 --> 01:04:27,425 不走运的蝙蝠可能会空着 1332 01:04:27,425 --> 01:04:29,936 肚子回家另一些则可能找到一个 1333 01:04:29,949 --> 01:04:33,586 受害者吸了充足的血液第二天晚上 1334 01:04:33,887 --> 01:04:36,336 同样的故事又在上演在这种 1335 01:04:36,349 --> 01:04:39,436 情况下一个互助的利他主义是可能 1336 01:04:39,449 --> 01:04:42,699 产生的威尔金森发现那些在夜里吸 1337 01:04:42,699 --> 01:04:44,961 饱血液的幸运儿确实会将一些 1338 01:04:44,987 --> 01:04:47,411 血液返流捐赠给不走运的同伴 1339 01:04:47,987 --> 01:04:51,362 威尔金森观察了110例血液捐赠其中有 1340 01:04:51,375 --> 01:04:54,824 77次是母亲喂养孩子而大部分其他 1341 01:04:54,824 --> 01:04:57,487 的血液捐赠发生在近亲中在 1342 01:04:57,500 --> 01:05:00,048 完全没有血缘的蝙蝠中一些血液 1343 01:05:00,061 --> 01:05:03,237 捐赠的例子依然存在血浓于水的说法 1344 01:05:03,250 --> 01:05:07,112 看来并不完全符合事实但是这些 1345 01:05:07,125 --> 01:05:09,523 共享血液的蝙蝠也经常是室友 1346 01:05:09,798 --> 01:05:12,586 它们有许多机会与对方持续打交道 1347 01:05:12,849 --> 01:05:15,298 这正是重复囚徒博弈所必须满足 1348 01:05:15,298 --> 01:05:18,036 的条件但囚徒博弈的其他条件 1349 01:05:18,036 --> 01:05:21,048 呢表12-4的回报表格显示了 1350 01:05:21,061 --> 01:05:23,887 我们对此的预期表12-4吸血 1351 01:05:23,887 --> 01:05:26,449 蝙蝠的血液捐赠在各种情况下 1352 01:05:26,561 --> 01:05:28,474 我的回报吸血蝙蝠的情况真 1353 01:05:28,474 --> 01:05:31,025 的和这张表格一样吗威尔金森 1354 01:05:31,137 --> 01:05:32,762 对那些饿肚子的蝙蝠的体重 1355 01:05:32,775 --> 01:05:36,798 下降速率进行计算通过对饱食饥肠 1356 01:05:36,900 --> 01:05:39,173 与处于中间段的蝙蝠饿死速率 1357 01:05:39,275 --> 01:05:42,012 进行分别计算他算得血液得以 1358 01:05:42,025 --> 01:05:44,525 维持生命的时间他发现了一个 1359 01:05:44,548 --> 01:05:46,911 并不惊奇的结论这些速率并 1360 01:05:46,911 --> 01:05:50,161 不相等取决于蝙蝠的饥饿程度比 1361 01:05:50,161 --> 01:05:53,074 起吃饱喝足的蝙蝠相同的血液量 1362 01:05:53,173 --> 01:05:55,586 可以为饥肠辘辘的生命维持更多的 1363 01:05:55,599 --> 01:05:59,336 时间也就是说虽然捐血可以增加捐赠 1364 01:05:59,336 --> 01:06:02,237 者饿死的速率但救助濒死生命的意义 1365 01:06:02,349 --> 01:06:05,074 要大得多这似乎表示蝙蝠 1366 01:06:05,074 --> 01:06:07,923 的情况确实符合囚徒困境的规则 1367 01:06:08,500 --> 01:06:10,336 将血液捐赠给同伴中的所 1368 01:06:10,336 --> 01:06:12,637 需者比留着自用更为珍贵 1369 01:06:13,211 --> 01:06:15,875 在雌蝙蝠吸血蝙蝠的社交范围 1370 01:06:15,900 --> 01:06:18,911 为雌性饥肠辘辘的夜里可以从伙伴 1371 01:06:18,911 --> 01:06:22,362 的捐赠中获益良多当然如果雌 1372 01:06:22,362 --> 01:06:25,362 蝙蝠选择背叛拒绝给同伴捐赠血液 1373 01:06:25,675 --> 01:06:28,300 逃离互助的责任雌蝙蝠可以受益 1374 01:06:28,300 --> 01:06:31,762 更多在这里逃离互助责任只在 1375 01:06:31,775 --> 01:06:35,086 蝙蝠确实采取针锋相对策略时才有意义 1376 01:06:35,650 --> 01:06:38,862 那么针锋相对在演化中的其他条件 1377 01:06:38,961 --> 01:06:42,161 是否能满足呢重要的是这些 1378 01:06:42,175 --> 01:06:45,737 蝙蝠是否能够互相辨别呢威尔金森的 1379 01:06:45,762 --> 01:06:48,161 实验结果是肯定的他俘虏了 1380 01:06:48,175 --> 01:06:50,599 一只蝙蝠将其与同伴隔离 1381 01:06:50,836 --> 01:06:53,411 并饿了雌蝙蝠一夜其他同伴 1382 01:06:53,436 --> 01:06:55,661 则得以饱食当这只不幸的 1383 01:06:55,675 --> 01:06:59,387 俘虏返回巢穴时威尔金森就观察是否 1384 01:06:59,387 --> 01:07:02,574 有任何蝙蝠给予其食物这个实验 1385 01:07:02,599 --> 01:07:05,599 重复了许多次不同的蝙蝠轮流作为 1386 01:07:05,625 --> 01:07:08,061 饥饿的俘虏又被送返俘虏 1387 01:07:08,061 --> 01:07:10,500 的蝙蝠们来自相隔数英里的两个 1388 01:07:10,512 --> 01:07:14,074 巢穴两个独立的组织如果蝙蝠可以 1389 01:07:14,086 --> 01:07:16,324 辨别它们的朋友这只饥饿的 1390 01:07:16,336 --> 01:07:18,800 蝙蝠将可以从也只能从自己 1391 01:07:18,800 --> 01:07:21,686 的巢穴中获得帮助这正是事实 1392 01:07:22,250 --> 01:07:24,336 在观察到的13个血液捐赠者 1393 01:07:24,336 --> 01:07:26,900 中12个捐赠者是饥饿者的 1394 01:07:26,911 --> 01:07:30,362 老朋友来自同一个巢穴来自不同巢穴 1395 01:07:30,362 --> 01:07:32,461 的新朋友只喂养了1次饥饿 1396 01:07:32,461 --> 01:07:35,599 的蝙蝠这也许是个巧合但当 1397 01:07:35,599 --> 01:07:37,599 我们计算这个范例时它发生的 1398 01:07:37,612 --> 01:07:40,237 概率只小于我们可以信心十足地 1399 01:07:40,250 --> 01:07:43,961 总结蝙蝠确实更偏爱帮助老朋友而 1400 01:07:43,961 --> 01:07:46,925 不是另一个巢穴的陌生人吸血蝙蝠是 1401 01:07:46,936 --> 01:07:49,887 神秘的对于维多利亚哥特小说的迷恋 1402 01:07:49,887 --> 01:07:52,487 者来说它们经常是在夜里恐吓 1403 01:07:52,500 --> 01:07:56,086 他人吸食血液牺牲无辜生命以满足 1404 01:07:56,112 --> 01:07:58,875 私欲的黑暗力量再加上其他维多利亚 1405 01:07:58,887 --> 01:08:01,411 时期的神秘事件以及蝙蝠天生鲜红的 1406 01:08:01,425 --> 01:08:04,974 牙齿和爪子吸血鬼蝙蝠不正是自然界 1407 01:08:05,000 --> 01:08:07,125 自私基因的最令人恐惧的力量 1408 01:08:07,125 --> 01:08:10,887 的化身吗我对于这些神秘事件嗤之以鼻 1409 01:08:11,461 --> 01:08:13,625 如果我们想知道一个事件背后的 1410 01:08:13,637 --> 01:08:17,711 真相就需要研究达尔文主义赋予我们的 1411 01:08:17,823 --> 01:08:20,073 并不是对一个特定生物的详细描述 1412 01:08:20,448 --> 01:08:22,787 而是一个更微妙却更有价值 1413 01:08:22,787 --> 01:08:25,412 的工具对原理的理解如果我们 1414 01:08:25,425 --> 01:08:27,800 一定要加进一个神秘事件那便是 1415 01:08:27,811 --> 01:08:30,724 真相关于吸血蝙蝠高尚品格的故事 1416 01:08:31,300 --> 01:08:35,625 对于蝙蝠自身血并不浓于水它们超越亲属 1417 01:08:35,636 --> 01:08:38,350 关系在忠诚的朋友间形成它们 1418 01:08:38,375 --> 01:08:41,850 长久坚实的纽带吸血蝙蝠可以讲述 1419 01:08:41,862 --> 01:08:44,412 一个新的神秘故事一个关于共享 1420 01:08:44,649 --> 01:08:47,800 互助合作的故事它们昭示这一个 1421 01:08:47,823 --> 01:08:50,225 善良的思想即使我们都由自私 1422 01:08:50,225 --> 01:08:52,375 的基因掌舵好人终有好报