解讀《博弈論與生活》6、最佳策略:做個简单的好人

admin 發表於 2024-8-6 17:25:13

這是咱們聊博弈論的最後一期节目，從一個故事起頭。

话說，1914年第一次世界大战暴發，由于有了機枪的呈現，在西線疆场两邊堕入了长期的堑壕战。雙方挖了战壕，把火線的树全数砍光，留下一片坦荡地带。若是谁敢倡议冲锋，面临架好的機枪，根基就是排着队去接管枪决，以是两邊就這麼僵持着。

奇异的是，比及這一年圣诞节的時辰，雙術士兵不单再也不交火，并且自觉的一块酵素減肥藥,兒搞上了联歡會。雙方互相問候着新年好，走出战壕一块兒唱圣诞歌，乃至還组织起了一场足球角逐。這两國之間這但是在兵戈啊，而兵士之間居然手拉着手辦起春节联歡晚會？

這一點都分歧情，但在那時的环境下确切很是的公道。

两軍都躲在深深的战壕里，没法歼灭對方，长時候僵持不下，环境渐渐的呈現了奥妙的變革。一起頭是到了開饭的時候，後勤职員要来送饭，對方是可以看到對面伙食班開車来送饭的。這個時辰若是開炮进犯是可以将其歼灭，可是若是你砸了對面的饭碗，那你本身還要不要用饭？人家也能够開炮打翻你的外賣。如许一来大師可都要饿肚子，因而這就达成為了默契，我不砸你的饭碗，你也别搞我的外賣。

“我活也讓你活”，一種特别的互助计谋呈現了。

到了開饭時候就停火，伙食班的人也不消寂静摸摸的，大摇大摆，有說有笑地来送饭。另有气候卑劣的時辰，战壕里阴冷湿润，雙術士兵都遭罪，垂垂又商定俗成，气候卑劣不打。接下来就是节沐日不打，周末也不打。因而就呈現了适才咱們說的一幕，大過年的雙方從战壕里跑出来搞联歡。

最後默契到甚麼水平，两邊會只在固按時間朝着對方阵营開枪射击，天天射击的時候正确到可以用枪声来對表。

有一名英國兵士厥後回想說：一次本身正在和战友晒太陽品茗，忽然听到一阵枪炮声。大師都很愤慨，由于依照默契商定，這個時候點是不该该開仗的，對面德國佬是怎样回運動彩券場中,事兒？這時辰對面战壕里爬出来一小我對着這邊高喊：“欠好意思，走火啦！但愿没伤到你們！”

在最不成能呈現的互助的战役两邊，居然可以或许告竣如许的互助。

阿克塞尔罗德遊戲

這個案例来自一本博弈論的必讀經典《互助的进化》，作者是罗伯特·阿克塞尔罗德。在书中，作者先容了本身的一個實行，寻觅在反复博弈傍邊，甚麼样的举措计谋才能才是最优的。

他用阶下囚窘境的法则，摹拟了一個電脑遊戲。若是两邊互助，各得三分，若是互相變节，各得一分，若是一方互助，另外一方變节。那選擇互助的0分，變节者得5分。可见两邊都變节收益很少，两邊都互助收益一般，而變节碰到互助，變节者收益最高。遊戲介入者按照本身的长處计较决议是選擇變节仍是選擇互助。

阿克塞尔罗德约请了15位精晓博弈論的專家，這些人稀有學家、生理學家、經濟學家等等，听說另有美國的前國務卿基辛格。受邀者把本身的博弈计谋编写成電脑步伐，介入到遊戲中来。

這些计谋中有大好人计谋，也就是更愿意互助，不起首變节。固然也有坏人计谋，老是揣摩着經由過程變节得到更多的长處。這15個计谋在颠末了5轮一對一的轮回赛，也就是一共12万個回合的大混战以後，最後的成果，連阿克塞尔罗德本身都不敢信赖。大好人大获全胜，前八名清一色都是大好人计谋，如许的成果的确就如童话故事同样夸姣。

独占鳌頭的计谋叫做“一报還一报”，它的原则很是简略。第一次我都選擇互助。然後就是以眼還眼，你互助我就互助，你變节我就變节，彻底复制敌手在上一轮的举措。

阿克塞尔罗德不敢信赖這個成果，因而又组织了一次角逐，此次参赛计谋扩展到了62個，并且参赛者是晓得上一次角逐的成果的，可以按照以前的履历调解這一轮的参赛计谋。颠末了上百万回合的大混战，成果仍然如斯，大好人计谋压服性的得到了上風。并且夺得第一位的依然是“一报還一报”。

一报還一报

這個计谋看起来简略粗鲁，却有這麼几點高超的地方。

起首是仁慈，不作歹。固然他不自動變节，但他又欠好欺侮，若是你變节了他，那末他下次就必定會變节你。但同時，他又是宽容的，就算你以前變节過，但只要悔改改過選擇互助，他也仍然愿意友爱互助。最後，很首要的一點就是他模式简略清楚，他人一眼便知，明白地晓得，在他身上占不到持久的廉價。

是以，仁慈、抨击、宽容和清楚就是“一报還一报”计谋可以或许持续胜出的缘由。

而根据這四条，给咱們的糊口带来了启迪。

起首，糊口中的博弈并不是是下棋打牌如许的零和博弈，获胜的關頭不在于克服對方，而是要在持久频频的互助中實現雙赢，面前的得失其實不用太在乎，由于并無那末首要。

咱們看“一报還一报”的计谋就决议了他在遊戲里的单個回合中，互助只能和敌手拿同样多，或遭受變节甚麼都得不到。可是频频博弈以後，它堆集下来的分数倒是至多的，真實的长處来自于持久的互助雙赢。

在阿克塞尔罗德的遊戲中，大好人计谋大获全胜，仁慈，不作歹很较着是一個上風计谋。

其次，抨击。他人互助咱們就互助，若是他人變节，咱們固然也要用變节予以還击。被他人當做一個软柿子，有事兒没事兒就来捏你一下，這必定不可。

學生問孔子說：“以德埋怨，奈何？”孔子答复：“以德埋怨，何故报德？”以是咱們就是應當以德报德，以直埋怨。

但以直埋怨不是說你是恶人，我就要成為一個比你還恶的人，你變节了我一次，我一生都不與你互助。以直埋怨不是冤冤相报，咱們還必需有足够的宽容，若是在變节以後再次選擇互助，那咱們就選擇谅解。

最後一點是清楚，简略。

在阿克塞尔罗德遊戲的第一轮竣事以後，很多人感觉“一报還一报”计谋固然胜出了，但不完善，是以在第二轮的時辰做出了改良，用改良版的“一报還一报”计谋加入遊戲，但谁也没想到這些进化版都不如本身原始的老祖宗。這是為甚麼？

由于法则越繁杂，缝隙便可能越多。更首要的是咱們玩的不是零和博弈，在零和博弈中，本身的计谋暗藏的越深，就越輕易获胜。在阿克塞尔罗德遊戲和真實世界中是正和博弈，计谋越是简略，越是能讓他人看大白，安心與咱們创建起安定的互助瓜葛，咱們才更有可能樂成。

這就是一报還一报计谋给咱們带来的首要启迪，仁慈、抨击、宽容、清楚。

简略的大好人

固然大好人大获全胜的大团聚终局是咱們指望看到的，但這也只是對真實世界的一個好美测度罢了。

《互助的进化》作者認為，若是這個遊戲不竭的继续举行下去，而且引入镌汰機制，大好人不竭的赢，坏人不竭的輸，进而大好人之間的互助愈来愈安定，坏人愈加的没有可趁之機。那末在遊戲举行1000論，也就是进化1000代以後，坏人计谋就将完全灭尽。從這個遊戲推演到人类社會，互助一旦创建起来，优越劣汰的機制起頭阐扬感化，若是大好人均可以在竞争傍邊胜出，那末人人城市争當大好人，长此以往，坏人天然就消散了。這就是一個物竞天擇，进化镌汰的不成逆进程。

但這個推論明显是與實際环境不符的，人类文明出生至今，不但坏人没有灭尽。乃至如今咱們都無法說究竟是大好人多仍是坏人多。

為甚麼？由于這個遊戲存在一些與現世不符的處所，例如說远远低估了坏人的杀伤力，遊戲中的變节其實不能讓對方完全出局，每小我都有死灰复然的機遇。這就即是是讓大好人自带主角光环，而實際中呢？有几多人承受了變节的致命一击今後，就再也没有站起来過。

例如說遊戲中的變节與互助都是放在台邊上，一目明了，但是實際中却有几多口是心非伪正人。一报還一报，怎样报？咱們乃至都彻底不晓得究竟是被谁變节了。當大好人因變节而出局，而坏人的劣迹没有被發明的時辰，就會起到树模感化，讓不少大好人都轉向坏人计谋。

另有，回到文明伊始的天然状况，那是一個一切人對一切人战役的期間，人人都是坏人。相互變节實在占不到多大的廉價。這個時辰有一些愿意互助的人呈現，抱团取暖和，得到不乱的收益，固然是比坏人计谋更具上風。

但是當大好人愈来愈多，坏人愈来愈少，那坏人碰到坏人的几率就變小了，碰到大好人的几率很高，那末片面變节就很輕易赢利，是以就有愈来愈多的人轉向坏人计谋。以是社會互助的真實演變并不是是坏人向大好人的单向演變，而是一個雙向演變，不竭寻觅動态均衡的进程。

在真正的世界中，永久都不存在一劳永逸的计谋，這是咱們應當看到，也必需接管的。采纳甚麼样的举措计谋，是咱們每小我由心而生的選擇，每次的举措就决议了我终极将成為一個甚麼样的人。

每小我始终都是孤傲的，一生始终都要和本身相處，所谓自由就是孤傲的站立，不迷恋，不害怕。

我的選擇就是做一個简略的大好人，那你呢？

以上即是咱們聊“博弈論”的全数内容。

总结

总结一下，這6期节目都說了一些甚麼。

關于博弈論的探究，是從經典的阶下囚窘境起頭的，两個阶下囚固然都想做出最有益于本身的選擇，可是當斟酌到對方的举動以後，终极两邊的举措终局却至關悲凉。并且這是一個必定的，不乱的，任何一方都不成能扭轉本身计谋的成果。

在不危险任何人长處的环境下，最少使得一小我的處境變得更好，若是已到了改無可改的完善状况，這叫做帕累托最优去除黑眼圈方法,。可是帕累托最优极為不不乱，由于介入者可以侵害他人的长處，来讓本身赢利。

而任何一方都没有片面扭轉本身计谋的场合排场叫做纳什平衡，這是博弈論中很是首要的觀點，之以是會堕入到困局，就是由于达成為了纳什平衡。

想一想列國之間的武备比赛，想一想咱們在竞争范畴常說的内卷，實在都是达成為了纳什平衡，堕入了阶下囚窘境。

废除窘境有這麼几条前途：

一、将单次博弈酿成屡次博弈，讓人們都在持久的互助中赢利。乡土中國熟人社會的時辰，四周都是親戚朋侪，每小我都注意名声。近代以後，生齿活動了起来，反复博弈酿成了单次博弈，钩心斗角的事變就多了起来。而跟着市场經濟的成长，人們愈来愈依靠反复博弈，小我的光荣又渐渐變得透明。

二、引入赏罚機制，建立绝對的权势巨子，引入第三方羁系，迫令人們在博弈傍邊告竣互助，好比說當局羁系，交通律例等等。

三、扭轉遊戲法则，秦就是用绝對的暴力一统六國以後，遊戲法则才得以扭轉，全國人材能参軍备比赛中脱困。

四、扭轉博弈的报偿，调解小我的價值功效，有人寻求庙堂之高富贵荣华，有人想要江湖之远從容逍遥，一样一块蛋糕，有人钟爱奶油下的鸡蛋糕，有人偏心那一朵奶油花。若是人人都能各得其所，也就没需要在一個狭窄的空間内冒死“内卷”。

不少時辰，問題必要在成长的进程中解决，着眼更大的面，才能解决以前局部范畴内没法解脱的困局。

五、想到告竣持久不乱的互助瓜葛，靠思惟教诲、酷刑峻法都是远远不敷的，只有找到博弈中的纳什平衡而且善加操纵，讓多方的互助自交運作起来。以是，抱负主义者寻求帕累托最优，而實際主义者能看到纳什平衡。

除阶下囚窘境以外，咱們還說到了公地的惨剧，搭便車，怯夫博弈，自愿者窘境和两性战役。

公地惨剧彷佛看起来是否認了亚當斯密“看不见的手”，但實在最後市场的气力也不會讓劫難性的成果產生，可是在這個进程中确切造成為了大量的大众資本的價值耗散，經由過程报酬干涉干與是可以防止的。

咱們夸大了第三方羁系的气力，有一種窘境叫自由，有一種解放叫制止。人們最應當存眷的是市场和當局之間的界線應當劃在哪里，而不是對一邊死力追捧，同時對另外一邊完全的否認。

對付搭便車举動，一方面咱們夸大經由過程赏罚和嘉奖落實到小我除腳臭產品,的方法，来解决长處团体同享，而本钱却難以均分的問題。另外一方面咱們也從智猪博弈的角度阐發了，作為弱势的小猪，就應當采纳跟從计谋，晓得公道的搭便車，而作為大猪则必需束缚小猪心态，時刻存眷本身的焦點竞争力。

關于怯夫博弈，拆下本身的標的目的盘扔出窗外，丢弃選項隔離後路，确切是颇有效的博弈计谋。可是這也极可能激起對方跟进，两邊都利用邊沿计谋，會讓全部场合排场愈加的伤害。壮士再往前一步不是成义士就是成疯子。

在糊口中碰到怯夫博弈，我說我愿意選擇當一個怯夫，為甚麼？由于幸福感低落斗争性，具有幸福就是咱們晓得忍讓的最佳来由。

在怯夫博弈中，想要讓對方给咱們讓路，除背城借一以外，加倍合适中國人伶俐的法子是示弱，展現艰苦，暗藏幸福。

關于自愿者窘境，必要用到调解小我的價值功效的法子，無妨讓本身功效涵盖的范畴大一些，為他人做出一點捐躯，對本身而言并不是是只有丧失，為此咱們還可以收成快活，勇气和自傲。求仁而得仁，又何怨？

關于两性战役，是如安在多個纳什平衡當選擇此中一個。可以從以往老例，同类均匀，當局引导，乃至是抽签随機，找到一個聚核心，就可以引刊行動，告竣互助。

进一步咱們說了鹰鸽博弈，博弈是一個動态的进程，没有甚麼無往晦气的最终计谋，選擇當老鹰仍是鸽子，不是感性的偏好，而是理性的计较。

最後就是今天所說的，在浩繁的博弈计谋中，一报還一报就是一個优异的選擇，仁慈、以直埋怨、宽容、清楚，我選擇做一個简略的、仁慈的人。

最後，借用一句余秀华的话：我從不期望吸引他人，由于我感觉如许很浮浅，我得吸引我本身，當對本身有了酷爱，才能完成今後一個個孤独而漫长的日子。

但愿經由過程這6期节目標分享，能讓博弈論對你有所帮忙。

頁: [1]

全台最大電子遊戲中心論壇's Archiver

解讀《博弈論與生活》6、最佳策略:做個简单的好人