博弈论中的囚徒困境-中国轻博客始祖的困境：喵友的理想主义主义悲剧

发布时间：2017-11-03 所属栏目：理想国中的正义

一 : 中国轻博客始祖的困境：喵友的理想主义主义悲剧

这个世界上本没有轻博客这种东西，只因为大家都一窝蜂地模仿借鉴着Tumblr，才诞生了这么一个仅仅存在于中国的概念。

早在点点、新浪Qing以及网易LOFTER等推出前，从大学退学的黎言卓就在2010年创办了将自己定位成一个实时分享信息的博客社交网站喵友（Catfan.me）。

现实就是如此荒谬，自始至终都不承认自己是轻博客的喵友却是国内最早的轻博客网站，用户可以在上面实现文字、图片和视频等各种信息的社交分享。

喵友现在的处境并算不上多好，它的尴尬就在于身上既有传统博客的影子，同时还有着微博的基因，它从来没有把自己当作轻博客，但是这三种产品的特性在它身上都或多或少地体现出来。

喵友可以进行Widget的自行定制，但是这种功能对曾经的博客用户来说并没有什么新鲜的地方，可以实现用户界面的自我定制，可是现在的新浪微博都可以提供这样服务。

用户在微博上同样可以进行实时地分享包括文字、图片、视频在内的信息，与之相比，喵友在这方面的优势并不显著。它使用了大量的技术来让用户有更好的体验，但是用户对此并不关心。

传统博客正在衰落，新兴的轻博客也并不像大家预想得那样在国内发展得如火如荼，大多数人用户更倾向于在微博上分享自己的内容，在这种情况下，喵友这样混合着各种因素的四不像要想在市场上获得成功无疑困难得多。

2010年3月喵友推出，2011年7月用户超过七千，到年底用户总数增长到九千多，这样的用户增长趋势并算不上好看。大环境和趋势对喵友的发展来说本来就不算有利，而它自己的理想主义坚持更把这种悲剧情绪渲染到了极致。

已经不再支持IE8以下的浏览器，这意味着喵友已经抛弃了绝大多数可能的潜在用户；前端使用着自己开发的Qatrix架构，设置了繁简中文、英语与日语四种语言界面，这无形之中增加了喵友的维护和开发成本。

孤身一人的黎言卓用各种技术为希望为用户提供更好的服务，然而孤军奋战的他很难做到尽善尽美。

不少用户都在反映各种莫名其妙的奔溃和Bug，无论在电脑还是手机上，我始终无法打开喵友的移动版网站，它的服务器响应速度依然很慢，喵友至今的发展史就是一部不断改进不断优化的改错史。

即使经过了无数次或大或小的改善，即使刚刚在三天前才发布了自己的新版本，即使已经有了一个足够称得上优雅和清新的界面，喵友还是称不上完美，还有很多问题和缺陷，它现在还没有商业上的企图，还在努力地让用户感到满意。

直到现在，喵友全靠黎言卓一人开发维护，没有找到任何投资者，他自己支撑着这间网站，这个自小就对电脑感兴趣大学却学习英语专业的年轻人对产品设计、推广、内容策划等并没有多少专业知识，所以喵友的产品远称不上完美。

独立的黎言卓，小众的喵友，两者结合起来就是一个让人充满期待却又不免有些叹息的故事。

尽管已经有了自己固定的用户群体和自己的风格，尽管有着不错的用户活跃度，但喵友现在依旧是一个名副其实的小众网站，只有那些对ACG和二次元感兴趣的用户或许才会知道喵友，只有那些愿意尝试愿意体验别致服务的用户还在使用它，那些使用它的人对它有着极高的兴趣和忠诚，而更多的人既没有听说也没有使用过它。

黎言卓是一个理想主义者，喵友同样也是一个追求极致的理想主义网站，那么在这个结实的现实世界里，他们的前路又在哪里呢？

文章来源：tech2ipo.com

二 : 囚徒困境的论文

走出“囚徒困境”

囚徒困境作为博弈论中的一个经典范例，其博弈理论逐渐被经济学、哲学、伦理学、管理学等诸多学科的研究所重视，辩证的看待这一研究现象，是促进人们深入研究相关社会现象的一种特殊的思维路劲和方法。

一、囚徒困境经典案例分析

囚徒困境的内容是这样的：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。若二人都互相检举（互相“背叛”），则二人同样判监2年。

用表格概述如下：

们各自都有“不坦白”和“坦白”两种可选择的策略；因为这两个囚徒被隔离开，其中任何一人在选择策略时都不可能知道另一人的选择是什么，因此不管他们决策的时间是否真正相同，我们都可以把他们的决策看作是同时做出的。博弈的结果是：由于这两个囚徒之间不能串通，并且各人都追求自己的最大利益而不会顾及同伙的利益，双方又都不敢相信或者说指望对方有合作精神，因此只能实现对他们都不理想的结果（各判2年），并且这个结果具有必然性，很难摆脱，因此这个博弈被称为“囚徒困境”。

“囚徒困境”告诉我们，个人理性和集体理性之间存在矛盾，基于个人理性的正确选择会降低大家的福利，也就是说，基于个人利益最大化的前提下，帕累托改进得不到进行，帕累托最优得不到实现。但是这样的分析是基于单次

三 : 博弈逻辑中理性人假设的困境与思考 83

2007年第9期(总第200期)学术论坛ACADEMIC　FORUMNO.9,2007

(CumulativelyNO.200)

博弈逻辑中理性人假设的困境与思考

张　峰

[摘　要]博弈逻辑是近年来兴起的一个逻辑学的新分支。,,是博弈逻辑的基本假定,然而理性人假设在现实中遇到了挑战。、个体理性与,[关键词];;;集体理性[,哲学博士,北京　100081

[[文献标识码]A　　[文章编号]1004-4434(2007)09-0007-04

博弈逻辑(GameLogic)是近年来兴起的一个

逻辑学的新分支,是博弈论和逻辑学相交叉的研究领域,属于应用逻辑范畴。博弈逻辑研究理性的主体互动行动中的推理过程,即研究博弈中的推理问题。博弈逻辑拓展了逻辑学研究的深度和广度。

理性人假设,即所有的参与人都是理性的,是博弈逻辑的基本假定。理性人的本质是现实人或社会人。有学者认为理性人就是使自己的效用最大化的人。还有不少学者认为,理性人是指有一个很好定义的偏好,在面临给定的约束条件下最大化自己的偏好,就是人们在行为时,不仅要优先考虑自己的需要,而且要兼顾他人的需要和其他给定的约束条件。在博弈逻辑中理性人是指具有推理、决策能力并通过选择策略使自己的得益或支付(Pay2off)最大的人。

但是,理性人假设受到了现实的挑战。在理性人假设的前提下,不仅要求博弈方掌握完全的信息,而且对博弈方的理性提出很高的要求,包括知识水平、计算能力、理解能力、预测能力、相互信任和不会犯错误等各种方面的能力。然而,要求普通的决策者都具有这样的知识水平和理性能力常常是不切合实际的。现实中的决策者所面临的决策环境远比研究者讨论的、经过高度抽象简化的博弈环境要复杂得多。在理论上,理性之间也往往存在冲突,如个体理性与集体理性的矛盾。

理性人假设存在着问题,博弈逻辑又是建立在

此基础之上,那么是否博弈逻辑的理性基础隐藏着理论隐患,已经出现了“基础松动”的可能?博弈逻辑的理论大厦是否能够坚实、稳固?这是一个值得深思的问题。

一、完全理性假设的困境

在博弈逻辑中,参与人在博弈中如何行动、选

择自己的策略,都是经过一番推理后采取的,博弈推理必须要有前提条件。为此,博弈逻辑给出了“理性人”的假设前提。在博弈逻辑中,不仅假定了博弈参与人是理性的,而且假定了“所有参与人是理性人”是博弈参与人之间的公共知识,就行为人对现实世界的认识能力而言,这是一条非常严格的假设。很显然,现实世界这种假设通常是得不到保证的,这正是博弈逻辑所遇到的一个困惑。

博弈逻辑研究的主要问题就是人们在互动行为中的推理问题,就是在人们的利益和行为有直接的相互影响和作用的情况下个体的理性选择与行为。因此,它不仅要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。因为,如果人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

[基金项目]本文是作者主持的国家社会科学基金青年项目(07CZX018)《博弈逻辑研究》的成果之一。

为博弈逻辑的基础,交互理性是其基本的理性要求。这样,在博弈逻辑中,“理性”就不再仅仅是一个个人主义的概念了。当相关决策者之间的理性层次存在明显差异,或者决策者之间缺乏足够的了解或者相互信任的情况下,要求博弈参与者满足交互理性的要求显然是比较困难的。

在博弈逻辑的研究中,在理性基础方面采用的是一种“完全理性”的假设。交互理性、理性的共同知识及其所要求的参与者的相互信任等因素是建立在所有博弈参与者都有“完全理性”或“充分理性”的基础之上的。完全理性不仅要求行为主体始终以自身最大利益为目标,,;理性,,有理性的公共知识。这种完全理性假设的现实性明显是有问题的,因为它不仅意味着博弈方绝对不会犯错误,决不会冲动和不理智,即使在复杂的多层次交互推理中也不会糊涂,不会相互对对方的理性、能力、信任和对信任的信任等有任何怀疑和动摇。

但是,在现实中,个人总是受有限理性的制约,如每个人的智能与知识、所掌握的信息都是有限的,很可能并不了解自身利益最大化的目标值究竟是多少,也很可能并不了解实现目标值的最佳策略是什么,在决策时还难免受各种因素影响。现实中的博弈者往往是有限理性的,人们很少能够一贯地按完全理性原则行动;此外人们在生活中经常受信息不对称、风险偏好不同以及情感、心理、宗教、价值观、道德等因素的影响和制约,而不去追求“合理的”目标,或者目标合适时却无能力选择最佳的策略。不仅个人的策略选择经常会犯错误,集体决策同样也经常会犯错误。人类社会频繁发生各种战争冲突、企业选择领导人的盲目性和低效率等,都是人类集体选择决策理性不完全的证据。

因此在博弈分析中,人们理性方面的局限性事实上是无法回避的。如果不承认这个事实,坚持只是在缺乏现实性基础的完全理性假设下进行博弈分析,不讨论人们的理性局限对博弈分析的影响,博弈逻辑的发展就会不可避免地遇到各种严重的矛盾和困难,就无法对各种社会关系和现象作出科学的分析解释和预测,就会造成理论分析与博弈现实的严重落差,这当然对博弈逻辑的发展是很不

利的。

为使理论免受假设非现实性的“伤害”,必须“夯实”博弈逻辑的理性基础。加强博弈逻辑的现实性基础的根本方法就是以有限理性的博弈方作为博弈分析的基础,引进学习和进化机制作为“补救措施”,研究博弈行为中的推理问题。

(BoundedRationality)假说最早由“有限理性”

赫伯特?西蒙提出,他认为人的认识是“意欲合理,但只能有限地做到”,主要表一个剩余范畴—的,信息的不完全性,或。因此,有限理性条件下的人类行为特征是:(1)经常调整行为目标。由于行为环境不确定、人们知识和理性能力的增进或价值观念的变化,人们行为的目标会随之改变。(2)经常性调整实现目标的行为。随着客观环境的变化与人们认知能力的提高,人们会加深对周围环境的认识,在此基础上,人们会调整实现目标的行为,以便更好地实现目标。(3)在决策中采用“满意原则”或“次优原则”。

有理性局限的行为主体(博弈过程中的博弈方)称为“有限理性”的博弈方。有限理性首先意味着博弈方往往不能或不会采用完全理性条件下的最优策略,意味着博弈方之间的策略均衡往往是学习调整的结果而不是一次性选择的结果,而且即使达到了均衡也可能再次偏离。有限理性理论放宽了参与人理性能力的要求,比较符合实际情况。这样,博弈逻辑就通过不断学习进步的行为主体的设定修正了完全理性人假设,强调非理性的行为主体是在不断学习过程中逐步达到理性的。也就是说,在博弈逻辑的研究中,承认个体的非理性行为在现实中是客观存在的,并不否认理性人“偶尔”也会犯错误,理性人的理性选择之手也会“颤抖”。当然,要求博弈参与者有根据对过去时间的观察和资料积累,进行准确的判断分析并准确地调整策略的能力,也并非人人都能具备。有限理性有多种情况和层次。有些博弈方理性程度较高,有些则非常低,有些学习速度很快,有些则很慢。不同理性层次和学习速度的博弈方学习博弈和调整策略的方式和速度显然会有差异,“学习”和“进化”机制的引进使得博弈论对人的理性要求在一定程度上有所放松。

①(美)赫伯特.A.西蒙著,杨砾、徐立译.现代决策理论的基石———有限理性说.北京经济学院出版社,1989年,第3-4页。

这样,从理性要求最高的,要求所有博弈参与者都具有通过内省和推理式的纳什均衡分析,一次性同时选择同一纳什均衡的策略,从而实现纳什均衡的“充分理性”;到理性要求相对较低,允许博弈参与者“犯错误”,可以多次选择和改正错误,但必须有“认识错误和改正错误”能力的、通过“学习”和“进化”逐步实现纳什均衡的“有限理性”;博弈逻辑的理性基础便通过理性人概念的弱化而得到了加固。

是如何导致公共利益受损的恶果。哈丁设想古老的英国村庄有一片牧民可以自由放牧的公共用地,每个牧民直接利益大小取决于其放牧的牲畜数量,一旦牧民的放牧数超过草地的承受能力,过度放牧就会导致草地逐渐耗尽,而牲畜因不能得到足够的食物就只能挤少量的奶,倘若更多的牲畜加入到拥挤的草地上,结果便是草地毁坏,牧民无法从放牧中得到更高收益,这时便发生了“公用地悲剧”。这是一种集体行动的悲剧,人口问题,污及备,与此相同的。如在我、沙漠化威胁的地区,当地居民关于保护还是毁坏防风防沙林带的选择,就可看作一种公共资源博弈问题:每个人都想,如果只有自己砍几棵树,只要别人不砍就无关紧要,自己却可得利,而如果其他人都砍而只有自己不砍,则防护林也保护不了,还不如自己也砍。最后的结论是砍总是合算的。大家这样想的结果是,防护林带完全被破坏,整个地区都被沙漠吞没,人人都被迫离乡背井,最终不幸的不仅有个体,还有集体。

以上案例分析可以看出个体理性与集体理性之间存在着矛盾:博弈主体从利己的个人理性出发,对他人利益持“不合作”态度,只顾一味“争夺”自身利益,完全置他人利益于脑后,其结果可能导致两败俱伤,既不能“主观为己”,更不能“客观为人”。也就是说,个体理性可能导致集体非理性。那么,集体非理性的原因是什么?解决问题的方法又该是什么呢?显然,博弈主体间的利益冲突正是集体非理性存在的基础。

有学者认为,理性必须以所有参与人为出发点,以集体理性(即所有参与人的效用总和最大化)取代个体理性。但是笔者认为,博弈逻辑的一个基本思想是承认个体理性与集体理性之间的差异、矛盾和冲突。对于这种矛盾和冲突,不在于否定个体理性,关键是建立起一种激励兼容机制。这种机制对个体理性具有自我实现的机能,即在这种机制中,个体理性能自我实现并自发地达到集体理性。

在社会生活中,道德是消除集体行动悲剧的一

二、个体理性与集体理性的冲突

在社会生活中,以“为例。有甲、乙两个共同偷窃的小偷被警察抓起来了,为了防止他俩串供或结成攻守同盟,将其分别关押在不同的房间。囚徒面临这样的“政策”:如果一方“坦白”,供出自己与对方以前所做违法之事,而对方“不坦白”,“坦白”方将无罪释放,对方会被判重刑8年;如果双方都坦白则各被判刑5年;而如果双方均“不坦白”,因警察找不到其他证明他们以前违法的证据,只能对他们的偷窃行为进行惩戒,各判刑1年。

在这个博弈中,每个小偷都有两种可选择的策略:坦白或不坦白。显然,不管对方选择什么策略,每个小偷的最优策略都是“坦白”。比如说,如果乙选择坦白,甲选择坦白时被判刑5年,选择不坦白时被判刑8年,因而坦白比抵赖好;如果乙选择不坦白,甲坦白时无罪释放,不坦白时的被判刑1年,因而坦白还是比不坦白好。就是说,“坦白”是囚徒甲的最优策略。类似地,“坦白”也是囚徒乙的最优策略。双方均选择“坦白”的策略组合是纳什均衡①。

“囚徒困境”告诉我们,个体理性和集体理性之间存在矛盾。两个囚徒决策时都以自己的最大利益为目标,结果是无法实现最大利益甚至较大利益,这是理性的囚徒难以摆脱的困境。

与此类似的是公共地悲剧(TragedyofCom2mons)。1968年英国科学家哈丁(G.Hardin)在美国著名的《科学》杂志上发表了《公用地的悲剧》一文,此文描述了理性地追求最大化利益的个体行为

①“纳什均衡”概念是美国著名数学家约翰?纳什(Nash,J.F)提出的,即假设有n个人参加博弈,给定其他人策略的条件下,每个人选择自己的最优策略,所有参与人选择的策略一起构成一个策略组合。纳什均衡指的是这样一组策略组合,这种策略组合由所有参与人的最优策略组成。

个良方。道德就是由群体实施的对所谓“非道德”的行为进行非强制性的激励与惩罚机制。显然,道德是保证承诺的可信性的一个有力手段。道德向我们发出的戒律,要求我们克制自己的私利而成全社会的公利。正因为它发自人们的内心,我们才会相信他人会做出道德的事情。有了以道德为基础的沟通,人们达成合作就会容易得多。以道德作为

(Assurance约束的协调博弈可以称为“信任博弈”

Game),在这样的博弈里,困境消失了,合作得以实现。当然,道德的人并非不理性,理性的人是对得与失作出充分计算后行动的人。这也是道德存在的科学解释。

作,的矛盾。违法行为”实施的中心惩罚机制。而法律机制调整集体理性与个体理性之间的矛盾的途径是多样的。例如,民事诉讼实际上是一个零和博弈,诉讼的结果只是调整了当事人之间的相对收益,没有创造新的财富,并且任何一方当事人进入诉讼过程中都要承担一定的原本可以避免的成本(包括时间、金钱等)。因此设定诉讼的一个目的就是提高了当事人从合作到不合作的机会成本,使他们留在合作的均衡路径上。合同关系中的违约也是如此,违约后当事人之间出现了囚徒困境式的博弈结构,再协商合作将得到更高的收益,相互对抗只能是两败俱伤,从而迫使当事人履约。

虽然理性人假定的强化程度对博弈逻辑的理论大厦造成一定的冲击,在一定程度上限制了博弈逻辑的适用范围;现实中的理性和非理性相互交织难分彼此,个人理性的强化不应该排斥非理性的影响。

在博弈逻辑中,引入有限理性的概念,有助于博弈逻辑的深入研究。我们不仅要研究“完全理性”的博弈逻辑,也要研究“有限理性”条件下的博弈逻辑,。如果我们只是在”,显然是不够的。对这类,拓宽了博弈逻辑的研究领域,使得博弈逻辑在今后有巨大的发展潜力。

笔者认为,尽管“完全理性人”的假设与现实有比较大的反差,但是“有限理性人”的假设还是成立的。“理性人”假设的价值在于能够使我们在研究问题时更容易抓住本质的问题,简化研究工作,有利于构建理论模型。从“完全理性人”假设到“有限理性人”假设,会增加我们研究问题的复杂性与难度,给我们的研究方法与手段提出更大的挑战;但是博弈逻辑的研究会越来越接近现实。而且笔者相信人类社会也存在类似生物世界“适者生存”的客观规律;无论人类是否是充分理性的,不理性的行为将无法维持下去,而最终生存下来的行为必然是理性的。因而,尽管理性人假设与现实有相当的距离,但它仍不失为分析博弈行为的良好工具。

关于个体理性和集体理性可能存在着矛盾和冲突的问题,笔者认为,人类社会在不断探索满足个体理性的基础上能够达到集体理性的激励兼容机制。在这种机制中,个体理性自我实现并自发地达到集体理性。事实上,这些激励兼容的机制的建立与完善也是人类社会发展进步的一个缩影。

[参考文献]

[1]MarcPauly,Gamelogic———AnOverview[J].

Logica,vol.75(2),2003

[2]潘天群.博弈生存———社会现象的博弈论解读(第2

Studia

三、简评博弈逻辑中的理性人假设

如何认识和评价博弈逻辑中的理性人假设?

笔者认为:假设是任何科学研究的前提。关键在于作为科学研究的前提的假设是合理的还是不合理的。尽管日常生活的人有理性也有非理性,但是理性人不仅在事实表象上概率占优,而且在科学研究上条件占先。换句话说,在现有的数学工具和实验条件下,理性人比非理性人更便于为科学所把握。也就是说,在科学上,理性人假设比非理性人假设更方便。理性人假设使得人们得以运用数学工具描述人的行为,构造人的行为模型。

尽管博弈逻辑处于初创时期,它的基础理性人假设却面临着质疑。正如其他科学的发展过程所昭示给我们的,基础需要不断夯实一样,博弈逻辑基础也需要进一步的夯实。对理性假设困境的探讨有助于博弈逻辑理论大厦的稳固,也有助于博弈逻辑的进一步发展。10

版)[M].北京:中央编译出版社,2004.

[3]谢识予.经济博弈论(第2版)[M].上海:复旦大学出

版社,2002.

[4]张峰.逻辑学的新分支———博弈逻辑研究现状分析

[J].哲学动态,2005,(2).

[5]张峰.论博弈逻辑[J].学术论坛,2006,(3).

[责任编辑:青　山]

本文标题：博弈论中的囚徒困境-中国轻博客始祖的困境：喵友的理想主义主义悲剧
本文地址： http://www.61k.com/1068825.html

上一篇：农村信用社调查报告-市农村信用合作联社全面检查调查报告
下一篇：难忘的学校生活-学校的生活

61阅读

博弈论中的囚徒困境-中国轻博客始祖的困境：喵友的理想主义主义悲剧

解决问题的方法

案例分析

创业