博弈论的读书笔记
【篇一:博弈论读书笔记】
博弈论读书笔
博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈的思想既然来自现实生活,它就可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。没有高深的数学知识,我们同样通过博弈论的学习成为生活中的策略高手。孙膑没有学过高等数学,但是这并不影响他通过运行策略来帮助田忌赢得赛马。
博弈时时存在,它就在你的身边。本书就是试图通过日常生活中常见的例子,来介绍博弈论的基本思想及运用,并且寻求用种智慧来指导生活决策的方法。
在李凌、王翔的《论博弈论中的策略思维》中,作者从博弈论的起源谈起,回顾了博弈论在诺贝尔经济学奖上所取得的成就,把博弈论中的经典案例同生活中的实际例子联系起来进行分析,从合作、模仿、创新、拍卖、战争和群居等实例表明博弈论中的策略思维是如何影响人们的行为的, 又是如何使得博弈达到均衡的。最后,围绕演进博弈论的基础理论与实例案例来分析对传统博弈论的冲击,及其使博弈论的发展上升到了一个新的阶段和深度。
以下是对这篇文章中的囚徒困境、智猪博弈和演进博弈论的简述和分析:
一、囚徒困境—合作还是不合作
在这个模型中,合作还是不合作问题得到了很好的解释,纳什均衡解就是都选择坦白,也就是跟对方囚徒不合作,但这个解对两个囚徒来说并不是帕累托最优解,囚徒困境反映了集体理性和个人理性的矛盾。联系到实际生活中的例子政府提供公共物品,如果让使用资源者自愿承担费用,则会由于搭便车现象的出现,而无法实现共同提供公共物品的目标,所以需要政府通过纳税的方式来提供,以实现帕累托最优,达到资源的有效配置。囚徒困境有限次重复博弈中,当一次性违约的收益大于失信所必须付出的代价时, 企业就存在偏离合同规
定行事的激励,这种内生的激励表明,“损人利己”也是行为人的理性选择。在无限次重复博弈中,如果企业之间致力于长期合作, 就应当设法改变合作机制, 降低合作企业发生机会主义行为的概率。除了健全社会诚信体系之外, 一种行之有效的方法便是提高失信成本。然而在实际生活中的局中人可能受各种外部环境因素或者市场地位的影响,并非是完全理性的,所以在合作方面还存在着一定的风险,这就需要订立合作契约,将这种风险最小化,从现实经济利益的角度提高失信成本,使失约威胁实现真正的可置信。
二、智猪博弈—创新还是模仿
在智猪博弈中,在理性人的假设下,大猪和小猪的支付矩阵决定了大猪选择按,小猪选择等待。类似的,在股票市场中,大户是大猪, 他们进行技术分析, 收集信息、预测股价走势, 所付出的成本高,而相应得到的收益也比较高,而大量散户就是小猪, 他们几乎不花成本去进行技术分析, 而是跟着大户的投资策略进行股票买卖, 这就是股票市场上著名的“散户跟大户”现象。在股份公司中, 大股东是大猪, 他们收集信息、监督经理, 拥有决定经理任免的投票权, 而小股东是小猪, 他们不直接花精力去监督经理, 投票权重也往往无足轻重, 但他们却可以从大股东的监督中受益。在技术创新市场上, 大企业是大猪, 它们投入大量资金进行技术创新, 开发新产品, 而中小企业是小猪, 它们不会进行大规模的技术创新, 而是采取“跟随策略”, 等待大企业的新产品形成新的市场后, 仿制大企业的新产品展开销售。尤其在商品市场中,智猪博弈模型更能够说明企业的创新还是模仿问题,能够很好的解释很多企业在产品研发方面的决策,有资金实力和研发条件的大企业可能会追求产品创新,开发新产品、新工艺,开拓新市场,试运行新的企业模式和制定新的制度,经过这些大企业的亲身验证之后,小企业才会去模仿,达到降低研发成本及风险的目的。然而,我国目前很多企业都不愿意去创新也有这方面的因素,研究开发花了大成本,而收效却不大,或者很快就被其他企业模仿而无法达到长期保持核心竞争力,所以就打击了企业的创新积极性。这就验证了当小猪的搭便车行为切实危害了大猪利益时,小猪的搭便车也就要终止了。在解决这个问题方面,需要改变大企业和小企业的支付矩阵,才能从根本上激发企业的创新激情,比如专利制度和知识产权制度能够增加创新企业的收益,同时也会提高模仿企业的成本,如此就可以平衡双方的收益,鼓励企业利用现有资源大力投入研发,从而创造更多的财富,但当前我国这方面的制度立法还不够完善,对知识产权的保护力度和盗版的惩处力度还不够,对企业创新会产生一定程度的负面影响。同时,中小企业如果一味的充当跟随者的角色,没有企业自己的核心竞争力,那么其长远发展就会存在一定的问题,所以,中小企业也应当通过
模仿来消化吸收再创新。另外,智猪博弈模型能给小企业很多启示,比如避免与大企业在产品成本、产品价格、销售渠道等方面的恶性竞争,充分利用灵活机动,反应速度快,能跟好的把握市场需求并接近客户,对潜在的细分市场有敏锐的洞察力等方面的优势,审时度势,借力发展,也可以进入那些市场容量较小,有开发潜力,而大企业不屑或者不宜进入的行业或领域以求得生存和发展。
三、演化博弈论: 理性经济人是否无限理性
演化博弈论修正了传统博弈论中对理性经济人似乎超人般无所不能的超理性假设, 强调习惯、习俗、规则、遗忘、冲动、热情、非理性预期和犯错误的概率等被传统博弈论所忽视的内容,它主张行为人的策略选择不仅与个人理性有关,而且它还要由社会习俗、惯例来决定,并将人类在经济活动中的互动行为的动态调整过程模拟为类似于生物学中的进化、演进过程。它的合理性在于,指出经济人并非超理性的, 而是基于个人习惯、习俗和惯例等一些生活常规、社会秩序,在多数情况下, 他们在所掌握的信息基础上相当理智地行动。也就是说, 当适应性过程有足够时间展开的话, 是演化力量而不是个人理性在社会制度变迁中起着关键性的决定作用。因此, 演化博弈论对均衡概念的理解也与传统博弈论有本质的区别,就像在一个靠左行驶的国度中, 靠右行驶的代价就是车毁人亡。但这并不意味着制度和规范是一成不变的, 是可以超越历史的。如法国大革命之后, 关于“民主”的呼声要求拿破仑的军队采用向右行使的新的规范,并逐渐传播到他所占领的一些国家中。在此后的两百年内,随着道路资源使用频率的增加,局部性的规范逐渐演变成地区性的,葡萄牙、西班牙和奥地利等国家渐进但又稳定地变更了行车规则,直至整个欧洲大陆, 而此时关于行驶的最佳策略无疑是靠右行驶。演进博弈论实际上打开了我们研究博弈论的思维,将我们从一个绝对理性的领域,带入了一个更合乎真实社会发展状态的领域。它改变了我们对博弈均衡永久性的认识,让我们对博弈分析变得更加灵活、契合实际。这正体现了博弈论源于生活的本质,生活中的一些经验法则、习俗、习惯都可以在博弈论中找到相似的元素,它凝炼深邃而透彻的策略思维, 正体现了人类智慧的最佳发挥。
参考文献
[1] 李凌,王翔. 论博弈论中的策略思维[ j] .上海经济研究, 2010.1,(35-41).
[2] 郭洪伟. 囚徒困境的均衡辨析[ j] . 技术经济与管理研究, 2011.2,(22-25).
[3] 李军林,郭亚玲. 理性、均衡与演进博弈论[ j] .南开经济研究, 2000.4,(48-52).
[4] 向钢华,王永县. 当代西方基于博弈论方法的威慑理论综述[ j] . 国外社会科学,
2006.3,(71-75).
[5] 李军林, 李世银. 制度、制度演进与博弈均衡[ j] .教学与研究, 2001.10,(44-50).
[6] 余静文, 胡雅琴. 制度变迁中路径依赖的一般均衡分析[ j] . 统计与决策,2007.20,
(42-45).
[7] 杨懋,祁守成. 囚徒困境 从单次博弈到重复博弈[ j] .商业时代, 2009.2,(14-15).
[8] 岳峰. “智猪博弈“对中小企业发展战略的启示[ j] . 桂林电子工业学院学报,2005.12,
(72-75).
[9] 杨文杰, 刘向晖. “智猪博弈”与中小企业的创新[ j] . 技术与市场,2012.9,
(101-102).
[10] 林健,范佳凤. 集群企业协同创新的智猪博弈恶化及治理[ j] .系统工程, 2006.4,
(31-34).
【篇二:博弈论读书笔记】
以前没发现,但在学习了博弈论基础的知识后,很容易的发现,博弈如同空气般,围绕在我们身边,无处不在。生活中的大小事怎么个博弈法,通过下面一个例子来说明生活中的博弈。
刚刚过去的双十一光棍节,众多电商电商提前燃起双十一网购战火,我们是否跟风疯狂购物还是理性看待促销噱头?买衣服的时候,跟老板砍价,砍多少?你跟你朋友玩剪子——石头——布的时候,出剪子?石头?布? “家家有本难念”,就是司空见惯的夫妻吵架也是一场博弈。夫妻双方都有两种策略,强硬或软弱。用博弈的方式模拟出来,博弈的可能结果有四种组合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。而在竞争激烈的商业界,博弈就更为常见。比如两个空调厂家之间的价格战,双方都要判断对方是否降价来决定自己是否降价,显而易见,厂家之间的博弈目标就是尽可能获得最大的市场份额,赚取最多的收益。事实上,这种有利益(或效用)的争夺正是博弈的目的,也是形成博弈的基础;…………这些就是博弈。或许你很难想象,一天24小时,你都在博弈。有人说,听你乱说,睡觉不博弈了吧?不,是的,在你睡觉的时侯,都无法逃避博弈这个问题。因为在一定程度上,你大脑有意识无意识地选择做不做梦,这可能就是一个博弈问题了。
看来,我们的生活真的就是跟博弈问题息息相关。而在这样一个复杂的博弈战场上,我们怎么能使得自己在博弈场上获得最大的利益就是一门很大的学问了。所以,博弈论是一门很有用的学科。通过读书学习让我又懂得了一问学问。
按书中分类,博弈大致有以下两种分类:按照博弈各方是否同时决策可以分为:同时决策博弈(静态博弈)、序贯决策博弈(动态博弈)、同时决策博弈与序贯决策博弈的混合博弈。按照大家是否清楚各种对局情况下每个人的得益分为:完全信息博弈和不完全信息博弈。自由组合一下啊,就会发现博弈的四大部分:完全信息的静态博弈、不完全信息的静态博弈、完全信息的动态博弈、不完全信息的动态博弈。
博弈论原本为游戏理论,这一理论涉及的‘游戏’范围更广:人际关系的互动、球赛或麻将的出招、股市的投资等等,都可以用博弈论巧妙地解释,可以说,红尘人世,莫不博弈。”这就是《每天读点博弈论》中句子,说明了在人的一生中处处存在着博弈,只看你是如何去做罢了。
在整本书中,我感触最深的就是“信息博弈,比的就是信息”。信息在现今的社会中,是非常重要的,每天从睁开眼睛开始,就开始接触信息,小到每天的对话,大到报纸新闻,近到邻里之间,远至古今中外,信息无处不在。那我们在这些信息中如何捕获自己所需的信息?如何使自己获得最大的利益?
俗语说:车到山前必有路,船到桥头自然直。我以前理解成,无论多少难做的事情,到最后总会有办法的,可是却从没想过,为什么最后总会有办法解决呢?这本书中写到:收集信息不仅是解决问题的一个步骤,而且有时起到极为关键的作用。比如,当各种方法都尝试过,当问题成了一团乱麻,一切都僵住了。这时,最好的办法是再问
问自己,原来收集的信息够全面吗?有没有漏掉的信息?解决之道,很可能就藏在被你忽略的信息中。从这个信息中,我明白了,不是事情到最后总会有办法,而是当人们面临最大的困难时,会收集所有的信息,再从中一一击破,选中解决事情的最终办法。那为什么到最后一步才有办法了呢?其实我们可以从这句话中理解到,原来当我们有多种选择的时候,只从最有可能有结果的信息着手,往往忽视了自己身边最有利的一些小信息,而从堵死了自己的每一条路,正所谓,一着不慎,满盘皆输,这就是,我们从信息中,没有找到最有用的信息,导致了自己一败涂地,从中看到了信息的重要性。从而也说明了,千万不要轻视信息,以为信息已经足够用了,适量的信息意味着你的思路会被拓展得更宽。
我们学会了,如何注意身边的一些小信息,如何收集信息,但还要学会利用信息。在书中提到:任何时候,都不要只做被动接受信息的那个人,要学会主动利用信息。在现实生活中,我们都有体会,即使掌握了信息,如果不会运用,那信息对我们来说也是没有多大的用处。我们如何利用信息呢?我认为,当我们得到信息时,而不是本身的获得,而我们要重新开始认识信息,把所获得的信息认真分析,认真思考,让其发挥出最大的效用,只有这样,我们才不会让有用的信息白白的流失。当今社会处,信息无处不在,我们每一个人也离不开信息,那我们把信息运用到自己的生活中,那就是信息的博弈,正所谓:信息博弈,比的就是信息。
【篇三:博弈论读书笔记】
博弈论读书笔记(生活中的博弈论)——世界图书出版公司 余治国,江雨燕著 相关电影《美丽心灵》——纳什均衡
竞合游戏(纵合,利己心理)
纳什均衡——选择最优策略,想办法迫使对方策略不变,或威胁和要求对方,找到双方能够接受的解决方案,而不至于两败俱伤。(价格战),
当一个小企业刚起步不会对大企业构成威胁时,有机会扩大发展,但如果他觉得你存在威胁,你就会面临风险,要懂得避其锋芒。
为什么相同的商店会就在隔壁,甚至做邻居,像kfc和m记,这涉及位置博弈,相挤到一起,顾客基本一致,把选择权交到消费者手上,这时候服务和价格很重要,通常价格相差无几,否则很容易造成两败俱伤,所以服务最重要。
猎鹿原理——合作共赢
帕累托效率原理——经济的效率体现于配置社会资源以改善人们的境况,主要看资源是否已经被充分利用。如果资源已经被充分利用,想要再改善我就必须损害你或别的什么人,想要改善你就必须损害另外某个人
囚徒困境——利己损害他人是最优策略
囚徒困境破解——事先约定,信任(自我总结)
零和游戏——在一个集体里,可能每个人的选择都是理性的,但对于整体来说其结果却不是理性的。(机关算尽太聪明,反误了卿卿性命)
霍布斯对合作协议的观点:不带剑的契约不过是一纸空文。它毫无力量去保障一个人的安全。
猴子的故事与道德约束(猴子抢蕉,只有少数猴抢到,抢不到的猴看不过眼就打他,心理:我拿不到的东西,别人也别想拿到),既然道德不起作用,那么就只能依靠法律来约束了
艾克斯罗德试验中的争锋相对策略——胡萝卜加大棒原则(1.从不背叛,即“善良的”,
2.对于对方行为不能总是合作的,即“可激怒的”,3.不能人家一次背叛的,你就没完没了报复,以后人家只要改为合作,你也合作,即“宽容的”)打要还手,因为不打会让对方更加猖獗,而选择回击是遏制对方进一步侵犯的方式,毫无疑问是要选择回击的。
智猪博异——在一个双方公平,公正,合理和共享竞争环境中,有时占优势的一方最终得到的结果却有悖于他的初始理性。在日常关系中,一些人会成为不劳而获的“小猪”,而一些人充当了费力不讨好的“大猪”在应聘中,如果2者都拥有2项技能,而刚好2个岗位都缺人,那么就得强调薪酬更高的那个岗位,得到那个岗位的几率会提高
在实力悬殊的公司之间的价格竞争策略也是这个道理。在竞争中,如果是弱小的一方,可以采取以下策略:
1. 等待,静观其变。
2. 不要贪婪,妄图将“大猪”的那份也据为己有。
3. 警防大公司利用雄厚的资金,采取价格优势打垮你
如果是“大猪”可以采取以下策略:
1. 接受小公司,因为它无法威胁到你
2. 对威胁的限制要清楚,让对方知道自己的实力
3. 让对方不敢轻视你的存在
斗鸡博弈——2只鸡在斗鸡是,双方的选择一是退下来,2是进攻。考验人的深思熟虑猜测对方是妥协还是强硬,以免造成两败俱伤。在讨价还价的过程中,如果开价过高,会造成骑虎难下的境况,如果开价过低,会造成得不偿失。
以弱胜强——毛泽东最擅长的战胜
公用地悲剧与和谐社会,必须明晰公共地产权,牧民之间的有效沟通,形成共同愿景,采取惩罚,素质提高,改善牛或牧草的品种,加强宣传危害等
酒吧问题与少数人博弈----记忆长度长的人不一定具有优势。要记得市场和世界都在变化,很多东西都会物是人非,千变万化的。
彩票,赌博与投资——死于车祸的人多于中奖。赌徒心理。实际上,这三者都是赢得=的概率很低的,最终的赢家都是庄家。
“贪”字是由“今”和“贝”构成的。“今”是现在的意思,“贝”是金钱的意思,指的是急功近利。“婪”是由“林”和“女”构成的,指的是女人如林,欲海无边。
七二法则——就是说不拿回利息,一直利滚利,本金增值的时间为(年)=72/年收益率。决定优劣的关键是市场利率,而市场利率是难预测的,所以,我们要审时度势,慎之又慎。
风险越高,收益越高。
“不要把鸡蛋放在一个篮子里”与“把所有的鸡蛋放在同一个篮子里”各有各优缺点,要学会权衡利弊。
“羊群效应”,“滚雪球效应”,“财富效应”都是跟风效仿的结果,其中的大多部分人都是盲目从众的,最终只会导致泡沫破裂。
理论之树是灰色的,生命之树常青——康德
“知识就是力量”的另类解释:信息有价(趣事:卖猫不附带猫碗,因为那猫碗是古董,很多人都是冲着猫碗来买猫的)
隐秘行为——别人无法察觉的行为或信息
道德风险一般存在于以下情况:由于不确定性,不完全的合同使负责任的代理方不能承受全部损失,因而他们不承认受他们的行动的全部后果。同样的,也不享有行动的全部好处。显而易见,许多不同的外部因素,可能导致不存在均衡状态的结果;或者均衡状态即使存在,也是没有效率的。道德风险始终存在,一个保过险的人在避免风险方面的积极性普遍有降低的可能性》如果一个人对于他的行为后果只承担一部分责任,或者根本就不承担任何责任,那他的行为动机就被彻底改变了。(道德风险产生于保险业)
逆向选择的困境——他违背了市场竞争中优胜劣汰的选择法则。平常人说选择,都是选择好的,而这里选的却是差的,所以这种现象叫做逆向选择。“劣币淘汰良币”“巧妇常伴拙夫眠”
所罗门故事与制度设计(两母认一婴儿,各分一半)机制设计,就是设计一套博弈规则,令不同类型的人做出不同的选择,尽管每个人的类型可能是隐秘的,别人观察不到,但他们的所作出的不同选择却可以观察到的。观察者可以通过观察不同的人的选择而反过来推演出他们的真实类型。更专业来说,就是委托人通过制定一套策略,根据代理人的不同选择,将代理人区分为不同的类型,这就是“信息甄别”
精装本和平装本其实没有太多不同,精装本对书评价更高而已。头等舱和其它舱其实都一样,只不过假如价格一样的话,会导致没人乘坐或都坐头等舱而已。如果把没有区别的东西区分开来,这样才会有等级,有向往。航空公司才能做最后的赢者。
苹果理论——一直走,摘一只最大的苹果
你在挑人的时候,别人也在挑你。无论是选择爱情,事业,婚姻,朋友,最优结果只可能在理论上存在。不是把追求最佳人作为最大目标,而是设法避免挑到最差的人。
“先发优势”和“后发优势”——消费者非常急切想要买一件商品的时候,往往以较高的价格取得,而销售员非常想卖一件商品的时候,往往以较低的价格卖出。(所以作为双方都不应该暴露自身的急切情绪,否则会很快被人看中弱点,得不偿失。)——谈判的要诀
管理需要建立预期(给猫挂个铃铛,这个主意很好,但没有老鼠敢做),所以要考虑能否实现的现实问题。通常领导者与自己的下属之间的“互动过程”有效地协调了子系统之间的竞争与合作关系。
强强联合的局限在于不管用在哪方身上,都只能保证其中一方报出真实成本,无法约束另一方也是说真话。为了让双方都能够报出真实成本,在设计合作协议的时候是最重要的。这样才能做到有效。
奖惩制度——作者认为,即使有人迟到,早退,被扣工资,但在实际工作中并不是不努力工作,其因扣工资而产生的逆反心理导致的隐性罢工成本反而有可能高于所扣的工资。这样造成的损失更大。一个良好的奖惩
制度首先要选择好对象,其次要能够建立在员工相对表现基础之上的回报。
旅行者困境——2旅行者共买了个花瓶,在运输途中碎了,要求航空公司赔偿,如果其中一个旅行者的报价更接近真实价,则奖励,否则处罚。(要达到目的应该将2者分开,再是要制定“坦白从宽,抗拒从严”的赏罚规则。
钱生钱才有数不尽的钱——要用长远的目光看问题
幸存者游戏的启示——做好自己,不要跟别人闹僵,还要靠点运气
前景理论(经济现象的心理分析)
1. 如果你有若干个好消息要公布,应该把他们分开公布
2. 如果你有若干个坏消息要公布,应该把他们放一起公布
3. 如果你有一个天大的好消息和一个不重要的坏消息,应该把2个消息一起告诉别人
4. 如果你有一个天大的坏消息和一个无关紧要的好消息,应该分开公布这2个消息 心理学和行为经济学的研究结果表明,人类在作出经济决策时总是存在着系统的推理误差。这些误差产生的原因大多来自思考成本,激动和经验等心理因素的影响。
如果对博弈论有兴趣的话,就再看看行为博弈论吧!
(行为博弈论考虑人类非理性因素,研究参与人实际上作出什么行动)
《博弈论的读书笔记》相关文档:
复兴之路读书笔记09-01
复兴之路读书笔记通用09-01
《南辕北辙》读书笔记范文(通用11篇)09-01
《秋天的怀念》读书笔记精选3篇09-02
秋天的怀念优秀读书笔记最新5篇09-02
《秋天的怀念》读书笔记09-03
秋天的怀念读书笔记09-03
秋天的怀念读书笔记500字六篇09-02
《秋天的怀念》读书笔记书评范文3篇09-03