時間:2023-10-12 10:26:20
導言:作為寫作愛好者,不可錯過為您精心挑選的10篇日常生活中的博弈,它們將為您的寫作提供全新的視角,我們衷心期待您的閱讀,并希望這些內(nèi)容能為您提供靈感和參考。
而在臟臉博弈中,我看到了公共知識的巨大力量。那個印象深刻的,因為一個公共知識而導致村莊死了100個男人的故事,依然感到很不可思議。在日常生活中,有很多事情人們都心照不宣。他們各自知道某件事情,但不知道別人知不知道他們知道。而一旦這件事情成為公共知識,就可能引起很大的影響。而公共知識也是人們?nèi)粘I钪斜夭豢缮俚慕涣骰A(chǔ),比如地球是圓的,我們都知道地球是圓的,那么在這一點上就能達成共識,當許多事情都達成共識,那么人們的交流也就更加順暢。
(武漢科技大學中南分校 文法學院,湖北 武漢 430223)
摘要:本文把博弈論基礎(chǔ)課程中介紹的策略式思維方法和能力納入到成功素質(zhì)的五大體系之中,論述了博弈意識和策略思維能力是現(xiàn)代競爭社會中成功人士的必備素質(zhì)。通過分析博弈論課程中的經(jīng)典案例,探討了如何處理博弈中的策略問題,并由此引出了博弈意識的兩個核心要點:一是換位思考、改變觀點;二是向前展望、倒后推理。通過分析案例探討了成功素質(zhì)教育的策略觀。
關(guān)鍵詞:成功素質(zhì)教育;博弈論;策略思維
一、成功素質(zhì)教育理念與博弈論和策略思維
成功素質(zhì)教育是武漢科技大學中南分校率先提出的一種以促進人的成功為最終目的的教育理念。研究成果表明:成功素質(zhì)的外延包括五大體系,即:觀念體系,主要包括世界觀、價值觀、人生觀和敬業(yè)精神、拼搏精神、創(chuàng)新精神等;品格體系,主要包括人格、道德、誠信、毅力、性格、風度、氣質(zhì)、修養(yǎng)、心態(tài)等;方法體系,主要包括學習方法、思維方法和操作方法等;能力體系,主要包括領(lǐng)導、組織、管理、觀察、分析、表達、協(xié)調(diào)、溝通、應變、公關(guān)、體能等;知識體系,主要包括專業(yè)知識和非專業(yè)知識。在成功素質(zhì)的五大體系中,觀念體系是核心體系。能力體系和方法體系是五大體系的重要組成部分。當代中國已經(jīng)實施了市場經(jīng)濟,國際化的步伐日益加快,在日常生活、學習和工作的方方面面,顯現(xiàn)出越來越明顯的競爭態(tài)勢,正逐步形成越來越嚴峻的競爭格局。如何在政治經(jīng)濟、軍事體育乃至于日常生活中看清楚競爭對手的策略、并戰(zhàn)而勝之或取得雙贏,是國家或組織或個人所面臨的重要問題。
策略思維是關(guān)于了解對手打算如何戰(zhàn)勝你,然后戰(zhàn)而勝之的藝術(shù)。是在競爭環(huán)境下必須具備的能力或者方法。我們每個人都會在工作和日常學習、生活中用到策略思維。學習需要策略,就業(yè)需要策略,生意人和企業(yè)必須借助有效的競爭策略才能生存發(fā)展,政治家必須設(shè)計競選或施政策略等等??傊?,學業(yè)成功、就業(yè)成功、創(chuàng)業(yè)成功和事業(yè)成功離不開策略思維的能力和方法。關(guān)于策略思維的科學稱為博弈論,博弈論原本是數(shù)學的一個分支,是一門相對年輕的科學,雖然其歷史尚不足50年,但由于它較好地解決了對競爭等問題的可操作性分析,已經(jīng)成為經(jīng)濟學中激蕩人心的一個研究領(lǐng)域。隨著研究的深入,人們認識到我們身邊的許多行為、現(xiàn)象都可用博弈來概括。當代“最后一個經(jīng)濟學全才”保羅•薩繆爾森教授說,“要想在現(xiàn)代社會做一個有文化的人,你必須對博弈論有一個大致的了解”。成功素質(zhì)教育的作用對象是在校的大學生,他們是將要掌握先進科學技術(shù)知識和把握先進文化方向的即將走進社會的中高級應用型人才,理應對博弈論知識和策略思維的方法有一定的理解,并能應用到實踐中去。
二、博弈論中的經(jīng)典案例及其對成功素質(zhì)教育的啟示
成功素質(zhì)教育認為,塑造大學生的成功素質(zhì),必須圍繞專業(yè)素質(zhì)和非專業(yè)素質(zhì)兩大領(lǐng)域展開。專業(yè)素質(zhì)是指人們實現(xiàn)成功所必備的具有專業(yè)特性的素質(zhì);非專業(yè)素質(zhì)是指雖不具有專業(yè)特性但同樣是人們實現(xiàn)成功所必備的且對專業(yè)素質(zhì)的形成與發(fā)揮起“倍增器”作用的素質(zhì)。專業(yè)素質(zhì)和非專業(yè)素質(zhì)共同構(gòu)成成功素質(zhì),兩者缺一不可。博弈意識和策略式思維能力已經(jīng)成為各界成功人士必須具備的成功素質(zhì)。分析和研究博弈論中一些經(jīng)典案例,可從中體會到策略式思維的基本方法,感受到策略式思維的巨大魅力,從而有利于培養(yǎng)學生的成功素質(zhì)。
(一)囚徒困境
假設(shè)警察局抓住了兩個合伙犯罪的嫌疑犯,但獲得的證據(jù)并不十分確切,對于兩者的量刑就可能取決于兩者對于犯罪事實的供認。警察局將這兩名嫌疑犯分別關(guān)押以防他們串供。兩名囚徒明白,如果他們都交代犯罪事實,則可能將各被判刑5年;如果他們都不交代,則有可能只會被以較輕的妨礙公務罪各判1年;如果一人交代,另一人不交代,交代者有可能會被立即釋放,不交代者則將可能被重判8年。
兩個囚徒該如何選擇呢?
對于兩個囚徒總體而言,他們設(shè)想的最好的策略可能是都不交代。但任何一個囚徒在選擇不交代的策略時,都要冒很大的風險。換句話說,一旦自己不交代而另一囚徒交代了,自己就將可能處于非常不利的境地。因此,囚徒在考慮自己策略選擇的時候,必須站在對手的角度來考慮策略。對于囚徒A而言,不管囚徒B采取何種策略,他的最佳策略都是交代。對于囚徒B而言也是如此。最后兩人都會選擇交代。這就是該博弈問題的解,是一個納什均衡。該問題反映了個體理與集體理之間的矛盾和沖突,叫做囚徒困境。
我們可以利用囚徒困境模型來分析日常生活中的許多不合作現(xiàn)象。例如出售同類產(chǎn)品的商家之間本來可以通過共同將價格維持在高位而獲利,但實際上卻是相互殺價,結(jié)果都賺不到錢。當一些商家共謀將價格抬高,消費者實際上不用著急,因為商家聯(lián)合維持高價的壟斷行為一般不會持久,可以等待壟斷的自身崩潰,價格就會掉下來。又如住戶在公共樓道里堆滿了雜物,結(jié)果大家都極不方便。但你如果不占用公共樓道,別人也會占用。每一居住面積狹小的住戶從自我利益最大化出發(fā),都會選擇占用。但占用的結(jié)果卻最終損害了大家的利益。
在博弈論分析中,一定場合中的每個局中人在決定采取何種行動時都策略地、有目的的行事,他考慮到他的決策行為對其他人的可能影響,以及其他人的行為對他的可能影響,通過選擇最佳行動計劃,來尋求收益或效用的最大化。該案例啟示我們換位思考、改變觀點。我們希望你可以站在競爭對手的位置來進行策略思考,進而從別人的角度觀察這個世界。正確做到這一點對于找到你自己的最佳策略是必不可少的。不過,從別人的角度思考和觀察這個世界做起來并不容易。人們習慣于把別人看做和我們一樣的人,而不是完全不同的類型。博弈論的思維方式則要求你哪怕完全不能同意他們的見解,也要設(shè)身處地,仔細分析自己若處于對方的境地,思路會有什么變化。
(二)海盜分金
有5個海盜搶得了窖藏的100塊金幣,并打算瓜分這些戰(zhàn)利品。他們的習慣是按下面的方式進行分配:在5張紙條上分別寫了1、2、3、4、5這五個數(shù)字,然后抓鬮,抓到1的海盜就先提出分金幣的方案,然后所有的海盜(包括提出方案者本人)就此方案進行表決。如果有超過一半的海盜同意,就按照1號提出的方案分配,否則,1號海盜被扔進大海,再由2號海盜提出分配方案,規(guī)則同上...請問1號海盜應提出什么樣的分配方案?
所有的海盜都樂于看到他們的一位同伙被扔進海里,不過,如果讓他們選擇的話,他們還是寧可得一筆現(xiàn)金。他們當然也不愿意自己被扔到海里。所有的海盜都是有理性的,而且知道其他的海盜也是有理性的。這些金塊不能再分,也不允許幾名海盜共有金塊,因為任何海盜都不相信他的同伙會遵守關(guān)于共享金塊的安排。這是一伙每人都只為自己打算的海盜。
分析這個策略游戲的奧妙就在于應當從結(jié)尾出發(fā)倒推回去。當游戲快要結(jié)束時,你很容易看出應如何分配這些金幣。如果從游戲的開頭出發(fā)進行分析,那是走不了多遠的。其原因在于,所有后續(xù)人員的決策方案都是要確定:“如果我這樣做,那么下一個人會怎樣做?”
記住了這一點,就可以知道我們的出發(fā)點應當是游戲進行到只剩兩名海盜(假設(shè)前面3個海盜都被仍進大海了)――即4號和5號――的時候。這時提出分配方案的海盜是4號,而他的最佳分配方案是不存在的,因為不論他提出什么方案,5號海盜都是反對。5號海盜獨自得100枚金幣。
倒退回到上一步,現(xiàn)在加上3號海盜。4號海盜知道,如果3號的方案被否決,那么最后將只剩2個海盜,而4號將肯定一無所獲――此外,3號也明白4號了解這一形勢。因此,只要3號的分配方案給4號一點甜頭使他不至于空手而歸,那么不論3號提出什么樣的分配方案,4號都將投贊成票。因此3號需要分出盡可能少的一點金子來賄賂4號海盜,這樣就有了下面的分配方案:3號海盜分得99塊金子,4號海盜得1塊金子,5號海盜一無所獲。簡寫為(99,1,0)。
2號海盜的策略也差不多。他需要有50%以上的支持票,因此需再找二人做同黨。他可以給同黨的最低賄賂是1塊金子,而他可以用兩塊金子來收買4號和5號海盜。因此,4號的分配方案應是:(98,0,1,1)。
1號海盜的策略稍有不同。他需要收買另兩名海盜,因此至少得用2塊金子來賄賂,還要比2號的方案多拿出一塊才能使自己的方案得到采納。他的分配方案應該是:(97,0,1,0,2)或(97,0,1,2,0)。
該案例啟示我們向前展望、倒后推理。這里說的是做出一系列行動和反行動,預計沿著你現(xiàn)在前進的道路走下去,最后你會到達哪里。“向前展望、倒后推理”法則告訴你,應該首先確定自己最后希望達到什么目標,然后從這個結(jié)果倒后研究,直到找出自己現(xiàn)在應該選擇哪條道路,這樣才能保證以后可以達到那個目標。
在企業(yè)管理中人們經(jīng)常談到學習邯鋼經(jīng)驗,邯鋼成本控制經(jīng)驗的核心其實就是“向前展望、倒后推理”方法的典型應用。“海盜分鉆石”據(jù)說是美國著名軟件公司招收員工時的考題,20分鐘內(nèi)給出正確答案的人,年薪可以達到8萬美元。從中可以看出,世界最成功企業(yè)之一的軟件公司對員工素質(zhì)提出的要求或標準;而成功素質(zhì)教育的辦學理念中提出的超前發(fā)展、創(chuàng)新教育和實用教學等理念,要求把最新的最有用的知識傳授給學生,培養(yǎng)學生的成功素質(zhì),這與世界一流公司的用人理念有著相同的地方。
三、成功素質(zhì)的策略觀
成功者離不開拼搏,博就是博弈,博弈是離不開策略的。構(gòu)成一個博弈最基本的三個要素就是局中人、策略空間與得益函數(shù)。成功素質(zhì)教育的策略觀,即要求人們具備博弈意識,也要求人們在各種博弈中必須把握和采用幾種共性的策略。其中威脅和反威脅、合作與不合作、先動與后動等策略是最重要的幾種。
在博弈中,人們經(jīng)常采用威脅策略,但其他博弈方也會采取對威脅的辨別和反威脅策略。介紹一個前面提到過的托馬斯•謝林教授的小故事。若干年前,哈佛大學一幫學生來到謝林的課堂,他開始對學生講學這門課有多難,有些學生便離開了教室。之后,他詳細講述了他就這門課對學生提出的要求:極端嚴格和極其刻苦,更多的學生溜掉了。最后,只剩下幾個人在座位上惴惴不安,直冒冷汗,他卻告訴這幾個人放松。剛才那番強硬的說詞是他的一個計策,為的是讓上這門課的人數(shù)降到可以控制的范圍內(nèi),保證只有最刻苦的學生上他的課。后來,他的確讓這些學生很刻苦地學習。他們順利完成這門課之后,都覺得這個理論真的至關(guān)重要,教授也棒極了。在這場師生博弈中,托馬斯•謝林采用了一種比較溫和的“威脅”策略。對博弈論不夠堅定的學生相信了威脅,失去了機會;而對博弈論堅定不移的學生終于得到了世界一流大師的教誨,終生受益。
美國密西根大學的羅伯特愛克斯羅德經(jīng)過計算機模擬“囚徒困境”發(fā)現(xiàn),在重復博弈中,如果博弈的次數(shù)是無限的,博弈方會選擇相互合作的策略。但如果重復博弈的次數(shù)較少,則合作就不可能實現(xiàn)。這就是重復“囚徒困境”的結(jié)論。在我國的反腐敗斗爭中。
1983年美洲杯帆船賽前4輪結(jié)束后,丹尼斯康納的“自由號”在這項共有7輪比賽的重要賽事中暫時以3勝1負的成績排在首位。在第5輪比賽開始時,由于對手“澳大利亞二號”搶在發(fā)令槍之前起步,不得不退回到起點線后再次起步,這使“自由號”獲得了37秒的優(yōu)勢。澳大利亞隊的船長約翰伯特蘭打算轉(zhuǎn)到賽道左邊,滿心希望風向發(fā)生變化,可以幫助他們趕上去。丹尼斯康納則決定將“自由號”留在賽道右邊。這一回,伯特蘭大膽押寶押對了,因為風向果然按照澳大利亞人的心愿偏轉(zhuǎn)了5度,“澳大利亞二號”以1分47秒的巨大優(yōu)勢贏得這輪比賽。人們紛紛批評康納,說他策略失敗,沒能跟隨澳大利亞隊調(diào)整航向。再賽兩輪之后,“澳大利亞二號”贏得了決賽桂冠
一般來講,成績領(lǐng)先的帆船,通常都會照搬尾隨船只的策略。一旦遇到尾隨的船只改變方向,那么成績領(lǐng)先的船只也只會照做不誤。這就是博弈論中的后動優(yōu)勢,如果雙方的技術(shù)實力相當,帆船比賽的輸贏在很大程度上是賭風向的比賽。在1983年的那場比賽中,當以3∶1的場數(shù)領(lǐng)先的美國人又以37秒領(lǐng)先時候,他們就獲得了后動優(yōu)勢:澳大利亞人押什么風向,他們就跟隨押什么風向。這樣,他們就可以做到萬無一失,因為如果澳大利亞人押對了,他們也跟著押對,盡管可能因為決策晚一點而輸?shù)魩酌?,卻很難把37秒輸光,同樣,如果澳大利亞人押錯了,那么大家都錯,那37秒的優(yōu)勢仍然管用。
總之,成功素質(zhì)教育的策略觀至少應該包括識別威脅或許諾是否可信,更加善于思考,具備深邃的洞察力;學會和競爭對手合作,共同獲得雙贏;學會掌握競爭中的主動權(quán)等。
參考文獻
[1]張維迎.博弈論與信息經(jīng)濟學[M].上海:上海三聯(lián)書店,上海人民出版社,1996.
一、博弈論教學
博弈論也稱對策論,是研究在特定情境中互動決策問題的一門學科。著名的經(jīng)濟學家薩繆爾森說過,“要想在現(xiàn)代社會做一個有文化的人,你必須對博弈論有一個大致了解”。
博弈論作為一門經(jīng)濟學專業(yè)重要的專業(yè)課,在各大高校經(jīng)管類專業(yè)中都有開設(shè),而且以專業(yè)必修課居多。而且博弈論的方法,在我們?nèi)粘I顩Q策中有重要的應用。它教給我們一種理性思維去分析生活當中的事情。其實博弈論的思想在我們的生活當中已經(jīng)廣泛滲透。比如,小時候石頭剪刀布的游戲;小學語文課本中“田忌賽馬”的故事;生活中的討價還價等,都是博弈思想。只是當時我們還沒有接觸到這個概念,沒有系統(tǒng)完整的去學習。
大學課堂給了我們這個機會去更加深化思維,更深入的學習博弈知識,從而更好的在生活中應用博弈方法。但是目前博弈論課堂教學方法單一,主要依托講授習題練習,結(jié)合案例。學生的參與不足,理論與實踐的結(jié)合不足。所以怎樣豐富博弈論課堂,加大信息量,更多的體驗博弈論思想在生活中的積極應用,調(diào)動學生的積極參與,是博弈論教學改革的一個方向。而慕課不失為一種有效的手段。
二、慕課
慕課是二十世紀興起的一種網(wǎng)絡課程模式。以大范圍,形式新穎等特點,為大家廣泛地應用于現(xiàn)代教學中。目前慕課在國內(nèi)外已經(jīng)得到了長足發(fā)展,中國2014年在網(wǎng)注冊的慕課學員已經(jīng)達到60多萬,這個數(shù)字還在繼續(xù)增長?,F(xiàn)在已經(jīng)有很多專業(yè)從事制作慕課的團隊,也完全能滿足各類學員各類課程的要求。
三、慕課與博弈論教學的結(jié)合
慕課具有完整的知識體系。作為一種方便的自學方式,慕課完整的知識體系可以作為博弈論課程的補充。彌補傳統(tǒng)課程課時不足,信息量有限的弊端。傳統(tǒng)課堂一節(jié)課50分鐘,各大高校博弈論課程安排34-51課時。有限的時間內(nèi),很難去更多地教授博弈論的知識,很難有更多的時間去體會博弈論思想在現(xiàn)實生活當中的應用。但如果能在傳統(tǒng)博弈論課程當中結(jié)合慕課,那么部分知識,包括大量的案例,情景O定等都可以通過慕課來完成。
慕課具有范圍廣的特點。博弈論作為一門專業(yè)課程,在經(jīng)管類院校中被廣泛開設(shè),基本上所有專業(yè)都要學習該課程。但是學校資源有限,老師的精力有限,而且各專業(yè)課時不一致,深度要求不同。僅憑傳統(tǒng)課堂,無法完全滿足學生的學習需要。慕課作為一種網(wǎng)絡課程,范圍廣,不受時間地點的限制,學生只要網(wǎng)上報名就可以學習,可以很方便的去彌補傳統(tǒng)課堂實體資源有限的缺點。完全可以滿足全校所有專業(yè)學生同時學習的要求,既方便又快捷。
慕課具有開放性。慕課作為一種網(wǎng)絡課程,對學員沒有限制。任何學員只要在線注冊就可以參與,有利于博弈論教學在全校的開展。雖然博弈論是經(jīng)管類專業(yè)的專業(yè)課。但是很多非經(jīng)管類專業(yè)的學生也有很大的需求想要學習該課程,所以當資源有限,不能全部安排課程的時候。慕課就起到了良好的作用,可以供任何專業(yè)的學生學習。同時去全民推廣博弈論課程也有利于經(jīng)濟素養(yǎng)的提高,有利于國家政策的制定和執(zhí)行。
慕課形式新穎。能方便的演示實驗,模擬情境,可以充分激發(fā)學生的興趣,能讓學生更真實感受博弈思想在日常生活中的應用是怎么影響個人的決策,充分的體現(xiàn)理論應用實際的現(xiàn)實意義。比如一個很經(jīng)典的博弈案例“智豬博弈”,博弈故事描述的是大豬和小豬誰去按食槽開關(guān)的決策問題。實際上,這樣的博弈思想應用到實際生活中,可以模擬大小企業(yè)共存的問題。傳統(tǒng)課程只是結(jié)合案例簡單的分析了這種應用。如果在傳統(tǒng)課堂講授外能再更多的結(jié)合慕課深入案例,那么學習效果是事半功倍的。也可以讓學生更多的去切實的融入到生活情境當中,感受博弈對決策的影響。
慕課具有自檢性。學習不光要聽,更要練習鞏固。通過檢驗考察自己掌握的情況。傳統(tǒng)課堂老師能面對面地觀察學生,通過表情以及學生的課堂反應了解到學生的接受情況,并及時調(diào)整課堂具有高度的靈活性。還有課堂練習測驗的方式,也可以很方便的考察學生。慕課作為網(wǎng)絡課程也考慮到了這一問題。安排了作業(yè),測驗,在線討論等方式,力求學生能盡可能地掌握所學。而且慕課的網(wǎng)絡特點是可以重復播放任意片段,一旦有知識不理解的,學員可以反復聽課,直到完全理解。
慕課具有約束性。注冊慕課后,學員只有完全學完課程,完成課程安排的學習任務,并在考試合格后才能獲得相應學分。這樣的約束性可以保證學習的有效性。應用到博弈論教學當中,在全校學生都能學習的情況下,還能保證學習質(zhì)量。確實可以作為傳統(tǒng)博弈論課堂的補充?,F(xiàn)在許多高校已經(jīng)開始和特定的慕課平臺建立合作培養(yǎng),承認學員在慕課中心拿到的學分,并計如總學分。這樣既有利于學生課程的學習,也有利于慕課在現(xiàn)代教學中的進一步推廣。
四、結(jié)論
慕課的特點可以很好的將其結(jié)合運用到博弈論教學當中。去彌補傳統(tǒng)的博弈論教學方式單一,課時有限的缺點。但是慕課作為一種新興的網(wǎng)絡教學方式,在發(fā)揮自己優(yōu)勢特點的同時,我們也要注意到它的弊端。首先,在沒有老師的強制約束下,學生是否能自覺地獨立完成所有課程。其次,學生雖然能夠反復觀看視頻,反復理解學習內(nèi)容。但是如果反復學習之后,仍然不能透徹理解時該怎么答疑解惑要怎么辦。這都是網(wǎng)絡課程所不能給予的,必須通過傳統(tǒng)課程去更好地實現(xiàn)。再者,慕課對學生的考核包括測驗,討論等方式,合格的評判標準是什么,所有學員都采用同樣的標準是否合理。這些都是將慕課應用到實際教學中面臨的問題。所以必須要明確,慕課作為一種新型的網(wǎng)絡課程,在幫助學員學習課程,輔助傳統(tǒng)堂的時候。更多的只能定位為一種輔的學習方式,絕對不能代替?zhèn)鹘y(tǒng)課堂。
【參考文獻】
[1] 何國平,楊云帆,陳嘉等.“慕課”在護理教學中的應用與展望.中華護理雜志[J].2014(49)1095-1099.
[2] 胡珊邢濤.慕課視域下“教育心理學”課程教學.現(xiàn)代教育技術(shù)[J].2015(24)78-82.
[3] 張長海,焦建利.地方高校大學生慕課接受度影響因素研究.遠程教育與網(wǎng)絡教育[J].2015(345)64-68.
[4] 姜泓冰.“慕課”,攪動大學課堂[N].人民日報,2013-07-15(15).
文章編號:ISSN1006―656X(2013)12-0043-01
一、博弈論的概述
博弈論(game theory),又稱對策論,是研究決策主體的行為發(fā)生直接相互作用時的決策以及這種決策的均衡問題,也就是一些個人或組織,面對特定的環(huán)境條件,在一定的規(guī)則約束下,同時或先后,一次或多次,從各自的行為或策略中進行選擇并加以實施,各自取得相應結(jié)果的過程。
一個完整的博弈一般包含幾個要素:參與者,行動,策略,結(jié)果,均衡等。參與者、行動和結(jié)果統(tǒng)稱為博弈規(guī)則,博弈分析的目的是使用博弈規(guī)則來決定均衡。但是,博弈的行動不等同于博弈的策略,博弈的結(jié)果不等同于博弈的均衡。根據(jù)參與人的數(shù)量,可分為二人博弈和多人博弈;根據(jù)參與人是否合作,可分為合作博弈和非合作博弈;根據(jù)博弈結(jié)果的不同,可分為零和博弈、常和博弈和變和博弈。
博弈論對我們的經(jīng)濟生活有重要意義,人們之間決策行為相互影響的例子有很多:從國家角度出發(fā),在國際貿(mào)易中合理運用博弈論可使本國和其他國家都受益,取得雙贏效果;從個人角度出發(fā),在生活中合理運用博弈論可使自己選擇最優(yōu)策略,減少不必要的成本開支。
二、非合作博弈――納什均衡
非合作博弈是指不允許存在有約束力協(xié)議的博弈。完全信息靜態(tài)博弈屬于非合作博弈,該博弈中,每個博弈方的策略都是針對其他博弈方策略或策略組合的最佳對策,具有這種性質(zhì)的策略組合,正是非合作博弈理論中最重要的一個概念“納什均衡”。
用表示一個博弈,如果有個博弈方,每個博弈方的全部可選策略的集合稱為“策略空間”,用表示;表示博弈方的第個策略,其中可取有限個值(有限策略博弈),也可取無限個值(無限策略博弈);博弈方的得益用表示,是各博弈方策略的多元函數(shù)。個博弈方的博弈常寫成。在博弈中,如果由各個博弈方的每一個策略組成的某個策略組合中,任一博弈方的策略,都是對其余博弈方策略組合的最佳對策,即
,對任意都成立,則稱為的一個“納什均衡”。
納什均衡的求解,常采用得益矩陣法。在囚徒困境中,每個參與者都能猜出對方策略,稱該納什均衡為純策略納什均衡。囚徒困境問題反映了非合作博弈的根本特征,體現(xiàn)了個人理性與集體理性的矛盾。兩寡頭企業(yè)選擇產(chǎn)量的博弈就是囚徒困境問題在經(jīng)濟學上的應用。若兩企業(yè)聯(lián)合形成卡特爾,選擇壟斷利潤最大化的產(chǎn)量,每個企業(yè)都能得到更多利潤。但卡特爾協(xié)定不是納什均衡,給定對方遵守協(xié)議,每個企業(yè)都有增加產(chǎn)量的沖動,最后每個企業(yè)只能得到納什均衡產(chǎn)量的利潤,它嚴格小于卡特爾產(chǎn)量下的利潤。
在某類博弈中,每個理性人都不能猜出對方的策略,參與人是以一定的概率選擇某種策略的,這樣的策略稱為混合策略,相應的均衡稱為混合策略納什均衡。純策略是混合策略的特例。相關(guān)的例子有日常生活中的打撲克、劃拳等。
三、治理河流污水排放的制度設(shè)計
環(huán)境保護,人人有責,限制企業(yè)的污水排放符合社會各界的呼聲。檢查和制止排污是政府的職責,對于以利潤最大化為目標的企業(yè),其一直采取各種措施盡可能降低生產(chǎn)成本。政府和企業(yè)間的關(guān)系可用經(jīng)濟學中的監(jiān)督博弈來解釋。
該博弈的參與者是政府和企業(yè),政府的策略選擇是檢查或不檢查,企業(yè)的策略選擇是排污或不排污。假設(shè)是企業(yè)治理污水(不排污)增加的生產(chǎn)成本,若排污,為自己多得的收益。是政府檢查所需成本。是政府對企業(yè)排污的罰款金額。是企業(yè)排污對社會利益的損害。假設(shè)且,即政府對排污企業(yè)采取重罰措施。對應不同策略組合的得益矩陣可見下表。
政府和企業(yè)的得益矩陣
在以上假設(shè)條件下,政府和企業(yè)都猜不出對方會采取何種策略,因而不存在純策略納什均衡,只能求解混合策略納什均衡。如果假定條件不成立,通過劣策略剔除可得到占優(yōu)策略,即(檢查,不排污)或(不檢查,排污)為占優(yōu)均衡。
在得益矩陣中,用表示政府檢查的概率,表示企業(yè)排污的概率。給定,政府檢查和不檢查的期望收益分別為:
由,得。即如果企業(yè)排污概率小于,政府的最優(yōu)選擇是不檢查;如果大于,政府的最優(yōu)選擇是檢查;如果等于,政府隨機地選擇檢查或不檢查。
政府的最終目標是降低企業(yè)排污概率并保護環(huán)境。據(jù)的結(jié)果,有兩種措施:一是增大分母,即采取重罰措施,使企業(yè)平日不敢排污;二是減小分子,即降低檢查成本?,F(xiàn)階段可行做法是設(shè)立舉報電話,避免政府盲目檢查,提高辦事效率。
再者,給定,企業(yè)選擇排污和不排污的期望收益分別為:
由得,即如果政府的檢查概率小于,企業(yè)的最優(yōu)選擇是排污?,F(xiàn)實中,政府對排污的懲罰越重,企業(yè)因排污獲得的收益越低,企業(yè)的排污概率就越小。反之,企業(yè)的排污概率就越大。
企業(yè)因排污獲得收益的大小,政府難以準確把握。前面談到的企業(yè)都是以利潤最大化為目標的企業(yè),適于民營企業(yè)?,F(xiàn)實中大多排污者是國有企業(yè),這就涉及企業(yè)經(jīng)營的控制權(quán)收益問題。企業(yè)因排污獲得的生產(chǎn)成本降低部分可以很容易轉(zhuǎn)化為企業(yè)經(jīng)營者的控制權(quán)收益,這些收益包括獎金、福利或者因企業(yè)效益上升而帶來的升遷機會。反過來,如果企業(yè)因為排污而受罰,經(jīng)營者并沒有控制權(quán)損失,因為罰款由企業(yè)出,經(jīng)營者只是沒有控制權(quán)收益而已。
四、小結(jié)
本文以納什均衡為理論基礎(chǔ),分析了純策略納什均衡和混合策略納什均衡在經(jīng)濟生活中的應用。但本文探討的只是博弈論中一個很小的方面,對均衡問題中的子博弈精煉納什均衡等沒有涉及到,但它們的應用也很廣泛。在日常經(jīng)濟生活中,小到購物時的討價還價,大到企業(yè)間的競爭與合作、國家間的傾銷與反傾銷等,都可歸結(jié)為博弈問題。
經(jīng)濟學是經(jīng)濟管理類專業(yè)的專業(yè)基礎(chǔ)課程,學生學習的好壞不僅會影響到后續(xù)課程的學習,對學生綜合素質(zhì)的提高也會有著直接影響。由于經(jīng)濟管理類專業(yè)大多是以招收文科考生為主,數(shù)學基礎(chǔ)比較差,對經(jīng)濟學有些難以理解。有時候,盡管老師在講臺上講得天花亂墜,學生聽起來卻覺得干巴巴的、索然無味,像是過眼煙云,很難有好的教學效果。作為科任老師,我們可以改變自己的教學方法,用經(jīng)濟理論解釋現(xiàn)實生活,用現(xiàn)實生活說明經(jīng)濟理論?,F(xiàn)結(jié)合我自己多年來教學的經(jīng)驗,談談我對應用型人才經(jīng)濟學教學的一些看法。
1 善于挖掘日常生活中的事例作為教學案例
經(jīng)濟學是一門研究資源的配置與利用的科學,而生活中處處都面臨的各種各樣的選擇,這就涉及到經(jīng)濟學。生活中處處都有經(jīng)濟學,從起床到睡覺,從穿衣到吃飯,從睡眠到讀書、游戲、身體的鍛煉以及購物、聊天、休息,從生活起居到談情說愛,都存在著資源配置與利用,存在著經(jīng)濟學問題。經(jīng)濟學的問題比比皆是、俯首可拾,比方說,我們通常會遇到這種情況:一個人在外面走路,會感到孤單,甚至有時候會有一種不安全的感覺,于是,見了陌生人他也可能會跟對方主動打招呼聊天、一起走一段路。經(jīng)濟理論很容易就可以解釋這些事情,因為跟他人聊天可以增加自己的效用,兩個人走路跟一個人走路相比,兩個人走路可以打發(fā)寂寞時光、可以增加安全感,從而增加他們的效用,這也是一個帕累托改進。用這些日本文由收集整理常生活中司空見慣的事情,來談經(jīng)濟學,學生容易接受,也容易引發(fā)學生的興趣。帶著興趣與沒有興趣來學習同一門課程,其效果將是天淵之別。
2 善于用經(jīng)濟學知識解釋日常生活中的現(xiàn)象
生活中雖然處處都有經(jīng)濟學,但要利用經(jīng)濟理論解釋它們卻需要我們經(jīng)常去思考。例如,關(guān)于物質(zhì)與愛情之間的關(guān)系問題,一般人認為,物質(zhì)是基礎(chǔ),但有了一定的物質(zhì)基礎(chǔ)之后,物質(zhì)和愛情何者更加重要,他們的關(guān)系如何,這可以用經(jīng)濟理論來分析。
我們可以用u表示效用,m表示物質(zhì),l表示愛情,a、b、α、β、γ為不為零的常數(shù),它們的關(guān)系式可以表示為:u=amα+bmβlγ。這個式子就較好的描述了一般人的物質(zhì)與愛情的關(guān)系的觀點。當m=0時,不管l是否為零,u都等于0,說明物質(zhì)是基礎(chǔ),沒有物質(zhì)基礎(chǔ)愛情也不能當飯吃。β、γ的大小代表物質(zhì)與愛情孰輕孰重,當β>γ時,更加看重物質(zhì);當β<γ時,說明他有了一定的物質(zhì)基礎(chǔ)之后,更加注重愛情。物質(zhì)與愛情到底各占多大比重的問題,是一個效用最大化問題。
只要我們用心的去思考,就可以發(fā)現(xiàn)日常生活中存在太多的現(xiàn)象可以用經(jīng)濟理論來解釋。甚至我們所說的一些在理的話,都包含了經(jīng)濟學原理。例如,在電視連續(xù)劇《喬省長和他的女兒們》的大結(jié)局中喬省長有一句臺詞:“如果一個人有了害人之心就不可救藥了。”用經(jīng)濟理論如何解釋這句話呢?經(jīng)濟學有一個經(jīng)濟人假設(shè),人總是在謀求自己的利益,有害人之心的人總是把別人情況變好當作是件使自己效用減少的事情,為了增加自己的效用水平,在自己情況不能變好的情況下,他只能通過損害別人利益來提高自己的效用水平。
3 善于用經(jīng)濟學知識解釋社會現(xiàn)象
經(jīng)濟理論不僅應該解釋日常生活中的現(xiàn)象,而且要解釋社會現(xiàn)象。幾乎所有的社會現(xiàn)象都可以用經(jīng)濟理論來解釋。最常見的社會現(xiàn)象如失業(yè)、通貨膨脹、經(jīng)濟增長、房產(chǎn)問題、三農(nóng)問題、人民幣匯率問題、經(jīng)濟危機、歐洲債券危機等等,這些典型的經(jīng)濟現(xiàn)象無一不是經(jīng)濟問題,都可以用經(jīng)濟理論來分析。有些社會現(xiàn)象,看起來不是經(jīng)濟問題,但也可以用經(jīng)濟理論來解釋,如很多人在感嘆物質(zhì)文明取得長足進展的同時,驚呼道德淪喪問題。著名的經(jīng)濟學家加利·s·貝克爾(gary s·becker)就因把經(jīng)濟分析方法推廣到人口增長、家庭、教育、犯罪和處罰、歧視等社會問題研究領(lǐng)域,在1992年獲諾貝爾經(jīng)濟學獎。同樣地,經(jīng)濟理論還可以解釋我國的文憑熱、證件熱、國考熱、宰客門,甚至可以解釋考生的作弊現(xiàn)象;也可以解釋日本因地震而造成核泄露后中國出現(xiàn)的“搶鹽風波”,甚至可以解釋為什么我國反腐倡廉將是一件長期而艱巨的工作。有人對城鄉(xiāng)居民的幸福因子做過調(diào)查,結(jié)果顯示:生活條件差得多與收入低得多的農(nóng)村居民比城市居民的幸福指數(shù)更高。這種結(jié)果讓常人難以理解,但在經(jīng)濟學里面,解釋這種現(xiàn)象卻是一件輕而易舉的事情。正如常人所說的“幸福不是你擁有的多,而是你計較得少”。
轉(zhuǎn)貼于
4 善于用經(jīng)濟學理論解決生活中存在的問題
經(jīng)濟理論不僅可以解釋日常生活中的現(xiàn)象和社會現(xiàn)象,而且,還可以用于指導解決生活中存在的問題。經(jīng)濟理論不僅來源于實際,而且自產(chǎn)生之日起,就是用來指導并解決“經(jīng)濟”問題的。因此,經(jīng)濟理論也可以用于解決生活中存在的問題。比方說,有的同學不能正確處理好戀愛與讀書、打工與讀書、游戲與讀書、鍛煉與讀書等關(guān)系問題。有的同學甚至產(chǎn)生厭學情緒,這部分人來到學校忘記了讀書就是自己的天職。對他們可以用機會成本理論、消費理論來教育他們好好讀書,讓他們算一算自己來到學校讀書的機會成本,不要以高昂的代價借入明天的錢用于今天的消費。
大學生中還存在著另一類極端的觀點:有一部分同學認為,只要讀書讀好了,其它方面都可以不必考慮。這部分人是學習至上主義者,他們可以忘我的讀書,而不顧自己的身體承受能力。還有一種人,他們?yōu)榱俗约旱睦妫词故菗p害他人利益,甚至傷天害理也在所不惜。這種情況可以用產(chǎn)出函數(shù)來說明。我們知道有個這樣的柯布道格拉斯生產(chǎn)函數(shù):y=alαkβ。y表示產(chǎn)出;a表示技術(shù),在這里可以具體化為所學的知識或者本事。值得注意的是,這里的a與普通的柯布道格拉斯生產(chǎn)函數(shù)稍有不同,a的符號可正可負,當它是用來造福人類的時候,a>0;當它是用來破壞他人幸福、損害他人利益的時候,a<0;l表示勞動;k表示資本;指數(shù)α、β為常數(shù)。這個式子說明,如果不好好鍛煉身體,身體搞垮了,使得l=0,產(chǎn)出y也將等于0;如果思想道德品質(zhì)敗壞,盡做一些損害他人利益的事情,他的產(chǎn)出將是負數(shù),也就是危害社會的“產(chǎn)出”。因此,我們不僅要學習好,而且要鍛煉好身體,尤其是要保證思想道德品質(zhì)不要出現(xiàn)問題。
5 善于應用經(jīng)濟理論正確引導學生為人處世
經(jīng)濟理論不僅可以解釋日?,F(xiàn)象和社會現(xiàn)象,而且還可以引導學生為好人、處好事。前面的產(chǎn)出函數(shù)就是一個引導學生做人的非常好的例子。其實,經(jīng)濟理論中有很多知識可以與為人處世聯(lián)系在一起。比如生產(chǎn)與消費的外部性問題教導學生不要做那些對社會、對他人有不利影響的事情,要多做一些好事情,至少不要做對他人造成不好的影響的事情。如某人生日party,寢室?guī)讉€人一起在寢室里唱歌跳舞猜拳飲酒,徹夜狂歡、好不快樂??墒?,他們的行為卻具有很強的外部性,他們影響了別人正常的生活與休息。為了減少甚至消除他們的行為的外部性,他的生日party可以不要開得太晚,以免影響他人的正常休息,或者找一個不會影響他人的地方做他的生日party,如在酒店或娛樂場所。另外,可以用博弈論中囚徒困境的知識來分析為什么要構(gòu)建和諧社會、為什么要與人為善、為什么要懂得尊老愛幼尊師重教、為什么要懂得感恩等等。福利經(jīng)濟學的社會效用函數(shù)知識告訴我們,公交車上把座位讓給老弱病殘孕的乘客可以增進整個社會的福利水平;洛倫茲曲線與基尼系數(shù)的知識告訴我們應該關(guān)心弱勢群體,以促進整個社會的和諧發(fā)展;凱恩斯的邊際消費傾向理論從經(jīng)濟學的另一個角度告訴我們,社會經(jīng)濟平等也有利于社會經(jīng)濟發(fā)展。
6 學生綜合素質(zhì)的提高也涉及到經(jīng)濟學
知識是素質(zhì)的一個重要方面,要提高學生素質(zhì),就要讓學生掌握更多的包括經(jīng)濟學在內(nèi)的知識。學生綜合素質(zhì)提高的問題也可以歸結(jié)為一個經(jīng)濟學問題,可以看作是固定成本下的產(chǎn)出最大化問題,但這個問題與普通的投入產(chǎn)出問題有所區(qū)別。首先,人的綜合素質(zhì)是有很多方面決定的,我們不妨把每一個方面也稱為一種素質(zhì);其次,每一種素質(zhì)的培養(yǎng)又需要一定量各種“要素”的投入,同時,在培養(yǎng)這種素質(zhì)的同時,其它素質(zhì)也會發(fā)生變化。如果用z表示綜合素質(zhì),yi表示n個素質(zhì)中的第i方面的素質(zhì),xj表示m個要素投入中的第j種要素的投入,假設(shè)第j種要素的價格為pj,總成本c為常數(shù),用f和g表示某種函數(shù)關(guān)系。我們同樣可以將它們的關(guān)系用函數(shù)表示:
z=f(y1,y2,y3,…,yn)=g(x1,x2,x3,…,xm) x1p1+x2p2+x3p3+…+xmpm=c
(1)式有兩個方程,后面的等號表示m種要素的投入,有n個方面素質(zhì)的產(chǎn)出,這是一個投入產(chǎn)出方程;前面的等號表示人的綜合素質(zhì)是由y1、y2、y3……yn幾個方面的素質(zhì)決定的,z為綜合素質(zhì),可以看作是由于獲得y1、y2、y3……yn所得的好處或者效用,因此,前面的等號可以看成是效用函數(shù)。(2)式為約束函數(shù),表示資源的有限性。因此,如何使得學生綜合素質(zhì)最大化,就可以歸結(jié)為有限資源如何配置的問題,這就是典型的經(jīng)濟學問題。
一、引言
水是萬物之源。沒有水,社會將寸步難行。然而生活中,總會由于各種原因?qū)е屡R時停水,給人們生活和生產(chǎn)帶來不便。解決不可控因素下多方供水需求,單獨的救急中心遠遠不夠,必須調(diào)度多個救急中心的應急資源。由于各需水點對應急資源存在競爭關(guān)系,因此,尋找一種能夠反映各個需水點的缺水嚴重程度和救助響應時間的應急資源調(diào)度策略和模型,以達到利益均衡是一個值得研究的課題。
二、調(diào)度策略的非合作博弈模型建立
(一)模型假設(shè)
在解決本文提出的不可控因素發(fā)生時對應急資源合理調(diào)度的問題前可以做出如下假設(shè):
1.對各子系統(tǒng)在相同情況下對應急資源的需求量做出分級,1表示嚴重缺水,2表示重度缺水,3表示中度缺水,4表示輕度缺水。
2.現(xiàn)實中單一救急中心往往無法解決所有需水點對水資源的需求,因此需聯(lián)合多個救急中心。假設(shè)當某一區(qū)域的應急資源難以解決問題時,可從鄰近區(qū)域調(diào)水。
3.成本函數(shù)作為一個多元復合函數(shù),其影響因素包含很多,比如本事件中子系統(tǒng)的缺水程度,資源調(diào)度到救援響應的時間以及需水點到救急中心的距離等。因此在解決問題前需要對各子系統(tǒng)(即需水點)對救急中心的調(diào)度成本進行從大到小的排序。
(二)博弈模型的相關(guān)參數(shù)與數(shù)學表達式
1.調(diào)度成本函數(shù)C■■
理論上以其為調(diào)度策略的依據(jù)。C■■的函數(shù)表達如下所示:
C■■=H■*(■)∞(4)
公式中,H■表示需水點i的缺水級別,Y■■表示需水點i到救急中心k的距離。
2.效益函數(shù)Pi
在實際調(diào)度過程中,收益函數(shù)等于調(diào)度成本的倒數(shù):
P■■=■(5)
其中k∈M。公式中,C■表示需水點i在救急中心k未能得到資源而從其他救急中心進行資源調(diào)度而產(chǎn)生的額外成本。需水點i從全部救急中心集合M中調(diào)度其所需資源的效益函數(shù)滿足疊加定理。
三、非合作博弈模型的算法求解
(一)求解水資源調(diào)度的非合作博弈模型Nash均衡解的步驟
1.對救援資源初始分配,確定各需水點向救急中心調(diào)度資源所產(chǎn)生的成本;
2.不考慮各救急中心可提供水資源的上限,按成本最小化原則向各需水點分配資源;
3.考慮各救急中心實際資源量,若可以滿足同一級別各需水點,則按需分配。若不能,同級別各需水點對該救急中心的資源將產(chǎn)生競爭,形成博弈;
4.構(gòu)造非合作博弈調(diào)度模型,求解Nash均衡解,并按Nash均衡解對救急中心的水資源進行調(diào)度;
5.同一級別的需水點若存在按照Nash均衡解分配后仍不滿足需求的部分,則按成本最小化原則從其他救急中心調(diào)度資源,直到滿足需求;
6.重復步驟(3)。
(二)求解納什均衡
根據(jù)納什均衡的定義,對所有純策略組合進行逐一檢驗,得出純策略納什均衡。應用最多的一種算法稱為迭代算法。
在實際迭代計算中可以從任意的s(0)∈S(策略空間)開始,假設(shè)初始點s(0)與納什均衡點s*之間的距離為d(0),經(jīng)過m次迭代以后,d(s(m),s*)≤?灼0d(s(0),s*)=?灼■■d(0),因為0≤?灼0≤1,因此可以采用迭代公式s(m+1)=Xs(m)來任意逼近納什均衡點s*。
四、實例計算與分析
問題描述如下:現(xiàn)因某地區(qū)發(fā)生山體滑坡塌方,導致自來水廠源水渾濁度超標,從而導致城市G臨時停水,期限不明。城市G有四個區(qū)a,b,c,d,分別報告了不同的缺水程度。城市G市內(nèi)只有一處救急中心A,鄰市F有兩處救急中心B、C。為了不影響市民的日常生活,現(xiàn)有關(guān)部分組織進行水資源救助工作。數(shù)據(jù)假設(shè)如下。
表一 需水點缺水情況表
■
表二 救急中心資源情況表
■
現(xiàn)假設(shè)四個區(qū)域向各救急中心調(diào)度水資源所產(chǎn)生的成本是相同的。運用3.2提出的求解納什均衡解的迭代方法可以求出該博弈的純策略Nash均衡解:
s■■=(10,0,0) s■■=(1,5,2)
s■■=(2,5,1) s■■=(0,0,6)
將上述數(shù)據(jù)代入公式可求得:
總成本Ci,p=Ca,q+Cb,q+Cd,q=10+15+17+18=60是為最優(yōu)化成本調(diào)度策略。
根據(jù)公式可求得此組合策略的各個收益函數(shù),將各個需水點的收益函數(shù)代入公式,可得總的效益目標函數(shù)為:
F=Pa+Pb+Pc+Pd=21
綜上所述,利用迭代算法求得的Nash均衡解:
s■■=(10,0,0);s■■=(1,5,2);s■■=(2,5,1)s■■=(0,0,6)可以實現(xiàn)向區(qū)域a,b,c,d進行水資源公平合理調(diào)度,并且能夠保證調(diào)度策略的成本最小,效益最優(yōu)。
五、結(jié)束語
該論文本著實用性原則針對日常生活中常見的臨時供水不足問題進行了相關(guān)研究,論文方法通俗易懂,且延展性較強,相關(guān)的思想方法也可以用來處理類似求解最優(yōu)化組合的問題,比如解決自然災害發(fā)生時,不同地區(qū)受災點的資源調(diào)配問題或者用于公司經(jīng)營中解決客戶售后服務的技術(shù)人員調(diào)配問題,商業(yè)中物流配送問題等。不足之處仍然存在,但客觀講,本文思想方法仍具有一定的理論及現(xiàn)實意義,具有較好的可操作性,值得廣泛推廣。
參考文獻:
[1]Sun J, Xu WB.A global search strategy of quantum- behaved particle swarm optimization [C].Proceedings of IEEE Conference on Cybernetics and Intelligent Systems, 2009.:111- 116.
[2]HWANG H-S. A food distribution model for famine relief [J]. Computer and industrial Engineering, 2011, 37 (1 /2) :335-338.
[3]Wan Xiaoyu,Pu Yifei, Li Bingjun, Fractional Differential Amplitude Hierarchical Feature of MPSK Signals[G].8tth INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING PROCEEDINGS,2010,
[4]王萬良,蔣一波,李祖欣等.網(wǎng)絡控制與調(diào)度方法及其應用[M].北京:科學出版社,2009.
[5]楊繼軍.面向非常規(guī)突發(fā)事件的應急資源博弈調(diào)度模型與優(yōu)化策略研究[D].上海:同濟大學經(jīng)濟與管理學院,2009.
[6]姚杰,計雷,池宏.突發(fā)事件應急管理中的動態(tài)博弈分析[J].管理評論,2005(3):46-50.
Gábor Lugosi, Universitat Pompeu Fabra, Barcelona
Prediction, Learning and
Games
2006, 394pp.
HardcoverUSD65.00
ISBN 978-0-521-84108-5
Nicolò Cesa-Bianchi(意大利) 等著
日常生活中,有關(guān)預測的例子如預報給定地點明天的溫度,或者是猜測在下一個月內(nèi)哪些資產(chǎn)將會獲得最佳效益,盡管它們內(nèi)容不同,這些任務在一個抽象的層次上是類似的。在給定的有關(guān)過去的元素的某些知識以及其他可利用信息的條件下,預測一個未知序列的下一個元素,對這個過程的研究,就是預測研究。
本書的主題是單一序列預測。人們在各種不同的領(lǐng)域中對它進行研究如統(tǒng)計決策理論、信息理論、博弈理論、機器學習及數(shù)學金融領(lǐng)域。這個主題最早的形成可以追溯到20世紀50年代。與預測的標準統(tǒng)計學方法不同,單個序列預測對于數(shù)據(jù)產(chǎn)生機制并不強加任何概率統(tǒng)計的假設(shè)。此外人們還可以構(gòu)建預測算法,該算法對于所有可能的序列都能很好地工作。在這個意義上講,單序列預測的性能與在一個給定參考類中的最佳預測策略是一樣好的。本書列舉的單序列預測模型使用的是專家咨詢預測模型。重復博弈,自適應數(shù)據(jù)壓縮,股票市場順序投資序列模式分析和其它幾個問題都可以看作是專家框架的示例。從一個普通的非隨機觀點進行分析,經(jīng)常會揭示元素之間新的、令人感興趣的關(guān)系。作者對各種預測方法用精確的數(shù)學方式描述,以便表征這些預測方法在理論上存在哪些限制和可能性。
本書共有12章。第1章緒論;第2章預測與專家咨詢;第3章特殊損失的緊限界;第4章隨機化判斷;第5章用于大專家類的有效預測;第6章具有有限反饋的預測;第7章預測和進行博弈;第8章絕對損失;第9章對數(shù)損失;第10章順序投資;第11章線性模式識別;第12章線性分類。本書的附錄中收集了書中使用的技術(shù)工具。附錄A1概率論中的不等式;附錄A2基本的信息理論;附錄A3分類基礎(chǔ)。
作者撰寫本書是為了促使有關(guān)單一序列預測的概念在上述這些領(lǐng)域中更加順暢地流傳。本書可以用作機器學習、博弈論、統(tǒng)計學和信息理論專業(yè)的研究人員及學生的參考書和教科書。
胡光華,高級軟件工程師
中圖分類號:F069.9文獻標志碼:A文章編號:1673-291X(2009)29-0240-02
“博弈論”這一名詞的流行僅僅始于幾十年前,但是,博弈論思想本身卻有著悠久的歷史,如兩千多年前的“田忌賽馬”就是出色利用博弈論的典型生動的例子,至今仍然為中國的許多學者、老師應用來作為博弈論的入門例子。
一、博弈論的發(fā)展進程
博弈論思想雖然有著悠久的歷史,但是作為一門系統(tǒng)的學科來說還相當?shù)哪贻p。近代以來,在學術(shù)研究的過程中許多學者逐漸認識到了博弈論的重要作用,對博弈理論進行了探索研究。一般認為,對于博弈理論的最早研究可以追溯到18世紀初。瓦德格拉夫(W aldegrave)在1713年提出了兩人博弈的極小化極大混合策略解。古諾(Coumot)和波特蘭德(Bertrand)分別在1838年和1883年提出了博弈論最經(jīng)典的模型,兩位學者分別從產(chǎn)量決策和價格決策分析壟斷的雙寡頭競爭模型,確定了在競爭之下各自的最優(yōu)反應函數(shù)。但是作為一種理論來說,1944年,馮?諾依曼(Von Neumann)和奧?摩根斯坦(Morgenstern)合著了《博弈論與經(jīng)濟行為》在總結(jié)了以往關(guān)于博弈的研究成果的基礎(chǔ)上,提出了博弈論的概念術(shù)語、一般框架和表述方法,提出了較系統(tǒng)的博弈理論,因此這被認為是博弈理論初步形成的標志。50年代初,納什(J.Nash)的兩篇非合作博弈論奠基性之后,博弈論飛速發(fā)展。作為博弈論的一部分,非合作博弈比合作博弈的發(fā)展更加迅速,在經(jīng)濟學等其他學科中的應用也更為廣泛。提起博弈論,現(xiàn)在差不多總是指非合作博弈論。50年代以來,納什(Nash)、澤爾騰(Selten)、海薩尼(Harsanyi)等人是博弈論成熟并最終進入使用。
最近三四十年,經(jīng)濟學經(jīng)歷了一場“博弈論革命”,經(jīng)濟學者們引入博弈論的概念和方法改造經(jīng)濟學的思維,推進了經(jīng)濟學的研究,可以說博弈論在一定程度上已經(jīng)改寫了微觀經(jīng)濟學,成為推動經(jīng)濟學發(fā)展的一大動力。一方面,納什均衡概念以及更多的博弈論知識的引入使寡頭競爭理論得到改造,在現(xiàn)實中應用的普遍性更明顯,嚴格而深入的探討競爭現(xiàn)實的現(xiàn)代寡頭理論迅速發(fā)展起來;另一方面,在經(jīng)濟社會中,每個人的決策都是根據(jù)他所掌握的有關(guān)信息做出的,非對稱信息博弈論這種分析方法徹底改變了微觀經(jīng)濟學的面貌,極大地促進了信息經(jīng)濟學的發(fā)展,信息經(jīng)濟學已經(jīng)真正成為當今經(jīng)濟分析的主流。
二、博弈論的主要內(nèi)容
博弈論(Game Theory)又稱作對策論,是專門研究理性個體之間相互沖突和合作的學科。一個最基本的博弈結(jié)構(gòu),至少包括三個要素:局中人(player)、戰(zhàn)略空間(strategy space)和支付結(jié)構(gòu)(payoff structure)。
博弈論的基礎(chǔ)假定是博弈的參與者即局中人是理性而明智的;在每個局中人的所有可選行動范圍(戰(zhàn)略空間)內(nèi),該局中人是獨立的,不受其他局中人任何形式的脅迫;一個局中人的支付結(jié)構(gòu)表示在不同情況(不同戰(zhàn)略組合)下博弈終了時他的收益(或“得分”)。在典型的支付結(jié)構(gòu)中,一個局中人所得的支付不僅與他自己選擇何種戰(zhàn)略有關(guān),而且還是其他局中人所選戰(zhàn)略的函數(shù),任何一個局中人改變自己的戰(zhàn)略都將影響所有局中人所獲的支付水平。這就是說,局中人之間的利益是相互牽連和相互制約的。除上述3個要素以外,要對一個博弈進行分析,對博弈定義一個信息結(jié)構(gòu)也是必不可少的。研究者必須明確每個局中人知道什么和不知道什么。在局中人追求自己的支付最大化假定下,博弈論研究這些理性個體的行為選擇。一個博弈的“解”,也就是該博弈最可能出現(xiàn)的結(jié)果,稱為“均衡”(equilibrium)。一般情況下,博弈雙方的目的就是能夠得到一個均衡結(jié)果。
一個完整的博弈應該包含五個方面的內(nèi)容:第一,博弈的參與人,即博弈過程中獨立決策、獨立承擔后果的個人和組織;第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈的行動空間,即博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策后的得失。
三、博弈論的應用和對博弈論反向應用的思考
自從將博弈論引入經(jīng)濟學以后,經(jīng)濟學改變了傳統(tǒng)經(jīng)濟分析地那種以個人孤立決策,其他經(jīng)濟活動者的行為影響則被典型地簡化為價格信號為基礎(chǔ)的分析方法,而側(cè)重于經(jīng)濟活動中多個利益主體的行為所產(chǎn)生的相互作用和影響的分析,從而使經(jīng)濟分析更能反應經(jīng)濟系統(tǒng)的本質(zhì)。
博弈的過程在一定程度上更接近經(jīng)濟生活中的實際,具體來說,博弈論是怎樣應用到實際事務上的,下面將舉例說明,并且討論探索反向應用博弈論是否可能、是否有意義。
我們以日常生活中最常見的學生與家長的博弈為例:
假設(shè)一小學生和其家長,學生每天都必須完成老師布置的家庭作業(yè),家長可能檢查也有可能不檢查其完成狀況。如果學生按時完成家庭作業(yè),玩的時間減少;家長檢查,學生沒有完成就會得到懲罰。家長當然希望孩子按時完成作業(yè),如果檢查發(fā)現(xiàn)學生沒有做作業(yè),家長會感到生氣,而且天天檢查對家長來說是額外的負擔。因此如果學生做了作業(yè)家長也檢查了,那么學生得到的效用是-2,家長得到的效用是2;如果學生做了作業(yè)家長沒有檢查,那么學生得到的效用是-4,家長得到的效用為3;如果學生沒有做作業(yè)家長檢查了,學生增加了玩耍的時間卻受到了懲罰,得到的效用是0,家長得到的效用是-2;如果學生沒有做作業(yè)家長也沒有檢查那么學生得到的效用是4,家長的實際得到的效用是-1.博弈矩陣如圖1:
博弈的結(jié)果是學生會選擇不做作業(yè),家長會選擇不檢查,實際影響是無論是對學生自己還是對家長來說,得到的都是最差的結(jié)果。
面對這樣不盡如人意的博弈結(jié)果,我們應該怎么辦呢?
博弈總是在一定的條件下進行的,這些條件決定了博弈的結(jié)果。那么根據(jù)現(xiàn)有的博弈結(jié)果,我們是否可以反向應用,找出可以改變的條件從而改變整個博弈的格局,改變博弈結(jié)果,改善博弈雙方的效用水平呢?
仍然以上面的學生家長博弈為例:
1950年和 1951年納什的兩篇關(guān)于非合作博弈的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈極其均衡解 ,并證明了均衡解的存在性,即著名的“納什均衡”,從而揭示了博弈均衡與經(jīng)濟均衡的內(nèi)在聯(lián)系奠定了現(xiàn)代非合作博弈論的基石。
要了解納什均衡,首先要知道什么是非合作博弈問題?!扒敉嚼Ь场笔窃搯栴}最經(jīng)典的例子,我們也從該例為切入點進行探討:
首先,一個完整的博弈應當包括五個方面的內(nèi)容:第一,博弈的參加者,即博弈過程中獨立決策、獨立承擔后果的個人和組織;第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做 出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失。
“囚徒困境”:兩個嫌疑犯(A和 B)作案后被警察抓住,隔離審訊;警方的政策是“坦白從寬,抗拒從嚴”,如果兩人都坦白則各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判 1O年;如果都不坦白則因證據(jù)不足各判1年。
在這個例子里,博弈的參加者就是兩個嫌疑犯 A和 B,他們每個人都有兩個策略即坦白和不坦白,判刑的年數(shù)就是他們的支付。可能出現(xiàn)的四種情況:A和 B均坦白或均不坦白、A坦白 B不坦白或者 B坦白A不坦白,是博弈的結(jié)果。在此,兩個嫌疑犯 A和 B面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判 1年。但由于兩人處于隔離情況下無法串供。所以,按照亞當·斯密的理論,每一個人都是從利 己的目的出發(fā),他們選擇坦白交代是最佳策略。因為坦白交代可以期望得到最好的解決辦法——釋放,但前提是同伙抵賴,顯然要比自己抵賴要坐 1O年牢好得多。這種策略是損人利 己的策略。不僅如此,坦白還有更多的好處。如果對方坦白了而自己抵賴了,那自己就得坐 1O年牢。太不劃算了!因此,在這種情況下還是應該選擇坦白交代,即使兩人同時坦白,至多也只判 8年,總 比被判 10年好。結(jié)果 ,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結(jié)局(各被判1年刑)就不會 出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判 8年 的結(jié)局被稱為“納什均衡”,也叫非合作均衡因為,每一方在選擇策略時都沒有“共謀”(串供),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。也就是說,這種策略組合由所有局中人(也稱當事人、參與者)的最佳策略組合構(gòu)成。沒有人會主動改變有著廣泛而深刻的意義。個人理性與集體理性的沖突,各人追求利己行為而導致的最終結(jié)局是一個“納什均衡”,也是對所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監(jiān)禁結(jié)果?!凹{什均衡”首先對亞當·斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經(jīng)濟中,每一個人都從利己的目的出發(fā),而最終全社會達到利他的效果。不妨讓我們重溫一下這位經(jīng)濟學圣人在《國富論》中的名言:“通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益?!睆摹凹{什均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發(fā) ,結(jié)果損人不利己,既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說,“納什均衡”提出的悖論實際上動搖 了西方經(jīng)濟學的基石。因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利 己策略”。但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“納什均衡”是一種非合作博弈均衡,在現(xiàn)實中非合作的情況要比合作情況普遍。所以“納什均衡”是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發(fā)展,甚至可以說是一場革命。
從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見慣的經(jīng)濟、社會、政治、國防、管理和日常生活中的博弈現(xiàn)象:
(1)電信價格競爭
根據(jù)我國電信業(yè)的實際情況,我們來構(gòu)造電信業(yè)價格戰(zhàn)的博弈模型。假設(shè)此博弈的參加者為電信運營商 A與B,他們在電信某一領(lǐng)域展開競爭,一開始的價格都是 PoA(中國電信)是老牌企業(yè),實力雄厚,占據(jù)了絕大多數(shù)的市場份額;B(中國聯(lián)通)則 剛成立不久 ,翅膀還沒長硬 ,是政府為了打破壟斷鼓勵競爭而籌建起來的。
正因為 B是政府扶植起來鼓勵競爭的,所以 B得到了政府的一些優(yōu)惠,其中就有 B的價格可以比Po低 10%。這一舉動,還不會對 A產(chǎn)生多大的影響,因為 A的根基實在是太牢固了。在這樣的市場分配下,A、B可以達到平衡,但由于 B在價格方面的優(yōu)勢,市場份額逐步壯大,到了一定程度對 A造成了影響。這時候,A該怎么做?不妨假定:
A降價而B維持,則A獲利 15,B損失5,整體獲利10;
A維持且B也維持,則 A獲利5,B獲利10,整體獲利15;
A維持而 B降價,則 A損失 10,B獲利 15,整體獲利5;
A降價且 B也降價,則 A損失 5,B損失 5,整體損失10。
從 A角度看 ,顯然降價要 比維持好,降價至少可以保證比 B好,在概率均等的情況下,A降價的收益為 15 x50%一5 x 50% =5,維持的收益為 5 x 50%一10 x 50% =一2.5,為了自身利益的最大化,A就不可避免地選擇了降價。從 B角度看,效果也一樣,降價同樣比維持好,其降價收益為 5,維持收益為2.5,它也同樣會選擇降價。在這輪博弈中,A、B都將降價作為策略,因此各損失 5,整體損失 10,整體收益是最差的。這就是此博弈最終所出現(xiàn)的納什均衡。我們構(gòu)造的這一電信業(yè)價格戰(zhàn)博弈模型是典型的囚徒困境現(xiàn)象,各個局部都尋求利益的最大化,而整體利益卻不是最優(yōu),甚至是最差。
許多其他行業(yè)的價格競爭都是典型的囚徒困境現(xiàn)象,如可口可樂公司和百事可樂公司之間的競爭、各大航空公司之間的價格競爭等等。
(2)OPEC組織成員國之間的合作與背叛
“囚徒困境”告訴我們,個人理性和集體理性之間存在矛盾,基于個人理性的正確選擇會降低大家的福利,也就是說,基于個人利益最大化的前提下,帕累托改進得不到進行,帕累托最優(yōu)得不到實現(xiàn)。
上述我們在對電信價格競爭的博弈分析中,只是一次性的“囚徒困境”博弈,因此得到了互相降價的納什均衡。而在現(xiàn)實生活當中,信任與合作很少達到如此兩難的境地,無論在自然界還是在人類社會,“合作”都是一種隨處可見的現(xiàn)象。比如中東石油輸出國組織(Organization of PetroleumExporting Countries簡稱 OPEC)的成立,本身就是要限制各石油生產(chǎn)國的產(chǎn)量,以保持石油價格,以便獲取利潤,是合作的產(chǎn)物。OPEC之所以能夠成立,各組織成員國之間之所以能夠合作,是因為囚徒困境如果是一次性博弈的話,基于個人利益最大化,得到納什均衡解,但如果是多次博弈,人們就有了合作的可能性,囚徒困境就有可能破解 ,合作就有可能達成。連續(xù)的合作有可能成為重復的囚徒困境的均衡解。這也是博弈論上著名的“大眾定理”(Folk Theorem)的含義。
但合作的可能性不是必然性。博弈論的研究表明,要想使合作成為多次博弈的均衡解,博弈的一方(最好是實力更強的一方)必須主動通過可信的承諾(Credible commit.r em),向另一方表示合作的善意,努力把這個善意表達清楚,并傳達出去。如果該困境同時涉及多個對手,則要在博弈對手中形成聲譽,并用心地維護這個聲譽。這里“可信的承諾”是一個很牽強的翻譯,“Credible commitment”并不是什么空口諾言,而是實實在在的付出。所以合作是非常困難的。所以 OPEC組織經(jīng)常會有成員國不遵守組織的協(xié)定私 自增加石油產(chǎn)量。每個成員國都這樣想,只要他們不增加產(chǎn)量,我增加一點點產(chǎn)量對價格沒什么影響,結(jié)果每個國家都增加產(chǎn)量,造成石油價格下跌 ,大家的利潤都受到損失。當然,一些產(chǎn)量增加較少的國家損失更多,于是也更加大量生產(chǎn),造成價格進一步下降——結(jié)果,陷入一個困境大家都增加產(chǎn)量,價格下跌,大家再增加產(chǎn)量,價格再下跌理論上,幾乎所有的卡特爾都會遭到失敗,原因就在于卡特爾的協(xié)定(類似囚犯的攻守同盟 )不是一個納什均衡沒有成員有興趣遵守。那么是不是不可能有卡特爾合作成功了?理論上,如果是無限期的合作 ,雙方考慮長遠利益他們的合作是會成功的。但只要是有限次的合作 ,合作就不會成功。比如合作 10次,那么在第九次博弈參與人就會采取不合作態(tài)度 ,因為大家都想趁最后一次機會撈一把,反正以后我也不會跟你合作了。但是大家料到第九次會出現(xiàn)不合作,那么就很可能在第八次就采取不合作的態(tài)度。第八次不合作會使大家在第七次就不合作……一直到,從第一次開始大家都不會采取合作態(tài)度。 還存在其他一些“非合作博議”的情況:
(1)污染博弈
假如市場經(jīng)濟中存在著污染,但政府并沒有管制的環(huán)境,企業(yè)為了追求利潤的最大化,寧愿以犧牲環(huán)境為代價也絕不會主動增加環(huán)保設(shè)備投資。按照看不見的手的原理 ,所有企業(yè)都會從利己的 目的出發(fā),采取不顧環(huán)境的策略 ,從而進入“納什均衡”狀態(tài)。如果一個企業(yè)從利他的目的出發(fā),投資治理污染 ,而其他企業(yè)仍然不顧環(huán)境污染,那么這個企業(yè)的生產(chǎn)成本就會增加 ,價格就要提高,它的產(chǎn)品就沒有競爭力 ,甚至企業(yè)還要破產(chǎn)。這是一個“看不見的手的有效的完全競爭機制”失敗的例證。直到 20世紀 90年代中期 ,中國鄉(xiāng)鎮(zhèn)企業(yè)的盲 目發(fā)展造成嚴重污染的情況就是如此。只有在政府加強污染管制時,企業(yè)才會采取低污染的策略組合。企業(yè)在這種情況下,獲得與高污染同樣的利潤,但環(huán)境將更好。
(2)貿(mào)易自由與壁壘
這個問題對于剛剛加入 WTO的中國而言尤為重要。任何一個國家在國際貿(mào)易中都面臨著保持貿(mào)易自由與實行貿(mào)易保護主義的兩難選擇。貿(mào)易自由與壁壘問題,也是一個“納什均衡”,這個均衡是貿(mào)易雙方采取不合作博弈的策略,結(jié)果使雙方因貿(mào)易戰(zhàn)受到損害。x國試圖對 Y國進行進口貿(mào)易限制,比如提高關(guān)稅 ,則 Y國必然會進行反擊,也提高關(guān)稅,結(jié)果誰也沒有撈到好處。反之,如 x和 Y能達成合作性均衡,即從互惠互利的原則出發(fā),雙方都減少關(guān)稅限制,結(jié)果大家都從貿(mào)易 自由中獲得了最大利益,而且全球貿(mào)易的總收益也增加了。
以上是運用博弈論中的經(jīng)典案例“囚徒困境”對現(xiàn)實經(jīng)濟生活的一些簡單的理論上的分析,雖然在現(xiàn)實生活當中影響人們決策和態(tài)度的因素很多,但是 ,博弈論作為現(xiàn)代經(jīng)濟學的前沿領(lǐng)域,始終是一個強有力的分析工具。
參考文獻
中圖分類號:G642文獻標識碼:A 文章編號:1003-2851(2010)01-0025-02
一、概念
博弈論是經(jīng)濟學中的一個重要的理論, 它在日常生活中有著廣泛的應用?,F(xiàn)在博弈論也越來越多的被引人到體育領(lǐng)域, 結(jié)合具體的體育項目進行研究。
(一)博弈論
博弈論, 英文為game theory, 是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題。博弈論是一種方法論, 它是一種思維方式、技術(shù)方法和理論體系, 應用的范圍不僅包括經(jīng)濟學, 而且包括政治、軍事、外交、體育等。博弈論可以分為合作型博弈和非合作(競爭)型博弈。合作博弈,指人們達成合作而得到的收益,即收益分配問題;非合作博弈,指人們在利益相互沖突的局勢中如何確定決策使自己的收益最大化,即策略選擇問題。因為人們之間的相互依存和相互制約作用以及自利的本性產(chǎn)生了博弈,而博弈簡單的論述就是雙方或多方在一維或多維之間斗智斗勇,作出決策分析,達到均衡解決,求得雙贏的結(jié)果。
一個完整的體育博弈應當包括五個方面:1.博弈的參加者,即博弈過程中獨立決策、獨立承擔所果的個人和組織;2.博弈信息,即博弈者所掌握的對手對選擇有幫助的情報資料;3.博弈方可選擇的全部行為或策略的集合;4.博弈的次序,即博弈運動員做出策略選擇的先后;5.博弈方的收益,即勝算或取得勝利?!扒敉嚼Ь场笔遣┺恼摰慕?jīng)典例子,經(jīng)濟學家把大量的看似最優(yōu)卻導致次優(yōu)或較差的結(jié)果的行為稱“囚徒困境”?!扒敉嚼Ь场笔怯脕碚f明博弈論及其在經(jīng)濟環(huán)境中如何運用的一個例子,它很有說服力而又易于理解。然而不是所有參賽者,策略和后果的情形都會導致囚徒困境。
(二)體育博弈現(xiàn)象
是指體育實踐中存在的各種沖突、對抗與競爭。體育博弈現(xiàn)象表現(xiàn)在競技運動的方方面面。從申辦之爭、組織管理之爭、勞資大戰(zhàn)、儀器設(shè)備的研制, 到選材、訓練方法之爭。如高原訓練、力量訓練、興奮劑之爭、藥物與體能的恢復、消除疲勞等, 以及競賽之爭, 如中長跑的領(lǐng)先戰(zhàn)術(shù)、世界杯的斗智斗勇、競賽中的心理戰(zhàn)等等。現(xiàn)代化的社會也增加了體育競爭的激烈程度。排球比賽中也有不少的博弈現(xiàn)象,如發(fā)球階段,發(fā)球方可選擇發(fā)到前排也可選擇發(fā)到后排,還可選擇發(fā)給接一傳不穩(wěn)得隊員,發(fā)球階段的博弈策略主要以破壞對方一傳為目的。網(wǎng)前技術(shù)的博弈現(xiàn)象更多,時間差進攻、位置差進攻、空間差進攻、梯次進攻、快球進攻等,紛繁交錯的技戰(zhàn)術(shù)讓對手防不勝防。面對對方強勢的攔網(wǎng)陣型,“尤其是在快速多變的戰(zhàn)術(shù)體系中,有針對性地運用吊球技術(shù),可以使得戰(zhàn)術(shù)組合更加變化多端,從而擾亂對方的防守布局,破壞對方的防守節(jié)奏,甚至渙散對方的士氣,邊不利為有利?!?四兩撥千斤的吊球,有時可收到意想不到的效果。對方的吊球可與各種進攻戰(zhàn)術(shù)的扣球相結(jié)合, 即“ 打吊”結(jié)合,吊球可與各種進攻戰(zhàn)術(shù)的扣球相結(jié)合, 即“ 打吊”結(jié)….合,吊球可與各種進攻戰(zhàn)術(shù)的扣球相結(jié)合, 即“ 打吊”結(jié)合,吊球可與各種進攻戰(zhàn)術(shù)的扣球相結(jié)合, 即“ 打吊”結(jié)合,
二、排球比賽中發(fā)球策略的博弈分析
(一)比賽前對對手的情報資料的收集與分析
體育博弈論的精髓是對對手的情報資料的收集與分析,相對應地采用何種策略來對應。例如對對手技、戰(zhàn)術(shù)特點的了解。如以前蘇聯(lián)、保加利亞、波蘭男排為代表,他們身材高大,彈跳力強,以兇狠扣殺取勝的“力量排球”。以捷克斯洛伐克男排為代表,他們善于用腦,輕打軟吊,以巧取勝的“技巧排球”。以日本、中國男排為代表,他們主要 依靠默契配合,集體智慧,快速善變來達到取勝的目的的“配合排球”。因此,在參加比賽之前必須發(fā)揮團隊作用和臨場靈活的策略運用,才能提高勝算,最終取得勝利。
(二)策略的選擇
1.利用發(fā)球控制節(jié)奏
現(xiàn)代排球的實踐證明,比賽節(jié)奏主動權(quán)的掌握在臨場比賽中起著舉足輕重的作用。發(fā)球是破壞對方比賽節(jié)奏先發(fā)制人的進攻技術(shù),準確而有威脅的發(fā)球不僅可以直接得分,還可以破壞對方一傳的質(zhì)量,迫使對方打調(diào)整球,擾亂其戰(zhàn)術(shù)組合,減輕本方防守的壓力,力爭防反主動權(quán)。用“穩(wěn)、狠、準”的發(fā)球,通過找點或找人發(fā)出速度、線路、性能、落點各不相同的球去破壞對方的一傳,使對方在一傳、二傳、扣殺等環(huán)節(jié)不能順利銜接,擾亂對方接發(fā)球反攻的節(jié)奏,達到破壞對方戰(zhàn)術(shù)節(jié)奏的目的[5]。
2.接發(fā)球策略
在排球比賽中,發(fā)球的策略尤為重要,達到破壞對方一傳的作用。但是雙方運動員都不可能運用單一的比賽策略,選擇單一的策略必然是愚蠢的,也不可能能夠打敗對手,因此,通常都是采用混合策略來對抗,讓對方不可預測才是明智的。例如A 隊與B隊進行比賽,A 隊的比分已領(lǐng)先,B隊在賽前已經(jīng)掌握到A 隊的大量資料信息,A隊的強項是致命的大力跳發(fā)球與高攔網(wǎng),似乎很顯然,在比賽到關(guān)鍵時刻,在接下來的比賽中,B 隊應該避免一傳不穩(wěn)的隊員接發(fā)球或網(wǎng)前強攻;同樣很顯然A 隊很清楚地知道這個策略的人。因此A 隊在意識上和體力上都很好地做好大力跳發(fā)球和高攔網(wǎng)的準備,這樣,針對強項所進行的攻擊對B隊就很具有殺傷力。
A隊猜是快攻 A隊猜是吊球
B隊網(wǎng)快攻B贏得40% B贏得60%
A贏得60%A贏得40%
B隊網(wǎng)前吊球 B贏得60%B贏得50%%
A贏得40%A贏得50%
B隊在網(wǎng)前的時候有兩個選擇,進攻或吊球。相應地,A隊也有兩種策略,即預計對方可能進攻和預計對方可能吊球。如果A選手正確地猜到對手強攻,A隊將有60%的可能贏得該球;如果A隊正確地猜到吊球,A選手將有50%的可能贏得該球。如果A選手猜是快強攻,而B選手卻是吊球,那么A選手贏得該球的概率是40%;如果A 選手錯誤地猜是吊球,B 選手贏得該球的概率也是40%。
與囚徒困境的例子不一樣,這種情形并沒有單一的均衡結(jié)果。比如,假設(shè)B 選手一直對A 選手的吊球,A 選手看到這一點,于是A 選手總是作好接吊球的準備,這樣A 選手將贏得60%的球。B 選手意識到,如果能夠騙過了A 選手將會更好,于是B 選手發(fā)A 的快攻就贏得60%的球。A 選手很快也知道了B 的新策略,于是預料B 選手會快攻,贏得50%的球。B 再次調(diào)整,現(xiàn)在改為針對A 選手的強項―高攔網(wǎng)。因為A 仍然預計B 選手會發(fā)吊球,所以B 選手贏得60%的球。然而A 選手再次明白了,正確預料到會是強攻或快攻。這樣,A 與B又會到了出發(fā)點,贏得40%的球,真所謂的斗智斗勇。
既然長期中沒有任何戰(zhàn)略是最優(yōu)的,那么只有通過騙過A 選手,發(fā)那種“A 預料不到”的球,B 才能獲得最大的優(yōu)勢。這意味著B 選手必須采取一種混合策略,時而發(fā)吊球,時而強攻或快攻。如果A 選手猜對了,A 選手的反擊是致命的。因此,B 選手必須頻繁地交叉的改變戰(zhàn)術(shù),以至于A 選手從猜中B 發(fā)正手還是發(fā)反手當中,根本得不到好處。
3.排球比賽中的一個概率問題
假定B 選手的策略是以概率p 發(fā)A 選手的吊球,因而針對A 的快攻或強攻的概率就是1-p,進一步假定A 選手的策略是預料為吊球的概率為q,因而預料為快攻或強攻的概率就是1-q。如果A 選手預料此球為吊球,那么,根據(jù)上表A 選手贏得此球的概率是p1=0.6+0.4(1-p)因為當A 選手預計為吊球時,A 贏得發(fā)給自己的吊球的60%,贏得發(fā)給自己快攻的40%。同理,如果A 選手預料此球為快攻,那么,贏得此球的概率為p2=0.6+0.5(1-p),B 選手的最優(yōu)策略就應當是發(fā)吊球的概率要使得A 選手從猜吊球還是快攻中占不到任何便宜。換句話說,B 選手的最優(yōu)策略是選擇一個p 值,使得p1=p2,解得,p=1/3。就會發(fā)現(xiàn),B 選手的最優(yōu)策略是1/3 的球發(fā)吊球,2/3 發(fā)快攻。這樣,無論A 選手猜什么,B 選手都會贏得53.3%的球。進而提高了勝算,取得最終的勝利。
排球比賽的各階段都需要博弈的思想來解決,找出最佳的最適合的發(fā)展對策,博弈貫穿于整個排球比賽中。盡管決定排球競賽的勝利因素很多,但是,教練員和運動員在某一項戰(zhàn)術(shù)上的策略運用得當,可以提高勝算的,所以運動員在提高自己的技術(shù)水平的基礎(chǔ)上,要發(fā)揚團隊精神,教練員和運動員在賽前對比賽對手的技術(shù)特點加以認真細致的研究,在臨場的戰(zhàn)術(shù)策略的運用要隨臨場的變化而變化,要使對手摸不著、猜不透,提高比賽心理素質(zhì),還得通過學習博弈理論在戰(zhàn)術(shù)運用上苦心鉆研,提高勝算,最終獲得勝利。
參考文獻