בקטנה: הסרט "נפלאות התבונה" מבוסס על חייו של ג'ון נאש (1928 - 2015), מתמטיקאי אמריקאי, זוכה פרס נובל לכלכלה לשנת 1994. סצנה מפורסמת בסרט ("סצנת הבר") נועדה להמחיש תחום מרכזי בעבודתו הנקרא תורת המשחקים. אולם, הסצנה לא מבהירה לצופים נושא מרכזי בתחום: "שיווי משקל נאש" [1]. ננסה להציע דוגמה משופרת שגם מתאימה ברוחה ל-2020.
בסצנה המפורסמת [1], המתמטיקאי אותו מגלם ראסל קרואו, נמצא בבר עם חברים הבוהים בבלונדינית יפיפייה שנכנסת לבר עם חברות. כל החברים רוצים לפנות אליה. אולם נאש מציע שיטה שונה: להתעלם ממנה! "אם כולנו נלך על הבלונדינית", הוא אומר, "אנחנו נחסום זה את זה ואף אחד מאיתנו לא יצליח להשיג אותה. לאחר מכן כשנפנה לחברות שלה הן תידחנה אותנו כי אף אחת לא אוהבת להיות בחירה שנייה. אבל מה אם אף אחד לא יתחיל עם הבלונדינית? כך לא נעמוד אחד בדרכו של האחר. זו הדרך היחידה שבה כולנו נצליח...". החברים מסכימים, ופונים לחברות הברונטיות. אולם נאש מתחכם והולך לפגוש את הבלונדינית!
הסצנה ממחישה דרכי חשיבה אופייניות לתורת המשחקים, ענף במתמטיקה ובכלכלה המנתח אינטראקציות (מצבי עימות או שיתוף פעולה) בין מקבלי החלטות ("שחקנים"). נמשיך בדוגמה מהסרט, על אף שאנחנו חשים סלידה מהמחשבה על מדד ל״אטרקטיביות״ של אנשים. נאש מראה לחבריו שהשיטה של כל אחד לפיה הוא מנסה להשיג את ה״מיטב״ (לפנות אל הבלונדינית) אינה משתלמת בהנחה שגם האחרים עושים כך. לאחר מכן הוא מציע לכל אחד שיטה בה כולם משיגים משהו. עם זאת, השיטה לא מובילה לשיווי משקל, שכן בהינתן שכולם פועלים לפיה, לנאש (או לכל אחד מהחברים) דווקא כדאי לשנות את דרך פעולתו ולפנות אל הבלונדינית, ואכן נאש עושה זאת.
בתקופתנו, כשרבים כמהים לשיווי משקל, נציע סצנה דומה שבה מצאנו יותר איזון ויחס מכבד לאנשים. נדמיין שסטודנט שנקרא לו שלומי פונה בשאלה לידידו המתמטיקאי. "אני ועמיתי אלכס הולכים פעם בשבוע להרצאה, ומעדיפים את זו של פרופ' רונה על פני זו של ד"ר מלכה. אבל אצל רונה יש רק מקום פנוי אחד, ואם שנינו ננסה להיכנס, יהיו ויכוחים ושנינו נפספס את ההרצאה. מה לעשות?". המתמטיקאי מבקש משלומי לדרג את "מידת האושר" עבור כל תוצאה אפשרית מאפס עד עשר. "אם אני אכנס להרצאה של רונה זה יופי (ציון 9). אם שנינו נגיע אליה, לבסוף נריב ואף אחד לא יכנס וזה מדכא (ציון 0). אם רק אני אכנס להרצאה של מלכה, ניחא (ציון 6). אם שנינו נבוא למלכה, זה מתסכל (ציון 5). מה לעשות?
אם שלומי יחליט לנסות תמיד להיכנס להרצאה של רונה, רמת האושר הממוצעת שלו לאורך הסמסטר תנוע בין אפס לתשע, בהתאם למה שאלכס יבחר. האם ניתן למצוא שיטה שתתן לשלומי בממוצע לאורך הסמסטר "רמת אושר" סבירה ויציבה? לשם כך, נשתמש בשיטה הנקראת "אסטרטגיה מעורבת": שלומי ישלב בין שתי שיטות ויבחר בכל שבוע בין שתי ההרצאות באמצעות הגרלה. למשל, הוא יבחר ב-p אחוז מהמפגשים לנסות להיכנס להרצאה של רונה ובשאר המפגשים להגיע להרצאה של מלכה. כנ"ל יעשה אלכס, שיגיע ב- q אחוז מהמפגשים להרצאה של רונה ובשאר לזו של מלכה. האם קיימת שכיחות יחסית q שאם אלכס יבחר בה ללכת לרונה, לשלומי לא יהיה אכפת למי ללכת (כלומר: יזכה בממוצע באותו אושר בשתי האפשרויות)?.
כדי לפתור, נגדיר את R כמידת האושר הממוצע של שלומי כשהוא מגיע להרצאה של רונה. יהיה זה הציון 9 מוכפל בשכיחות שאלכס לא שם (אחד פחות q).
R=9*(1-q)
נגדיר את M כאושר של שלומי כשהוא הולך להרצאה של מלכה, שזה אחוז המקרים שאלכס לא שם (q) מוכפל בציון 6 ועוד אחוז המקרים שגם אלכס מגיע להרצאה של מלכה (אחד פחות q ) מוכפל בציון 5.
M= 6*q+(1-q) *5
במשקל האושר של שלומי בהליכה לרונה שווה לאושרו בהליכה למלכה. כלומר R=M.
R=M -> q=40% R=M=5.4
אם נערוך את אותו חישוב גם עבור אלכס נקבל בדומה p=q=40% . כלומר אם אלכס ושלומי יגיעו בשכיחות של 40% להרצאתה של רונה, נקבל שיווי משקל שהוא יציב במובן שאין לאף אחד מהשניים סיבה לשנות את דרך ההגרלה (שהיא 40% לרונה). מצב זה נקרא "שיווי משקל נאש" על שם ג'ון נאש. מדד האושר הממוצע של כל אחד מהם הוא 5.4. הציון לא מרשים במיוחד, אבל אולי מבטיח שקט נפשי (לניתוח מצבים אחרים, ראו טבלה למטה עם ערכי p ו- q שונים).
ניסינו לתת טעימה לנושא המקסים של "תורת המשחקים". התמונה השלמה מורכבת יותר , ונושאים כאלו נלמדים בקורסים מתקדמים במתמטיקה. בניתוח הנחנו שאין אפשרות לאף אחד משניהם לנחש מראש מה תוצאות ההגרלה של האחר. הנחה מפשטת נוספת שעשינו היא שלמרות שהמשחק נמשך לאורך כל הסמסטר, אין תלות בין אירועים שונים, אין למידה מניסיון, שניהם קובעים אסטרטגיה מעורבת ולא מנסים לאתגר או להעניש בתגובה, מה שבדרך כלל לא קורה במציאות. "תורת המשחקים" דנה גם במקרים מורכבים יותר, כולל שינויי אסטרטגיה דינמיים ואיומים, מה שמסבך יותר את התמונה.
אך האם יש אפשרות לשפר את המצב? עד עכשיו דיברנו על דוגמה שבה אין שיתוף פעולה אולם ניתן להרוויח רבות במשחק כזה אם המשתתפים ישתפו פעולה ויתאמו ביניהם את המהלכים. למשל, שלומי ואלכס יכולים להסכים לעשות רוטציה כך שבחצי הראשון של הסמסטר אלכס ישתתף בהרצאות של רונה, ושלומי בחצי השני. אסטרטגיה זו נקראת "שיווי משקל מתואם". בשיטה זו, רמת האושר הממוצעת של שלומי תעלה ל-7.5 .
אולם, הרוטציה תצליח בתנאי שאין להם אינטרס חבוי להכשיל, והם פועלים בתיאום (לא כמו ההתנהגות הערמומית שהפגין ראסל קרואו בסרט). נראה מסובך? אכן, תורת המשחקים היא מורכבת, מרתקת, ומאתגרת!
טבלת ממוצע האושר בערכי p/q שונים:
עיצוב: דור עבדה
תמונת המאמר שונתה תחת הרשאת creative commons של היוצר https://www.flickr.com/photos/jdxyw
מקורות וקריאה נוספת
[1] סצינת הבר בסרט נפלאות התבונה
[2] ניו יורק טיימס - למה הסצנה לא מייצגת