במשחק עצמו מיוצגים עונשים (ותגמולים, ככל שזה רלוונטי) שירות מספרים. מספרים חיוביים מייצגים תוצאות טובות, מספרים שליליים מייצגים תוצאות רעות, ותוצאה אחת טובה יותר מתוצאה אחרת אם המספר המשויך אליה הוא גדול יותר. (עם זאת, שימו לב כיצד זה עובד עבור מספרים שליליים, שכן -5, למשל, גדול מ- -20!)
בטבלה שלמעלה המספר הראשון בכל תיבה מתייחס לתוצאה עבור שחקן 1 והמספר השני מייצג את התוצאה עבור שחקן 2. מספרים אלה מייצגים רק קבוצה אחת מתוך מספרים רבים התואמים את מערך הדילמה של האסירים.
לאחר הגדרת משחק, השלב הבא בניתוח המשחק הוא הערכת האסטרטגיות של השחקנים ולנסות להבין כיצד יתכן שהשחקנים יתנהגו. כלכלנים מניחים כמה הנחות כאשר הם מנתחים משחקים - ראשית, הם מניחים ששני השחקנים מודעים לכך התשלומים הן לעצמם והן לשחקן השני, ושנית הם מניחים ששני השחקנים מסתכלים ל באופן רציונלי למקסם את התשלום שלהם מהמשחק.
גישה ראשונית קלה אחת היא לחפש את מה שנקרא אסטרטגיות דומיננטיות- אסטרטגיות הטובות ביותר ללא קשר לאסטרטגיה שהשחקן האחר בוחר. בדוגמה שלמעלה, בחירת להודות היא אסטרטגיה דומיננטית עבור שני השחקנים:
בהתחשב בכך שההודאה היא הטובה ביותר עבור שני השחקנים, אין זה מפתיע שהתוצאה בה שני השחקנים מודים היא תוצאה של שיווי משקל של המשחק. עם זאת, חשוב להיות קצת יותר מדויקים עם ההגדרה שלנו.
הרעיון של א שיווי משקל נאש קודקוד על ידי המתמטיקאי ותאורטיקן המשחק ג'ון נאש. במילים פשוטות, שיווי משקל נאש היא קבוצה של אסטרטגיות בעלות התגובה הטובה ביותר. במשחק של שני שחקנים, שיווי משקל נאש הוא תוצאה שבה האסטרטגיה של שחקן 2 היא התגובה הטובה ביותר לאסטרטגיה של שחקן 1 והאסטרטגיה של שחקן 1 היא התגובה הטובה ביותר לאסטרטגיה של שחקן 2.
ניתן להמחיש את מציאת שיווי המשקל של נאש באמצעות עיקרון זה. בדוגמה זו, התגובות הטובות ביותר של שחקן 2 לשחקן אחד מעגלות בירוק. אם שחקן 1 מודה, התגובה הטובה ביותר של שחקן 2 היא להודות, מכיוון ש -6 טוב יותר מ -10. אם שחקן 1 לא מודה, התגובה הטובה ביותר של שחקן 2 היא להודות, מכיוון ש -0 טוב יותר מ -1. (שים לב שהנמקה זו דומה מאוד להנמקה המשמשת לזיהוי אסטרטגיות דומיננטיות.)
התגובות הטובות ביותר של שחקן 1 מעוגלות בכחול. אם שחקן 2 מודה, התגובה הטובה ביותר של שחקן 1 היא להודות, מכיוון ש -6 טוב יותר מ -10. אם שחקן 2 לא מודה, התגובה הטובה ביותר של שחקן 1 היא להודות, מכיוון ש -0 טוב יותר מ -1.
שיווי המשקל של נאש הוא התוצאה שבה יש גם עיגול ירוק וגם עיגול כחול מכיוון שזה מייצג קבוצה של אסטרטגיות התגובה הטובות ביותר עבור שני השחקנים. באופן כללי, קיימות שיווי משקל של נאש מרובים או בכלל לא (לפחות באסטרטגיות טהורות כמתואר כאן).
יכול להיות ששמתם לב כי שיווי המשקל של נאש בדוגמה זו נראית תת אופטימית באופן מסוים (באופן ספציפי בכך שזה לא Pareto אופטימלי) מכיוון שאפשר לשני השחקנים להשיג -1 ולא -6. זוהי תוצאה טבעית של האינטראקציה הקיימת במשחק - בתיאוריה, לא להתוודות יהיה בכך אסטרטגיה מיטבית לקבוצה באופן קולקטיבי, אך תמריצים אינדיבידואליים מונעים את התוצאה הזו הושג. לדוגמה, אם שחקן 1 חשב ששחקן 2 ישתוק, יהיה לו תמריץ לחלוט עליו ולא לשתוק, ולהיפך.
מסיבה זו ניתן לחשוב על שיווי משקל של נאש כתוצאה שבה לאף שחקן אין תמריץ חד צדדי (כלומר בעצמו) לסטות מהאסטרטגיה שהובילה לתוצאה זו. בדוגמה שלמעלה, ברגע שהשחקנים בוחרים להודות, אף אחד מהשחקנים לא יכול לעשות טוב יותר על ידי שינוי דעתו בעצמו.