מספר ה דרגות חופש לעצמאות של שני משתנים קטגוריים ניתנת על ידי נוסחה פשוטה: (r - 1)(ג - 1). כאן r הוא מספר השורות ו- ג הוא מספר העמודות ב- שולחן דו כיווני של ערכי המשתנה הקטגורי. המשך לקרוא כדי ללמוד עוד על נושא זה ולהבין מדוע נוסחה זו נותנת את המספר הנכון.
רקע כללי
צעד אחד בתהליך של רבים בדיקות השערה היא קביעת מספר דרגות החופש. המספר הזה חשוב מכיוון שעבור התפלגויות הסתברות המערבים משפחה של התפלגויות, כגון חלוקת הצ'י-ריבוע, מספר הדרגות של החופש מציין את ההתפלגות המדויקת מהמשפחה בה אנו צריכים להשתמש בהשערה שלנו מבחן.
דרגות חופש מייצגות את מספר הבחירות החופשיות שאנו יכולים לעשות במצב נתון. אחת ממבחני ההשערה המחייבת אותנו לקבוע את דרגות החופש היא צ'י-מרובע מבחן לעצמאות לשני משתנים קטגוריים.
מבחנים לעצמאות וטבלאות דו כיווניות
מבחן הצ'י-ריבוע לעצמאות קורא לנו לבנות טבלה דו כיוונית, הידועה גם כטבלת מגירה. סוג זה של טבלה כולל r שורות ו ג עמודות המייצגות את r רמות של משתנה קטגורי אחד ו ג רמות של המשתנה הקטגורי האחר. לפיכך, אם איננו סופרים את השורה והעמודה בהם אנו רושמים סיכומים, יש סך של rc תאים בטבלה הדו-כיוונית.
מבחן הצ'י-ריבוע לעצמאות מאפשר לנו לבחון את ההשערה לפיה קטגורית המשתנים אינם תלויים זה בזה. כפי שהזכרנו לעיל, r שורות ו ג העמודות בטבלה נותנות לנו (r - 1)(ג - 1) דרגות חופש. אך יתכן שלא ברור מייד מדוע זהו המספר הנכון של דרגות החופש.
מספר דרגות החופש
כדי לראות מדוע (r - 1)(ג - 1) הוא המספר הנכון, נבדוק מצב זה ביתר פירוט. נניח שאנחנו יודעים את הסיכומים השוליים של כל אחת מהרמות של המשתנים הקטגוריים שלנו. במילים אחרות, אנו יודעים את הסכום עבור כל שורה ואת הסכום עבור כל טור. בשורה הראשונה יש ג העמודות בטבלה שלנו, כך שיש ג תאים. ברגע שאנו יודעים את הערכים של כולם מלבד אחד מהתאים הללו, מכיוון שאנו יודעים את סך כל התאים, זוהי בעיית אלגברה פשוטה לקביעת הערך של התא שנותר. אם היינו ממלאים את התאים האלה בטבלה שלנו, היינו יכולים להיכנס ג - 1 מהם בחופשיות, אבל אז התא שנשאר נקבע על ידי סך כל השורה. כך יש ג - 1 דרגות חופש לשורה הראשונה.
אנו ממשיכים בדרך זו לשורה הבאה, וישנם שוב ג - דרגות 1 של חופש. תהליך זה ממשיך עד שנגיע לשורה הלפני אחרונה. כל אחת מהשורות למעט האחרונה תורמת ג - דרגות 1 של חופש לסך הכל. עד שיש לנו את הכל מלבד השורה האחרונה, מכיוון שאנו מכירים את סכום העמודה נוכל לקבוע את כל הערכים בשורה האחרונה. זה נותן לנו r - 1 שורות עם ג - דרגות חופש בכל אחת מאלו, בסך הכל (r - 1)(ג - 1) דרגות חופש.
דוגמא
אנו רואים זאת בדוגמה הבאה. נניח שיש לנו טבלה דו כיוונית עם שני משתנים קטגוריים. למשתנה אחד שלוש רמות ובשני יש שתיים. יתר על כן, נניח שאנו יודעים את סיכומי השורה והעמודה עבור טבלה זו:
דרגה א | דרגה ב | סה"כ | |
שלב 1 | 100 | ||
שלב 2 | 200 | ||
רמה 3 | 300 | ||
סה"כ | 200 | 400 | 600 |
הנוסחה חוזה שיש (3-1) (2-1) = 2 דרגות חופש. אנו רואים זאת כדלקמן. נניח שאנו ממלאים את התא השמאלי העליון עם המספר 80. זה יקבע אוטומטית את כל שורת הערכים הראשונה:
דרגה א | דרגה ב | סה"כ | |
שלב 1 | 80 | 20 | 100 |
שלב 2 | 200 | ||
רמה 3 | 300 | ||
סה"כ | 200 | 400 | 600 |
כעת אם אנו יודעים שהערך הראשון בשורה השנייה הוא 50, אז שאר הטבלה ממלאת, מכיוון שאנו יודעים את סך כל השורות והעמודות:
דרגה א | דרגה ב | סה"כ | |
שלב 1 | 80 | 20 | 100 |
שלב 2 | 50 | 150 | 200 |
רמה 3 | 70 | 230 | 300 |
סה"כ | 200 | 400 | 600 |
השולחן מלא לחלוטין, אבל היו לנו שתי אפשרויות חופשיות בלבד. לאחר היוודע ערכים אלה, שאר הטבלה נקבעה לחלוטין.
למרות שאנחנו בדרך כלל לא צריכים לדעת מדוע יש דרגות חופש רבות כל כך, טוב לדעת שאנחנו באמת רק משתמשים במושג דרגות החופש על מצב חדש.