פעמים רבות כאשר אנו לומדים קבוצה, אנו באמת משווים בין שתי אוכלוסיות. תלוי ב פרמטר בקבוצה זו אנו מעוניינים והתנאים בהם אנו מתמודדים, קיימות מספר טכניקות זמינות. סטטיסטי הסקה נהלים הנוגעים להשוואה בין שתי אוכלוסיות בדרך כלל לא ניתן להחיל על שלוש אוכלוסיות או יותר. כדי ללמוד יותר משתי אוכלוסיות בבת אחת, אנו זקוקים לסוגים סטטיסטיים שונים של כלים. ניתוח שונות, או ANOVA, היא טכניקה מהפרעה סטטיסטית המאפשרת להתמודד עם מספר אוכלוסיות.
השוואת אמצעים
כדי לראות אילו בעיות מתעוררות ומדוע אנו זקוקים ל- ANOVA, נשקול דוגמא. נניח שאנחנו מנסים לקבוע אם מתכוון משקולות של סוכריות M&M ירוק, אדום, כחול וכתום שונות זו מזו. נציין את המשקלות הממוצע לכל אחת מהאוכלוסיות הללו, μ1, μ2, μ3 μ4 בהתאמה. אנו עשויים להשתמש במתאים מבחן השערה מספר פעמים, ובדיקה C (4,2), או שש שונות השערות אפסיות:
- ח0: μ1 = μ2 כדי לבדוק אם המשקל הממוצע של אוכלוסיית הסוכריות האדומות שונה מהמשקל הממוצע של אוכלוסיית הסוכריות הכחולות.
- ח0: μ2 = μ3 כדי לבדוק אם המשקל הממוצע של אוכלוסיית הסוכריות הכחולות שונה מהמשקל הממוצע של אוכלוסיית הסוכריות הירוקות.
- ח0: μ3 = μ4 כדי לבדוק אם המשקל הממוצע של אוכלוסיית הסוכריות הירוקות שונה מהמשקל הממוצע של אוכלוסיית הסוכריות הכתומות.
- ח0: μ4 = μ1 כדי לבדוק אם המשקל הממוצע של אוכלוסיית הסוכריות הכתומות שונה מהמשקל הממוצע של אוכלוסיית הסוכריות האדומות.
- ח0: μ1 = μ3 כדי לבדוק אם המשקל הממוצע של אוכלוסיית הסוכריות האדומות שונה מהמשקל הממוצע של אוכלוסיית הסוכריות הירוקות.
- ח0: μ2 = μ4 כדי לבדוק אם המשקל הממוצע של אוכלוסיית הסוכריות הכחולות שונה מהמשקל הממוצע של אוכלוסיית הסוכריות הכתומות.
ישנן בעיות רבות בניתוח מסוג זה. יהיו לנו שישה עערכים. למרות שאנחנו עשויים לבדוק כל אחד ב -95% רמת אמון, האמון שלנו בתהליך הכולל פחות מזה מכיוון שההסתברויות מתרבות: .95 x .95 x .95 x .95 x .95 x .95 הוא בערך .74, או רמה של 74% של ביטחון. כך ההסתברות לטעות מסוג I גדלה.
ברמה היסודית יותר, איננו יכולים להשוות בין ארבעת הפרמטרים הללו בכללותם על ידי השוואה בין שניים בכל פעם. האמצעים של M&M אדום וכחול עשויים להיות משמעותיים, כאשר המשקל הממוצע של אדום גדול יחסית למשקל הממוצע של הכחול. עם זאת, כאשר אנו שוקלים את המשקולות הממוצעות של כל ארבעת סוגי הממתקים, יתכן שלא יהיה הבדל משמעותי.
ניתוח שונות
כדי להתמודד עם מצבים בהם אנו צריכים לערוך השוואה מרובה אנו משתמשים ב- ANOVA. מבחן זה מאפשר לנו לקחת בחשבון את הפרמטרים של מספר אוכלוסיות בבת אחת, מבלי להיכנס לחלק מהבעיות שעומדות בפנינו ביצוע בדיקות השערה על שני פרמטרים בכל פעם.
כדי לבצע ANOVA בדוגמה של M&M לעיל, נבדוק את השערת האפס H0:μ1 = μ2 = μ3= μ4. זה קובע כי אין הבדל בין המשקולות הממוצע של M & Ms האדום, הכחול והירוק. ההשערה האלטרנטיבית היא שיש הבדל כלשהו בין המשקולות הממוצעות של ה- M & M- אדום, כחול, ירוק וכתום. השערה זו היא באמת שילוב של כמה אמירות חא:
- המשקל הממוצע של אוכלוסיית הסוכריות האדומות אינו שווה למשקל הממוצע של אוכלוסיית הסוכריות הכחולות, OR
- המשקל הממוצע של אוכלוסיית הסוכריות הכחולות אינו שווה למשקל הממוצע של אוכלוסיית הסוכריות הירוקות, OR
- המשקל הממוצע של אוכלוסיית הסוכריות הירוקות אינו שווה למשקל הממוצע של אוכלוסיית הסוכריות הכתומות, OR
- המשקל הממוצע של אוכלוסיית הסוכריות הירוקות אינו שווה למשקל הממוצע של אוכלוסיית הסוכריות האדומות, OR
- המשקל הממוצע של אוכלוסיית הסוכריות הכחולות אינו שווה למשקל הממוצע של אוכלוסיית סוכריות התפוז, OR
- המשקל הממוצע של אוכלוסיית הסוכריות הכחולות אינו שווה למשקל הממוצע של אוכלוסיית הסוכריות האדומות.
במקרה ספציפי זה, כדי להשיג את ערך ה- p שלנו, נשתמש ב- חלוקת הסתברויות ידוע כ חלוקת F. חישובים הכוללים את מבחן ה- ANOVA F יכולים להיעשות ביד, אך בדרך כלל מחושבים באמצעות תוכנה סטטיסטית.
השוואות מרובות
מה שמפריד בין ANOVA לטכניקות סטטיסטיות אחרות הוא שהוא משמש לביצוע השוואה מרובה. זה נפוץ בכל סטטיסטיקות, מכיוון שיש פעמים רבות בהן אנו רוצים להשוות יותר משתי קבוצות בלבד. בדרך כלל בדיקה כוללת מצביעה על כך שיש הבדל כלשהו בין הפרמטרים שאנו חוקרים. לאחר מכן אנו עוקבים אחר בדיקה זו עם ניתוח אחר כדי להחליט איזה פרמטר שונה.