ישנן מדידות רבות של התפשטות או פיזור בסטטיסטיקה. למרות ש טווח ו סטיית תקן הם הנפוצים ביותר, ישנן דרכים אחרות לכמת פיזור. אנו נבחן כיצד לחשב את הסטייה המוחלטת הממוצעת עבור מערך נתונים.
הגדרה
נפתח בהגדרת הסטייה המוחלטת הממוצעת, המכונה גם הסטייה המוחלטת הממוצעת. הנוסחה המוצגת במאמר זה היא ההגדרה הרשמית של סטייה מוחלטת ממוצעת. יתכן שיהיה יותר הגיוני להתייחס לנוסחה זו כתהליך, או סדרה של שלבים, בהם אנו יכולים להשתמש בכדי להשיג את הסטטיסטיקה שלנו.
- אנו מתחילים עם ממוצע, או מדידת המרכז, של מערך נתונים, שאותו נציין באמצעות M.
- בשלב הבא נגלה עד כמה כל אחד מערכי הנתונים סוטה מהם M. משמעות הדבר היא שאנחנו לוקחים את ההבדל בין כל אחד מערכי הנתונים לבין M.
- לאחר מכן אנו לוקחים את ה- ערך מוחלט של כל אחד מההבדלים מהשלב הקודם. במילים אחרות, אנו מפילים סימנים שליליים לכל אחד מההבדלים. הסיבה לעשות זאת היא שישנן סטיות חיוביות ושליליות M. אם לא נגלה דרך לחסל את הסימנים השליליים, כל הסטיות יבטלו זו את זו אם נוסיף אותם יחד.
- כעת אנו מוסיפים את כל הערכים המוחלטים הללו.
- לבסוף, אנו מחלקים את הסכום הזה ב n, שזה המספר הכולל של ערכי נתונים. התוצאה היא סטייה מוחלטת ממוצעת.
וריאציות
ישנן כמה וריאציות לתהליך הנ"ל. שימו לב שלא צייננו מה בדיוק M הוא. הסיבה לכך היא שיכולנו להשתמש במגוון נתונים סטטיסטיים עבור M. בדרך כלל זהו מרכז מערך הנתונים שלנו, וכך ניתן להשתמש בכל אחת ממדידות הנטייה המרכזית.
המדידות הסטטיסטיות הנפוצות ביותר של מרכז מערך נתונים הן הממוצע, חציון והמצב. כך ניתן להשתמש בכל אחד מאלו M בחישוב הממוצע של סטייה מוחלטת. זו הסיבה שמקובל להתייחס לסטייה מוחלטת ממוצעת לגבי הממוצע או לסטייה מוחלטת ממוצעת לגבי החציון. נראה כמה דוגמאות לכך.
דוגמה: סטייה מוחלטת ממוצעת לגבי הממוצע
נניח שנתחיל עם מערך הנתונים הבא:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
הממוצע של מערך נתונים זה הוא 5. הטבלה הבאה תארגן את עבודתנו בחישוב הסטייה המוחלטת הממוצעת לגבי הממוצע.
ערך נתונים | סטייה מממוצע | ערך מוחלט של סטייה |
1 | 1 - 5 = -4 | |-4| = 4 |
2 | 2 - 5 = -3 | |-3| = 3 |
2 | 2 - 5 = -3 | |-3| = 3 |
3 | 3 - 5 = -2 | |-2| = 2 |
5 | 5 - 5 = 0 | |0| = 0 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
9 | 9 - 5 = 4 | |4| = 4 |
סה"כ סטיות מוחלטות: | 24 |
אנו מחלקים את הסכום הזה בעשר, מכיוון שיש בסך הכל עשרה ערכי נתונים. הסטייה המוחלטת הממוצע לגבי הממוצע היא 24/10 = 2.4.
דוגמה: סטייה מוחלטת ממוצעת לגבי הממוצע
כעת נתחיל עם מערך נתונים אחר:
1, 1, 4, 5, 5, 5, 5, 7, 7, 10.
בדיוק כמו מערך הנתונים הקודם, הממוצע של מערך הנתונים הזה הוא 5.
ערך נתונים | סטייה מממוצע | ערך מוחלט של סטייה |
1 | 1 - 5 = -4 | |-4| = 4 |
1 | 1 - 5 = -4 | |-4| = 4 |
4 | 4 - 5 = -1 | |-1| = 1 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
10 | 10 - 5 = 5 | |5| = 5 |
סה"כ סטיות מוחלטות: | 18 |
לפיכך הסטייה המוחלטת הממוצע לגבי הממוצע היא 18/10 = 1.8. אנו משווים תוצאה זו לדוגמא הראשונה. למרות שהממוצע היה זהה לכל אחת מהדוגמאות הללו, הנתונים בדוגמה הראשונה היו יותר פרוסים. אנו רואים משתי הדוגמאות הללו כי הסטייה המוחלטת הממוצעת מהדוגמה הראשונה גדולה יותר מהסטייה המוחלטת מהדוגמא השנייה. ככל שהסטייה המוחלטת הממוצעת גדולה יותר, כך פיזור הנתונים שלנו גדול יותר.
דוגמא: סטייה מוחלטת ממוצעת לגבי החציון
התחל עם אותה ערכת נתונים כמו הדוגמה הראשונה:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
החציון של מערך הנתונים הוא 6. בטבלה שלהלן אנו מראים את פרטי החישוב של הסטייה המוחלטת הממוצעת לגבי החציון.
ערך נתונים | סטייה מהחציון | ערך מוחלט של סטייה |
1 | 1 - 6 = -5 | |-5| = 5 |
2 | 2 - 6 = -4 | |-4| = 4 |
2 | 2 - 6 = -4 | |-4| = 4 |
3 | 3 - 6 = -3 | |-3| = 3 |
5 | 5 - 6 = -1 | |-1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
9 | 9 - 6 = 3 | |3| = 3 |
סה"כ סטיות מוחלטות: | 24 |
שוב אנו מחלקים את הסכום ב 10 ומקבלים סטייה ממוצעת ממוצעת לגבי החציון כ- 24/10 = 2.4.
דוגמא: סטייה מוחלטת ממוצעת לגבי החציון
התחל עם אותה ערכת נתונים כמו קודם:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
הפעם אנו מוצאים את מצב מערך הנתונים הזה כ 7. בטבלה שלהלן אנו מראים את פרטי החישוב של סטייה מוחלטת ממוצעת לגבי המצב.
נתונים | סטייה ממצב | ערך מוחלט של סטייה |
1 | 1 - 7 = -6 | |-5| = 6 |
2 | 2 - 7 = -5 | |-5| = 5 |
2 | 2 - 7 = -5 | |-5| = 5 |
3 | 3 - 7 = -4 | |-4| = 4 |
5 | 5 - 7 = -2 | |-2| = 2 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
9 | 9 - 7 = 2 | |2| = 2 |
סה"כ סטיות מוחלטות: | 22 |
אנו מחלקים את סכום הסטיות המוחלטות ורואים שיש לנו סטייה מוחלטת ממוצעת לגבי המצב של 22/10 = 2.2.
עובדות מהירות
יש כמה תכונות בסיסיות הנוגעות לסטיות מוחלטות ממוצעות
- הסטייה המוחלטת הממוצעת לגבי החציון היא תמיד פחות או שווה לסטייה המוחלטת הממוצעת לגבי הממוצע.
- סטיית התקן גדולה או שווה לסטייה המוחלטת הממוצעת לגבי הממוצע.
- הסטייה המוחלטת הממוצעת מקוצרת לעתים על ידי MAD. למרבה הצער, זה יכול להיות מעורפל מכיוון ש- MAD עשוי להתייחס לסירוגין לסטייה המוחלטת החציונית.
- הסטייה המוחלטת הממוצעת להתפלגות רגילה היא כ- 0.8 פעמים מגודל סטיית התקן.
שימושים נפוצים
לסטייה מוחלטת ממוצעת יש כמה יישומים. היישום הראשון הוא שניתן להשתמש בנתון זה כדי ללמד כמה מהרעיונות העומדים מאחורי סטיית תקן. הסטייה המוחלטת הממוצע לגבי הממוצע היא הרבה יותר קלה לחישוב מאשר סטיית התקן. זה לא מחייב אותנו לריבוע את הסטיות, ואנחנו לא צריכים למצוא שורש מרובע בסוף החישוב שלנו. יתר על כן, הסטייה המוחלטת הממוצעת קשורה באופן אינטואיטיבי יותר להתפשטות מערך הנתונים מאשר סטיית התקן. זו הסיבה שלעתים נלמדת תחילה סטייה מוחלטת ממוצעת, לפני הצגת סטיית התקן.
חלקם הרחיקו לכת וטענו כי יש להחליף את סטיית התקן בסטייה המוחלטת הממוצעת. למרות שסטיית התקן חשובה ליישומים מדעיים ומתמטיים, היא אינה אינטואיטיבית כמו הסטייה המוחלטת הממוצעת. עבור יישומים יומיומיים, הסטייה המוחלטת הממוצעת היא דרך מוחשית יותר למדוד את מידת הנתונים הפרוסים.