חישוב א מדגם שונות או סטיית תקן בדרך כלל מצוין כשבריר. המונה של שבר זה כולל סכום של סטיות בריבוע מהממוצע. בסטטיסטיקה, הנוסחה לסכום הכולל של המשבצות היא
Σ (xאני - איקס)2
כאן הסמל x̄ מתייחס לממוצע המדגם, והסמל Σ אומר לנו להוסיף את ההבדלים בריבוע (xאני - x̄) לכולם אני.
בעוד שנוסחה זו עובדת לחישובים, קיימת נוסחת קיצור מקבילה שאינה מחייבת אותנו לחשב תחילה את ממוצע מדגם. נוסחת קיצור הדרך הזו עבור סכום המשבצות היא
Σ (xאני2) - (Σ xאני)2/n
כאן המשתנה n מתייחס למספר נקודות הנתונים במדגם שלנו.
דוגמא לנוסחה סטנדרטית
כדי לראות כיצד נוסחת קיצור הדרך הזו עובדת, נשקול דוגמא שמחושבת בשתי הנוסחאות. נניח שהמדגם שלנו הוא 2, 4, 6, 8. ממוצע המדגם הוא (2 + 4 + 6 + 8) / 4 = 20/4 = 5. כעת אנו מחשבים את ההפרש של כל נקודת נתונים עם 5 הממוצע.
- 2 – 5 = -3
- 4 – 5 = -1
- 6 – 5 = 1
- 8 – 5 = 3
כעת אנו מרובעים את כל המספרים הללו ומוסיפים אותם זה לזה. (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.
דוגמת נוסחת קיצור דרך
כעת נשתמש באותה קבוצת נתונים: 2, 4, 6, 8, עם נוסחת הקיצור בכדי לקבוע את סכום המשבצות. אנו מרובעים תחילה כל נקודת נתונים ומוסיפים אותם יחד: 22 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.
השלב הבא הוא להוסיף את כל הנתונים ולצבוע את הסכום הזה: (2 + 4 + 6 + 8)2 = 400. אנו מחלקים זאת במספר נקודות הנתונים כדי להשיג 400/4 = 100.
כעת אנו מפחיתים מספר זה מ- 120. זה נותן לנו כי סכום הסטיות בריבוע הוא 20. זה היה בדיוק המספר שכבר מצאנו מהנוסחה האחרת.
איך זה עובד?
אנשים רבים פשוט יקבלו את הנוסחה בערך הנקוב ואין להם שום מושג מדוע הנוסחה הזו עובדת. על ידי שימוש באלגברה קטנה, אנו יכולים לראות מדוע נוסחת קיצור הדרך שווה לדרך הרגילה והמסורתית לחישוב סכום הסטיות בריבוע.
למרות שישנם מאות, אם לא אלפי ערכים במערך נתונים של העולם האמיתי, אנו נניח שישנם רק שלושה ערכי נתונים: x1, איקס2, איקס3. מה שאנו רואים כאן ניתן להרחיב לקבוצת נתונים הכוללת אלפי נקודות.
אנו מתחילים בלשים לב לכך (x1 + x2 + x3) = 3 x̄. הביטוי Σ (xאני - איקס)2 = (x1 - איקס)2 + (x2 - איקס)2 + (x3 - איקס)2.
אנו משתמשים בעובדה מאלגברה בסיסית ש- (a + b)2 = א2 + 2ab + b2. משמעות הדבר היא כי (x1 - איקס)2 = x12 -2x1 x̄ + x̄2. אנו עושים זאת בשני המונחים האחרים של סיכוםנו, ויש לנו:
איקס12 -2x1 x̄ + x̄2 + x22 -2x2 x̄ + x̄2 + x32 -2x3 x̄ + x̄2.
אנו מסדרים את זה מחדש ויש לנו:
איקס12+ x22 + x32+ 3x̄2 - 2x̄ (x1 + x2 + x3) .
על ידי שכתוב (x1 + x2 + x3) = 3x̄ האמור לעיל הופך:
איקס12+ x22 + x32 - 3x̄2.
עכשיו מאז 3x̄2 = (x1+ x2 + x3)2/ 3, הנוסחה שלנו הופכת:
איקס12+ x22 + x32 - (איקס1+ x2 + x3)2/3
וזה מקרה מיוחד של הנוסחה הכללית שהוזכרה לעיל:
Σ (xאני2) - (Σ xאני)2/n
האם זה באמת קיצור דרך?
זה אולי לא נראה כאילו הנוסחה הזו היא באמת קיצור דרך. אחרי הכל, בדוגמה שלמעלה נראה שיש חישובים באותה מידה. חלק מזה קשור לעובדה שרק הסתכלנו בגודל המדגם שהיה קטן.
ככל שאנו מגדילים את גודל המדגם, אנו רואים כי נוסחת הקיצור מקטינה את מספר החישובים בכמחצית. איננו צריכים לחסר את הממוצע מכל נקודת נתונים ואז לרבוע את התוצאה. זה מקטין משמעותית את המספר הכולל של הפעולות.