כיצד להעריך סטיות תקן (SD)

סטיית התקן והטווח הם שניהם מדדים של התפשטות של מערך נתונים. כל מספר מספר לנו בדרכו שלו עד כמה הם מפוזרים בנתונים, מכיוון ששניהם מדד לשונות. אמנם אין קשר מפורש בין טווח וסטיית תקן, יש כלל אצבע זה יכול להיות שימושי לקשר בין שתי נתונים סטטיסטיים אלה. קשר זה מכונה לעתים כלל טווח לסטיית תקן.

כלל הטווח אומר לנו שסטיית התקן של מדגם שווה בערך לרבע מטווח הנתונים. במילים אחרותs = (מקסימום - מינימום) / 4. זו נוסחה מאוד פשוטה לשימוש, ויש להשתמש בה רק כגס מאוד הערכת סטיית התקן.

דוגמה

כדי לראות דוגמה לאופן עבודת כלל הטווח, נראה את הדוגמה הבאה. נניח שנתחיל בערכי הנתונים של 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. לערכים אלה יש א מתכוון של 17 וסטיית תקן של כ -4.1. אם במקום זאת אנו מחשבים תחילה את טווח הנתונים שלנו כ- 25 - 12 = 13 ואז מחלקים את המספר הזה בארבעה יש לנו הערכה של סטיית התקן כ- 13/4 = 3.25. מספר זה קרוב יחסית לסטיית התקן האמיתית וטוב לאומדן גס.

מדוע זה עובד?

זה אולי נראה כי כלל הטווח קצת מוזר. מדוע זה עובד? האם לא נראה שרירותי לחלוטין רק לחלק את הטווח בארבעה? מדוע לא נחלק במספר אחר? יש למעשה הצדקה מתמטית שקורה מאחורי הקלעים.

instagram viewer

זכור את המאפיינים של עקומת פעמון וההסתברויות מא תפוצה רגילה רגילה. תכונה אחת קשורה לכמות הנתונים שנמצאת בתוך מספר מסוים של סטיות תקן:

  • בערך 68% מהנתונים נמצאים בסטיית תקן אחת (גבוהה או נמוכה יותר) מהממוצע.
  • כ 95% מהנתונים נמצאים בשתי סטיות תקן (גבוהות או נמוכות יותר) מהממוצע.
  • כ 99% נמצאים בתוך שלוש סטיות תקן (גבוהות או נמוכות יותר) מהממוצע.

המספר בו נשתמש קשור ל 95%. אנו יכולים לומר כי 95% משתי סטיות תקן מתחת לממוצע לשתי סטיות תקן מעל הממוצע, יש לנו 95% מהנתונים שלנו. כך שכמעט כל ההתפלגות הרגילה שלנו תשתרע על מקטע קו שאורכו בסך הכל ארבע סטיות תקן.

לא כל הנתונים מופצים בדרך כלל ועיצוב עקומת פעמון. אך מרבית הנתונים מתנהגים היטב כך שהתרחקות של שתי סטיות תקן מהממוצע לוכדת כמעט את כל הנתונים. אנו מעריכים ואומרים שארבע סטיות תקן הן בערך בגודל הטווח, וכך הטווח המחולק בארבע הוא קירוב גס של סטיית התקן.

שימושים לכלל הטווח

כלל הטווח מועיל במספר הגדרות. ראשית, זוהי הערכה מהירה מאוד של סטיית התקן. סטיית התקן מחייבת אותנו למצוא תחילה את הממוצע, ואז להוריד את הממוצע הזה מכל נקודת נתונים, ריבוע ההבדלים, הוסף אלה, מחלקים באחת פחות ממספר נקודות הנתונים, ואז (סוף סוף) לוקחים את הכיכר שורש. מצד שני, כלל הטווח מחייב חיסור אחד וחלוקה אחת בלבד.

מקומות אחרים שבהם כלל הטווח מועיל הם כאשר יש לנו מידע לא שלם. נוסחאות כמו זו לקביעת גודל המדגם דורשות שלוש פיסות מידע: הרצוי שולי הטעות, ה רמת אמון וסטיית התקן של האוכלוסייה שאנו חוקרים. פעמים רבות אי אפשר לדעת מה האוכלוסייה סטיית תקן הוא. עם כלל טווח, אנו יכולים להעריך נתונים סטטיסטיים אלה ואז לדעת כמה גדול עלינו לעשות את המדגם שלנו.