מה ההבדל בין השונות לסטיית התקן?

click fraud protection

כאשר אנו מודדים את השונות של קבוצת נתונים, קיימות שתי סטטיסטיקות קשורות זה לזה: ה- שונות ו סטיית תקן, אשר שניהם מצביעים על מידת התפשטות של ערכי הנתונים וכרוכים בצעדים דומים בחישובם. עם זאת, ההבדל העיקרי בין שני ניתוחים סטטיסטיים אלה הוא שסטיית התקן היא השורש הריבועי של השונות.

כדי להבין את ההבדלים בין שתי תצפיות אלה על התפשטות סטטיסטית, יש להבין תחילה מה מייצג כל אחת מהן: שונות מייצגת את כל נקודות הנתונים בקבוצה ומחושב על ידי ממוצע הסטייה בריבוע של כל ממוצע ואילו סטיית התקן היא מדד להתפשטות סביב הממוצע כאשר הנטייה המרכזית מחושבת באמצעות מתכוון.

כתוצאה, השונות יכולה להתבטא כסטיית הריבוע הממוצעת של הערכים מהאמצעים או [בריבוע סטיית האמצעים] מחולקת במספר התצפיות וסטיית התקן יכולה להתבטא כשורש הריבוע של שונות.

בניית שונות

כדי להבין היטב את ההבדל בין נתונים סטטיסטיים אלה עלינו להבין את חישוב השונות. השלבים לחישוב שונות המדגם הם כדלקמן:

  1. חשב את הממוצע המדגם של הנתונים.
  2. מצא את ההבדל בין הממוצע לערכי הנתונים.
  3. ריבוע ההבדלים האלה.
  4. הוסף את ההבדלים בריבוע יחד.
  5. חלק את הסכום הזה באחד פחות מהמספר הכולל של ערכי הנתונים.
instagram viewer

הסיבות לכל אחד מהשלבים הבאים הן כדלקמן:

  1. הממוצע מספק את נקודת המרכז או ממוצע מהנתונים.
  2. ההבדלים מהממוצע עוזרים לקבוע את הסטיות מממוצע זה. ערכי נתונים שהם רחוקים מהממוצע יפיקו סטייה גדולה יותר מאלו הקרובים לממוצע.
  3. ההבדלים בריבוע מכיוון שאם יתווספו ההבדלים מבלי להיות בריבוע, סכום זה יהיה אפס.
  4. ה תוספת לסטיות בריבוע אלה מספק מדידה של סטייה מוחלטת.
  5. החלוקה לפי אחד פחות מגודל המדגם מספקת מעין סטייה ממוצעת. זה שולל את ההשפעה של נקודות נתונים רבות שכל אחת תורמת למדידת הפיזור.

כאמור, סטיית התקן מחושבת בפשטות על ידי מציאת השורש הריבועי של תוצאה זו, המספקת את סטנדרט הסטייה המוחלט ללא קשר למספר הכולל של ערכי נתונים.

שונות וסטיית תקן

כשאנחנו שוקלים את השונות, אנו מבינים שיש חיסרון אחד גדול בשימוש בו. כשאנחנו עוקבים אחר שלבי חישוב השונות, זה מראה שהשונות נמדדת במונחים של יחידות ריבועיות מכיוון שהוספנו יחד הבדלים בריבועים בחישוב שלנו. לדוגמה, אם נתוני הדגימה שלנו נמדדים במונחים של מטרים, היחידות לשונות יינתנו במ"ר.

על מנת לתקן את מידת ההתפשטות שלנו, עלינו לקחת את השורש הריבועי של השונות. זה יבטל את בעיית היחידות הריבועיות, וייתן לנו מידה של התפשטות שתכלול אותן יחידות כמו המדגם המקורי שלנו.

ישנן נוסחאות רבות בסטטיסטיקה מתמטית בעלות צורות נאות יותר כאשר אנו מציינים אותן במונחים של שונות במקום סטיית תקן.

instagram story viewer