שונות האוכלוסייה נותנת אינדיקציה כיצד להפיץ מערך נתונים. לרוע המזל, בדרך כלל אי אפשר לדעת בדיוק מהו פרמטר האוכלוסייה הזה. כדי לפצות על חוסר הידע שלנו, אנו משתמשים בנושא מתוך סטטיסטיקות הסברה הנקראות מרווחי ביטחון. נראה דוגמא כיצד לחשב מרווח ביטחון לשונות אוכלוסייה.
נוסחת מרווח ביטחון
הנוסחה עבור (1 - α) מרווח ביטחון לגבי שונות האוכלוסייה. ניתן על ידי מחרוזת אי השוויון הבאה:
[ (n - 1)s2] / ב < σ2 < [ (n - 1)s2] / א.
כאן n הוא גודל המדגם, s2 היא שונות המדגם. המספר א היא נקודת התפוצה של הצ'י-ריבוע עם n -1 דרגות חופש בהן בדיוק α / 2 של האזור שמתחת לעיקול נמצא משמאל ל א. בצורה דומה, המספר ב היא הנקודה של אותה חלוקה צ'י-ריבועית עם α / 2 בדיוק של השטח שמתחת לעיקול מימין ב.
מקדימות
נפתח בערכת נתונים עם 10 ערכים. מערך נתונים זה התקבל על ידי מדגם אקראי פשוט:
97, 75, 124, 106, 120, 131, 94, 97,96, 102
יהיה צורך בניתוח נתונים חקרני כלשהו כדי להראות שאין מחיצות. על ידי בניית א חלקת גבעול ועלים אנו רואים כי נתונים אלה ככל הנראה מהפצה המופצת באופן רגיל בערך. המשמעות היא שנוכל להמשיך במציאת מרווח ביטחון של 95% לשונות האוכלוסייה.
שונה במדגם
עלינו להעריך את שונות האוכלוסייה עם שונות המדגם, המצוינת על ידי s2. אז נתחיל בחישוב הסטטיסטיקה הזו. למעשה אנו ממוצעים בממוצע סכום הסטיות בריבוע מהממוצע. עם זאת, במקום לחלק את הסכום הזה ב- n אנו מחלקים את זה לפי n - 1.
אנו מגלים שממוצע המדגם הוא 104.2. בעזרת זה יש לנו את סכום הסטיות בריבוע מה הממוצע שאפשר:
(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6
אנו מחלקים את הסכום הזה ב- 10 - 1 = 9 כדי להשיג שונות של מדגם של 277.
חלוקת צ'י-ריבוע
אנו פונים כעת להפצה הצ'י-מרובעת שלנו. מכיוון שיש לנו 10 ערכי נתונים, יש לנו 9 דרגות חופש. מכיוון שאנחנו רוצים 95% אמצעיים מההפצה שלנו, אנו זקוקים ל -2.5% בכל אחד משני הזנבות. אנו מתייחסים לטבלה או תוכנה עם צ'י ריבוע ורואים שערכי הטבלה של 2.7004 ו- 19.023 סוגרים 95% משטח ההפצה. המספרים האלה הם א ו בבהתאמה.
כעת יש לנו את כל מה שאנחנו צריכים, ואנחנו מוכנים להרכיב את מרווח הביטחון שלנו. הנוסחה לנקודת הקצה השמאלית היא [(n - 1)s2] / ב. משמעות הדבר היא שנקודת הקצה השמאלית שלנו היא:
(9 X 277) /19.023 = 133
נקודת הקצה הימנית נמצאת על ידי החלפה ב עם א:
(9X277) /2.7004 = 923
וכך אנו בטוחים ב 95% - ששונות האוכלוסייה נע בין 133 ל 923.
סטיית תקן אוכלוסייה
כמובן, מכיוון שסטיית התקן היא השורש הריבועי של השונות, ניתן להשתמש בשיטה זו לבניית מרווח ביטחון לסטיית התקן של האוכלוסייה. כל מה שנצטרך לעשות הוא לקחת שורשים מרובעים של נקודות הקצה. התוצאה תהיה מרווח ביטחון של 95% עבור סטיית תקן.