לפעמים בסטטיסטיקה, מועיל לראות דוגמאות מעובדות לבעיות. דוגמאות אלה יכולות לעזור לנו להבין בעיות דומות. במאמר זה נעבור את התהליך של ביצוע סטטיסטיקות הסבר לתוצאה הנוגעת לשני אמצעי אוכלוסייה. לא רק שנראה כיצד לנהל א מבחן השערה לגבי ההבדל בין שני אמצעי אוכלוסיה, נבנה גם א מרווח ביטחון להבדל זה. השיטות בהן אנו משתמשים נקראות לעיתים מבחן t של שני דגימות ומרווח ביטחון של שני דגימות t.
הצהרת הבעיה
נניח שאנו רוצים לבחון את יכולת המתמטיקה של ילדי בית הספר בכיתה. שאלה אחת שעשויה להיות לנו היא אם לציוני מבחן ממוצעים גבוהים יותר יש רמות גבוהות יותר.
דגימה אקראית פשוטה של 27 תלמידי כיתות ג 'ניתנת במבחן מתמטיקה, התשובות שלהם נקבעות והתוצאות נמצאות כציון ממוצע של 75 נקודות עם מדגם סטיית תקן של 3 נקודות.
דגימה אקראית פשוטה של 20 תלמידי כיתה ה 'ניתנת לאותה מבחן במתמטיקה והתשובות שלהם נקבעות. הציון הממוצע לתלמידי כיתות ה 'הוא 84 נקודות עם סטיית תקן מדגמית של 5 נקודות.
בהתחשב בתרחיש זה נשאל את השאלות הבאות:
- האם נתוני המדגם מספקים לנו עדויות לכך שציון הבדיקה הממוצע של אוכלוסיית כל תלמידי כיתות ה 'עולה על ציון הבדיקה הממוצע של אוכלוסיית כל תלמידי כיתות ג'?
- מהו מרווח ביטחון של 95% להבדל בציוני הבדיקה הממוצע בין אוכלוסיות תלמידי כיתות ג 'ותלמידי כיתות ה'?
תנאים ונוהל
עלינו לבחור באיזה הליך להשתמש. בכך אנו חייבים לוודא ולבדוק כי התקיימו התנאים להליך זה. אנו מתבקשים להשוות בין שני אמצעי אוכלוסייה. אוסף אחד של שיטות בהן ניתן להשתמש כדי לעשות זאת הם אלה עבור נהלי t דו-מדגמים.
על מנת להשתמש בנהלי t אלה לשתי דגימות, עלינו לוודא כי התנאים הבאים הם:
- יש לנו שתי דוגמאות אקראיות פשוטות משתי האוכלוסיות המעניינות.
- הדגימות האקראיות הפשוטות שלנו אינן מהוות יותר מ- 5% מהאוכלוסייה.
- שתי הדגימות אינן תלויות זו בזו, ואין התאמה בין הנבדקים.
- המשתנה מופץ בדרך כלל.
- הן האוכלוסייה ממוצעת והן סטיית תקן אינן ידועות עבור שתי האוכלוסיות.
אנו רואים שרוב התנאים הללו מתקיימים. נאמר לנו שיש לנו דוגמאות אקראיות פשוטות. האוכלוסיות בהן אנו לומדים גדולות מכיוון שיש מיליוני תלמידים ברמות כיתה אלה.
התנאי שלא נוכל להניח אוטומטית הוא אם ציוני המבחן מופצים בדרך כלל. מכיוון שיש לנו גודל מדגם מספיק גדול, על ידי החוסן של נהלי ה- t שלנו אנו לא בהכרח זקוקים להפצה של המשתנה באופן רגיל.
מכיוון שהתנאים מתקיימים, אנו מבצעים כמה חישובים מקדימים.
שגיאה רגילה
שגיאת התקן היא הערכה של סטיית תקן. לנתון זה אנו מוסיפים את שונות הדגימה של הדגימות ואז לוקחים את השורש הריבועי. זה נותן את הנוסחה:
(s1 2 / n1 + s22 / n2)1/2
על ידי שימוש בערכים שלמעלה, אנו רואים שהערך של השגיאה הסטנדרטית הוא
(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583
דרגות חופש
אנו יכולים להשתמש בקירוב השמרני עבורנו דרגות חופש. זה עשוי לזלזל במספר מעלות החופש, אך קל הרבה יותר לחשב את זה מאשר להשתמש בנוסחה של וולך. אנו משתמשים בקטן מבין שני גדלי הדגימה ואז מחסירים אחד ממספר זה.
לדוגמא שלנו, הקטנה מבין שתי הדגימות היא 20. המשמעות היא שמספר דרגות החופש הוא 20 - 1 = 19.
מבחן השערה
ברצוננו לבחון את ההשערה כי לתלמידי כיתה ה 'יש ציון מבחן ממוצע הגבוה מהציון הממוצע של תלמידי כיתה ג'. בואו μ1 להיות הציון הממוצע של אוכלוסיית כל תלמידי כיתות ה '. באופן דומה, אנו מאפשרים ל- μ2 להיות הציון הממוצע של אוכלוסיית כל תלמידי כיתות ג '.
ההשערות הן כדלקמן:
- ח0: μ1 - μ2 = 0
- חא: μ1 - μ2 > 0
נתון הבדיקה הוא ההבדל בין אמצעי המדגם, המחולק אז על ידי השגיאה הסטנדרטית. מכיוון שאנו משתמשים בסטיות תקן מדגמיות כדי להעריך את סטיית התקן של האוכלוסייה, נתון הבדיקה מההפצה t.
ערך נתון הבדיקה הוא (84 - 75) /1.2583. זה בערך 7.15.
אנו קובעים כעת מהו ערך ה- p עבור מבחן השערה זה. אנו בוחנים את ערך נתון המבחן, והיכן הוא ממוקם על חלוקה t עם 19 מעלות חופש. להפצה זו יש לנו 4.2 על 10-7 כערך ה- p שלנו. (אחת הדרכים לקבוע זאת היא להשתמש בפונקציה T.DIST.RT באקסל.)
מכיוון שיש לנו ערך p כה קטן, אנו דוחים את השערת האפס. המסקנה היא שציון הבדיקה הממוצע לתלמידי כיתות ה 'גבוה יותר מציון הבדיקה הממוצע עבור תלמידי כיתות ג'.
מרווח ביטחון
מכיוון שקבענו שיש הבדל בין ציוני הממוצע, אנו קובעים כעת מרווח ביטחון להבדל בין שני אמצעים אלה. יש לנו כבר הרבה ממה שאנחנו צריכים. מרווח הביטחון להבדל צריך להיות גם אומדן וגם שולי שגיאה.
האומדן להבדל בין שני אמצעים הוא פשוט לחישוב. אנו פשוט מוצאים את ההבדל של אמצעי המדגם. הבדל זה של המדגם פירושו מעריך את ההבדל בין אמצעי האוכלוסייה.
עבור הנתונים שלנו, ההבדל באמצעי המדגם הוא 84 - 75 = 9.
שולי הטעות מעט יותר קשה לחישוב. לשם כך עלינו להכפיל את הנתון המתאים בטעות הסטנדרטית. הנתון הדרוש לנו נמצא על ידי התייעצות עם טבלה או תוכנה סטטיסטית.
שוב באמצעות הקירוב השמרני, יש לנו 19 דרגות חופש. למרווח ביטחון של 95% אנו רואים כי t* = 2.09. נוכל להשתמש ב- פונקצית T.INV ב- Exceכדי לחשב ערך זה.
כעת אנו מרכיבים את הכל ורואים ששולי הטעות שלנו הם 2.09 על 1.2583, שהם בערך 2.63. מרווח הביטחון הוא 9 ± 2.63. המרווח הוא 6.37 עד 11.63 נקודות במבחן שבחרו תלמידי כיתה ג '.