מרווח ביטחון להבדל בין שני פרופורציות אוכלוסייה

מרווחי אמון הם חלק אחד של סטטיסטיקה היסקית. הרעיון הבסיסי העומד מאחורי נושא זה הוא להעריך את הערך של אוכלוסייה לא ידועה פרמטר באמצעות מדגם סטטיסטי. אנו לא יכולים לאמוד רק את הערך של פרמטר, אלא גם להתאים את השיטות שלנו כדי להעריך את ההבדל בין שני פרמטרים קשורים. לדוגמה, ייתכן שנרצה למצוא את ההבדל באחוז האוכלוסייה הגברית המצביעה בארה"ב שתומכת בחוק מסוים בהשוואה לאוכלוסיית ההצבעה הנשית.

נראה כיצד לבצע סוג זה של חישוב על ידי בניית מרווח ביטחון להבדל של שני פרופורציות אוכלוסיה. בתהליך נבחן כמה מהתיאוריה שמאחורי חישוב זה. נראה כמה קווי דמיון באיך אנו בונים א מרווח ביטחון לשיעור אוכלוסייה בודד וכן א מרווח ביטחון להבדל בין שתי אוכלוסיות.

כלליות

לפני שנבחן את הנוסחה הספציפית בה נשתמש, הבה נבחן את המסגרת הכוללת בה נכנס סוג זה של מרווח ביטחון. הצורה של סוג מרווח הביטחון שנבחן בו ניתנת על ידי הנוסחה הבאה:

הערך +/- שולי טעות

מרווחי ביטחון רבים הם מסוג זה. יש שני מספרים שעלינו לחשב. הראשון מערכים אלה הוא האומדן לפרמטר. הערך השני הוא שולי הטעות. מרווח השגיאות הזה מהווה את העובדה שיש לנו אומדן. מרווח הביטחון מספק לנו מגוון של ערכים אפשריים לפרמטר הלא ידוע שלנו.

instagram viewer

תנאים

עלינו לוודא כי כל התנאים מתקיימים לפני ביצוע חישוב כלשהו. כדי למצוא מרווח ביטחון להבדל בין שני פרופורציות אוכלוסיה, עלינו לוודא כי הדברים הבאים:

יש לנו שתיים דוגמאות אקראיות פשוטות מאוכלוסיות גדולות. כאן "גדול" פירושו שהאוכלוסייה גדולה פי 20 מגודל המדגם. גדלי המדגם יצוינו על ידי n₁ ו n₂.
האנשים שלנו נבחרו ללא תלות זה בזה.
בכל אחת מהדגימות שלנו יש לפחות עשר הצלחות ועשרה כישלונות.

אם הפריט האחרון ברשימה אינו מרוצה, יתכן שיש דרך לעקוף זאת. אנו יכולים לשנות את ה- מרווח ביטחון פלוס-ארבעה בנייה ולקבל תוצאות חזקות. כשאנחנו קדימה אנו מניחים כי כל התנאים לעיל התקיימו.

דוגמאות ונתוני אוכלוסייה

כעת אנו מוכנים לבנות את מרווח הביטחון שלנו. אנו מתחילים עם האומדן להבדל בין פרופורציות האוכלוסייה שלנו. שני פרופורציות האוכלוסייה הללו מוערכות על ידי אחוז מדגם. פרופורציות אלה הן נתונים סטטיסטיים שנמצאים על ידי חלוקת מספר ההצלחות בכל מדגם ואז חלוקה בגודל המדגם המתאים.

שיעור האוכלוסייה הראשון מצוין על ידי ע₁. אם מספר ההצלחות במדגם שלנו מאוכלוסייה זו הוא k₁אז יש לנו חלק מדגימה של k₁ / n_1.

אנו מציינים נתונים אלה על ידי p̂₁. אנו קוראים סמל זה כ"עמ₁-מה "כי זה נראה כמו הסמל p₁ עם כובע למעלה.

בצורה דומה אנו יכולים לחשב פרופורציה מדגם מהאוכלוסייה השנייה שלנו. הפרמטר מאוכלוסייה זו הוא ע₂. אם מספר ההצלחות במדגם שלנו מאוכלוסייה זו הוא k₂, ויחס המדגם שלנו הוא p̂₂= ק₂ / n_2.

שתי הסטטיסטיקות הללו הופכות לחלק הראשון של מרווח הביטחון שלנו. האומדן של ע₁ הוא p̂₁. האומדן של ע₂ הוא p̂_2.אז האומדן להבדל ע₁ - ע₂ הוא p̂₁- p̂_2.

חלוקת הדגימה של ההבדל ביחס למדגם

בשלב הבא עלינו להשיג את הנוסחה לשולי הטעות. לשם כך נשקול תחילה את התפלגות דגימה של p̂₁. זוהי התפלגות בינומית עם הסתברות להצלחה ע₁ ו n₁ ניסויים. הממוצע של תפוצה זו הוא הפרופורציה ע₁. לסטיית התקן של סוג זה של משתנה אקראי יש שונות של ע₁(1 - ע₁)/n₁.

חלוקת הדגימה של p̂₂דומה לזה של p̂₁. כל שעליך לעשות הוא לשנות את כל המדדים מ -1 ל -2 ויש לנו התפלגות בינומית עם ממוצע של p₂ושונות של ע₂(1 - ע₂)/n₂.

כעת אנו זקוקים לכמה תוצאות מסטטיסטיקה מתמטית כדי לקבוע את חלוקת הדגימה של p̂₁- p̂₂. הממוצע של תפוצה זו הוא ע₁ - ע₂. בשל העובדה שהשונות משתלבות זו בזו, אנו רואים שהשונות של חלוקת הדגימה היא ע₁(1 - ע₁)/n₁ + ע₂(1 - ע₂)/n_2.סטיית התקן של ההתפלגות היא השורש הריבועי של נוסחה זו.

יש כמה התאמות שעלינו לבצע. הראשון הוא שהנוסחה לסטיית התקן של p̂₁- p̂₂ משתמש בפרמטרים הלא ידועים של ע₁ו ע₂. כמובן שאם באמת היינו מכירים את הערכים האלה, אז זו לא תהיה בעיה סטטיסטית מעניינת כלל. לא נצטרך להעריך את ההבדל בין ע₁ו ע_2..במקום זאת נוכל פשוט לחשב את ההבדל המדויק.

ניתן לתקן בעיה זו על ידי חישוב שגיאת תקן ולא סטיית תקן. כל שעלינו לעשות הוא להחליף את פרופורציות האוכלוסייה בפרופורציות מדגם. שגיאות סטנדרטיות מחושבות לפי נתונים סטטיסטיים במקום פרמטרים. שגיאה סטנדרטית שימושית מכיוון שהיא מעריכה למעשה סטיית תקן. משמעות הדבר עבורנו היא שאיננו צריכים עוד לדעת את ערך הפרמטרים ע₁ ו ע₂. .מכיוון שפרופורציות המדגם הללו ידועות, השגיאה הסטנדרטית ניתנת על ידי השורש הריבועי של הביטוי הבא:

p̂₁(1 - p̂₁)/n₁ + p̂₂(1 - p̂₂)/n_2.

הפריט השני שעלינו להתייחס אליו הוא הצורה המסוימת של חלוקת הדגימה שלנו. מסתבר שאנחנו יכולים להשתמש בהתפלגות רגילה בכדי להתקרב לחלוקת הדגימה של p̂₁- p̂₂. הסיבה לכך היא טכנית במקצת, אך מתוארת בפסקה הבאה.

שניהם p̂₁ו פ₂יש חלוקת דגימה שהיא בינומית. ניתן להתקרב לכל אחת מההפצות הבינומיות הללו על ידי התפלגות רגילה. כך p̂₁- p̂₂הוא משתנה אקראי. זה נוצר כשילוב לינארי של שני משתנים אקראיים. כל אחד מאלה מקורבים בהתפלגות רגילה. לכן התפלגות הדגימה של p̂₁- p̂₂מופץ בדרך כלל.

נוסחת מרווח ביטחון

כעת יש לנו את כל מה שאנחנו צריכים כדי להרכיב את מרווח הביטחון שלנו. האומדן הוא (p̂₁- p̂₂) ושולי הטעות הם z * [p̂₁(1 - p̂₁)/n₁ + p̂₂(1 - p̂₂)/n_2.]^0.5. הערך שאנחנו נכנסים אליו z * מוכתבת על ידי רמת הביטחון ג. ערכים נפוצים עבור z * הם 1.645 עבור ביטחון של 90% ו- 1.96 עבור 95% ביטחון. ערכים אלה עבור z * מציין את החלק של ההתפלגות הרגילה הרגילה היכן בדיוק ג אחוז מההתפלגות הוא בין -z * ו z *.

הנוסחה הבאה נותנת לנו מרווח ביטחון להבדל בין שני פרופורציות אוכלוסייה:

(p̂₁- p̂₂) +/- z * [p̂₁(1 - p̂₁)/n₁ + p̂₂(1 - p̂₂)/n_2.]^0.5