בתוך נתונים סטטיסטיים, המונח חזק או איתנות מתייחס לחוזק של מודל סטטיסטי, בדיקות ונהלים בהתאם לתנאים הספציפיים של הניתוח הסטטיסטי שמחקר מקווה להשיג. בהתחשב בכך שהתנאים הללו של מחקר מתקיימים, ניתן לאמת את המודלים כנכונים באמצעות הוכחות מתמטיות.
מודלים רבים מבוססים על סיטואציות אידיאליות שאינן קיימות בעבודה עם נתונים בעולם האמיתי, וכתוצאה מכך, המודל עשוי לספק תוצאות נכונות גם אם לא מתקיימים במדויק התנאים.
אם כן, נתונים סטטיסטיים חזקים הם נתונים סטטיסטיים שמניבים ביצועים טובים כאשר הנתונים נשאבים ממגוון רחב של נתונים התפלגויות הסתברות שאינן מושפעות במידה רבה על ידי מחיקים או סטיות קטנות מהנחות המודל בנתון מערך נתונים. במילים אחרות, נתון חזק הוא עמיד בפני טעויות בתוצאות.
אחת הדרכים להתבונן בהליך סטטיסטי חזק ויציב, צריך להסתכל לא יותר מאשר נהלי t, המשתמשים בבדיקות השערה כדי לקבוע את התחזיות הסטטיסטיות המדויקות ביותר.
התבוננות בנהלי T
לדוגמא של איתנות נשקול tתהליכים הכוללים את מרווח ביטחון עבור ממוצע אוכלוסייה עם סטיית תקן לא ידועה של אוכלוסייה וכן בדיקות השערה לגבי ממוצע האוכלוסייה.
השימוש של t-הנהלים מניחים את הדברים הבאים:
- מערכת הנתונים שאנו עובדים איתם היא: מדגם אקראי פשוט של האוכלוסייה.
- האוכלוסייה שממנה דגמנו מופצת בדרך כלל.
בפועל עם דוגמאות מהחיים האמיתיים, לעיתים רחוקות אוכלוסיית הסטטיסטיקה מופצת באוכלוסייה המופצת בדרך כלל, ולכן השאלה הופכת במקום "כמה חזקים שלנו t-נהלים? "
באופן כללי התנאי שיש לנו מדגם אקראי פשוט חשוב יותר מהתנאי שדגמנו מאוכלוסיה המפוזרת בדרך כלל; הסיבה לכך היא שמשפט הגבול המרכזי מבטיח חלוקת דגימה בערך רגיל - ככל שגודל המדגם שלנו גדול יותר, כך קרוב יותר להתפלגות הדגימה של המדגם רגיל.
כיצד נהלי T מתפקדים כסטטיסטיקה איתנה
אז אמינות tתהליכי צירים על גודל המדגם והפצת המדגם שלנו. השיקולים לכך כוללים:
- אם גודל הדגימות גדול, כלומר יש לנו 40 תצפיות ומעלה, אז t-נהלים יכולים לשמש אפילו עם חלוקות מוטות.
- אם גודל המדגם הוא בין 15 ל 40, אז נוכל להשתמש t-פרוצדורות לכל חלוקה מעוצבת, אלא אם כן יש מחיצות או דרגה גבוהה של שיפוט.
- אם גודל המדגם הוא פחות מ 15, אנו יכולים להשתמש t- נהלים לנתונים ללא מחיצות, שיא בודד וכמעט סימטריים.
ברוב המקרים נוצרה איתנות באמצעות עבודה טכנית בסטטיסטיקה מתמטית, וכן, למרבה המזל, איננו צריכים בהכרח לבצע את החישובים המתמטיים המתקדמים האלה כדי לעשות זאת נכון לנצל אותם; עלינו להבין רק מה ההנחיות הכוללות לחוסן של השיטה הסטטיסטית הספציפית שלנו.
נהלי ה- T מתפקדים כסטטיסטיקה חזקה מכיוון שהם בדרך כלל מניבים ביצועים טובים לכל דגמים אלה על ידי הגדרת גודל המדגם לבסיס ליישום ההליך.