שגיאות מסוג I בסטטיסטיקה מתרחשות כאשר סטטיסטיקאים דוחים באופן שגוי את השערת האפס, או הצהרה של שום השפעה, כאשר השערת האפס נכונה בעוד שגיאות מסוג II מתרחשות כאשר הסטטיסטיקאים אינם מצליחים לדחות את ההשערה האפסית ואת ההשערה האלטרנטיבית, או האמירה שלשמה נערך הבדיקה כדי לספק ראיות לתמיכה, היא נכון.
שגיאות מסוג I ו- Type II שניהם מובנים בתהליך בדיקת ההשערה, ולמרות שזה נראה שנרצה להפוך את ההסתברות לשתי טעויות אלה כקטנות ככל האפשר, לעיתים קרובות לא ניתן להפחית את ההסתברויות לטעויות אלה, מה שמעלה את השאלה: "איזו משתי השגיאות חמורה יותר ל עשה?"
התשובה הקצרה לשאלה זו היא שהיא באמת תלויה במצב. במקרים מסוימים עדיף שגיאה מסוג I על פני שגיאה מסוג II, אך ביישומים אחרים שגיאה מסוג I מסוכנת יותר מאשר שגיאה מסוג II. על מנת להבטיח תכנון נכון של הליך הבדיקה הסטטיסטי, יש לקחת בחשבון בזהירות השלכות של שני טעויות מסוג זה כאשר הגיע הזמן להחליט אם לדחות את הביטול או לא השערה. נראה דוגמאות לשני המצבים בהמשך.
שגיאות מסוג I ו- Type II
נתחיל בזיכרון ההגדרה של שגיאה מסוג I ושגיאה מסוג II. ברוב המבחנים הסטטיסטיים, השערת אפס
היא הצהרה על הטענה הרווחת לגבי אוכלוסייה ללא השפעה מיוחדת ואילו ההשערה האלטרנטיבית היא האמירה שאנו מעוניינים לספק ראיות בשליחותנו מבחן השערה. לבדיקות בעלות משמעות קיימות ארבע תוצאות אפשריות:- אנו דוחים את השערת האפס והשערת האפס נכונה. זה מה שמכונה שגיאה מסוג I.
- אנו דוחים את השערת האפס ואת השערה אלטרנטיבית נכון. במצב זה התקבלה ההחלטה הנכונה.
- אנו לא מצליחים לדחות את השערת האפס והשערת האפס נכונה. במצב זה התקבלה ההחלטה הנכונה.
- אנו לא מצליחים לדחות את השערת האפס וההשערה האלטרנטיבית נכונה. זה מה שמכונה שגיאה מסוג II.
ברור שהתוצאה המועדפת על כל בדיקת השערה סטטיסטית תהיה השנייה או השלישית, שבה התקבלה ההחלטה הנכונה. ושום שגיאה לא התרחשה, אך לעיתים קרובות יותר, לא מתרחשת שגיאה במהלך בדיקת ההשערה - אבל זה הכל חלק מה תהליך. ובכל זאת, הידיעה כיצד לבצע הליך נכון ולהימנע מ"חיוביות שגויות "יכולה לעזור להפחית את מספר השגיאות מסוג I ו- Type II.
הבדלי ליבה של טעויות מסוג I ו- Type II
במונחים עממיים יותר אנו יכולים לתאר את שני סוגי השגיאות הללו כתואמים לתוצאות מסוימות של הליך בדיקה. לגבי שגיאה מסוג I אנו דוחים בטעות את השערת האפס - במילים אחרות, שלנו מבחן סטטיסטי מספק באופן שגוי ראיות חיוביות להשערה האלטרנטיבית. לפיכך, שגיאה מסוג I תואמת את תוצאת הבדיקה "חיובית שגויה".
מצד שני, שגיאה מסוג II מתרחשת כאשר ההשערה האלטרנטיבית נכונה ואנחנו לא שוללים את השערת האפס. באופן כזה המבחן שלנו מספק בצורה לא נכונה ראיות כנגד ההשערה האלטרנטיבית. לפיכך ניתן לחשוב על שגיאה מסוג II כתוצאת בדיקה "שלילית כוזבת".
בעיקרו של דבר, שתי השגיאות הללו הן היפוכות זו מזו, וזו הסיבה שהם מכסות את מכלול השגיאות שנעשו ב- בדיקות סטטיסטיות, אך הן שונות זו מזו בהשפעתן אם השגיאה מסוג I או סוג II נותרה בלתי מגלה או לא פתור.
איזו שגיאה עדיפה
על ידי חשיבה במונחים של תוצאות חיוביות שגויות ושקריות שליליות, אנו מצוידים טוב יותר לשקול איזו מהטעויות הללו טובות יותר - נראה כי לסוג II יש קונוטציה שלילית, מסיבה טובה.
נניח שאתה מעצב סינון רפואי למחלה. חיובית שגויה של שגיאה מסוג I עשויה לגרום למטופל חרדה מסוימת, אך הדבר יוביל להליכי בדיקה אחרים אשר יגלו בסופו של דבר שהבדיקה הראשונית הייתה שגויה. לעומת זאת, שלילית כוזבת עקב שגיאה מסוג II תעניק למטופל את הביטחון הלא נכון כי אין לו מחלה כאשר הוא או היא אכן חולים. כתוצאה ממידע שגוי זה, המחלה לא תטופל. אם רופאים היו יכולים לבחור בין שתי האפשרויות הללו, חיובית שגויה רצויה יותר משלילית שקרית.
עכשיו נניח שמישהו הועמד לדין בגין רצח. ההשערה האפסית כאן היא שהאדם אינו אשם. שגיאה מסוג 1 תתרחש אם האדם יימצא אשם ברצח שהוא לא היא ביצעה, וזו תהיה תוצאה חמורה ביותר עבור הנאשם. מצד שני, תתרחש שגיאה מסוג II אם המושבעים ימצאו את האדם לא אשם למרות שהוא או שהיא ביצעה את הרצח, וזו תוצאה נהדרת עבור הנאשם אך לא עבור החברה בתור שלם. כאן אנו רואים את הערך במערכת שיפוט המבקשת למזער טעויות מסוג I.