אי השוויון של צ'בישב אומר שלפחות 1-1 /ק2 נתונים מדגם חייבים ליפול ק סטיות תקן מהממוצע (כאן ק הוא חיובי מספר ממשי גדול מאחד).
כל מערך נתונים שמופץ בדרך כלל, או בצורת א עקומת פעמון, כולל מספר תכונות. אחד מהם עוסק בהתפשטות הנתונים ביחס למספר סטיות התקן מהממוצע. בהתפלגות רגילה אנו יודעים ש 68% מהנתונים הם סטיית תקן אחת מהממוצע, 95% הם שניים סטיות תקן מהממוצע, וכ 99% - הן בתוך שלוש סטיות תקן מהממוצע.
אבל אם מערך הנתונים לא מופץ בצורת עקומת פעמון, אז סכום אחר יכול להיות בתוך סטיית תקן אחת. אי השוויון של צ'בישב מספק דרך לדעת לאיזה חלק של נתונים נופלים ק סטיות תקן מה הממוצע עבור כל מערך נתונים.
עובדות על אי השוויון
אנו יכולים גם לציין את אי השוויון לעיל על ידי החלפת הביטוי "נתונים מדגם" ב- חלוקת הסתברויות. הסיבה לכך היא חוסר השוויון של צ'בישב הוא תוצאה של הסתברות, שאפשר ליישם אז על נתונים סטטיסטיים.
חשוב לציין כי אי השוויון הזה הוא תוצאה שהוכחה באופן מתמטי. זה לא כמו מערכת יחסים אמפירית בין הממוצע למצב, או כלל אצבע המחבר בין הטווח וסטיית התקן.
איור האי-שוויון
כדי להמחיש את אי השוויון, נסתכל על זה כמה ערכים של ק:
- ל ק = 2 יש לנו 1 - 1 /ק2 = 1 - 1/4 = 3/4 = 75%. לכן אי השוויון של צ'בישייב אומר שלפחות 75% מערכי הנתונים של כל חלוקה חייבים להיות בשתי סטיות תקן מה הממוצע.
- ל ק = 3 יש לנו 1 - 1 /ק2 = 1 - 1/9 = 8/9 = 89%. לכן אי השוויון של צ'בישב אומר שלפחות 89% מערכי הנתונים של כל חלוקה חייבים להיות בתוך שלוש סטיות תקן מה הממוצע.
- ל ק = 4 יש לנו 1 - 1 /ק2 = 1 - 1/16 = 15/16 = 93.75%. לכן אי השוויון של צ'בישב אומר שלפחות 93.75% מערכי הנתונים של כל חלוקה חייבים להיות בשתי סטיות תקן מה הממוצע.
דוגמא
נניח שדגמנו את משקולותיהם של כלבים במקלט לחיות המקומי וגילינו שלמדגם שלנו יש ממוצע של 20 פאונד עם סטיית תקן של 3 פאונד. בשימוש באי-השוויון של צ'בישב, אנו יודעים שלפחות 75% מכלבים שדגמנו יש משקולות שהם שתי סטיות תקן מהממוצע. פעמיים סטיית התקן נותנת לנו 2 x 3 = 6. הפח והוסף את זה מממוצע 20. זה אומר לנו כי 75% מהכלבים משקלם בין 14 פאונד ל -26 פאונד.
שימוש בחוסר השוויון
אם אנו יודעים יותר על ההפצה שאנו עובדים איתה, בדרך כלל אנו יכולים להבטיח שיותר נתונים הם מספר מסוים של סטיות תקן הרחק מהממוצע. לדוגמא, אם אנו יודעים שיש לנו התפלגות רגילה, 95% מהנתונים הם שתי סטיות תקן מהממוצע. אי השוויון של צ'בישב אומר שבמצב זה אנו יודעים זאת לפחות 75% מהנתונים הם שתי סטיות תקן מהממוצע. כפי שאנו רואים במקרה זה, זה יכול להיות הרבה יותר מ- 75% זה.
הערך של אי השוויון הוא בכך שהוא נותן לנו תרחיש "גרוע יותר" בו הדברים היחידים שאנחנו יודעים על נתוני המדגם שלנו (או חלוקת ההסתברות) הם הממוצע וה סטיית תקן. כאשר איננו יודעים דבר נוסף על הנתונים שלנו, אי השוויון של צ'בישב מספק תובנה נוספת לגבי מידת התפוצה של מערך הנתונים.
תולדות אי השוויון
אי השוויון נקרא על שמו של המתמטיקאי הרוסי פפנוטי צ'ייבשוב, שהצהיר לראשונה על אי השוויון ללא הוכחות בשנת 1874. עשר שנים אחר כך הוכח אי-השוויון על ידי מרקוב בתואר ד. עבודת גמר. בגלל השונות כיצד לייצג את האלף-בית הרוסי באנגלית, זהו צ'יבישב המואר גם בשם צ'בישף.