ה מדגם סטיית תקן הוא נתון תיאורי המודד את התפשטות מערך נתונים כמותי. מספר זה יכול להיות כל מספר אמיתי שאינו שלילי. מכיוון שאפס הוא לא שלילי מספר ממשינראה כי כדאי לשאול, "מתי תהיה סטיית התקן של המדגם שווה לאפס?" זה מתרחש במקרה המיוחד והכי יוצא דופן כאשר כל ערכי הנתונים שלנו זהים לחלוטין. נחקור את הסיבות לכך.
תיאור סטיית התקן
שתי שאלות חשובות שאנו בדרך כלל רוצים לענות על מערך נתונים כוללות:
- מהו מרכז מערך הנתונים?
- עד כמה מערכת הנתונים מורחבת?
ישנן מדידות שונות, המכונות סטטיסטיקה תיאורית העונה על שאלות אלה. לדוגמה, מרכז הנתונים, הידוע גם בשם ממוצע, ניתן לתאר במונחים של הממוצע, החציון או המצב. ניתן להשתמש בסטטיסטיקות אחרות, שהן פחות ידועות, כגון אמצע או השלישייה.
להפצת הנתונים שלנו נוכל להשתמש בטווח, ה- טווח בין רבעוני או סטיית התקן. סטיית התקן משויכת לממוצע לכמת את התפשטות הנתונים שלנו. לאחר מכן נוכל להשתמש במספר זה כדי להשוות מערכות נתונים מרובות. ככל שסטיית התקן שלנו גדולה יותר אז ההתפשטות גדולה יותר.
אינטואיציה
אז בואו נשקול מהתיאור הזה מה המשמעות של סטיית תקן של אפס. זה מצביע על כך שלא קיים פיזור כלל במערך הנתונים שלנו. כל ערכי הנתונים האינדיבידואליים יתכווצו זה לזה בערך יחיד. מכיוון שיהיה רק ערך אחד שיכול להיות לנתונים שלנו, ערך זה יהווה את הממוצע של המדגם שלנו.
במצב זה, כאשר כל ערכי הנתונים שלנו זהים, לא תהיה שום שונות. באופן אינטואיטיבי הגיוני כי סטיית התקן של מערך נתונים כזה תהיה אפס.
הוכחה מתמטית
סטיית התקן לדוגמה מוגדרת על ידי נוסחה. לכן כל אמירה כמו זו שצריכה לעיל צריכה להוכיח באמצעות נוסחה זו. נפתח במערך נתונים שמתאים לתיאור שלמעלה: כל הערכים זהים, וישנם n ערכים שווים ל איקס.
אנו מחשבים את הממוצע של מערך נתונים זה ורואים שהוא כך
איקס = (איקס + איקס +... + איקס)/n = nx/n = איקס.
כעת כאשר אנו מחשבים את הסטיות האינדיבידואליות מהממוצע, אנו רואים שכל הסטיות הללו הן אפס. כתוצאה מכך גם השונות וגם סטיית התקן שוות לאפס.
הכרחי ומספיק
אנו רואים שאם מערך הנתונים אינו מציג שום שונות, סטיית התקן שלה היא אפס. אנו עשויים לשאול אם לשוחח אמירה זו נכונה גם. כדי לראות אם כן, אנו נשתמש שוב בנוסחה לסטיית תקן. אולם הפעם נקבע את סטיית התקן השווה לאפס. לא נקבל הנחות לגבי מערך הנתונים שלנו, אך נראה איזו הגדרה s = 0 מרמז
נניח שסטיית התקן של מערך נתונים שווה לאפס. פירוש הדבר הוא ששונות המדגם s2 שווה גם לאפס. התוצאה היא המשוואה:
0 = (1/(n - 1)) ∑ (איקסאני - איקס )2
אנו מכפילים את שני צידי המשוואה ב n - 1 וראה כי סכום הסטיות בריבוע שווה לאפס. מכיוון שאנו עובדים עם מספרים אמיתיים, הדרך היחידה להתרחש היא שכל אחת מהסטיות בריבוע תהיה שווה לאפס. המשמעות היא שלכל אחד אני, התנאי (איקסאני - איקס )2 = 0.
אנו לוקחים כעת את השורש הריבועי של המשוואה הנ"ל ורואים שכל סטייה מהממוצע חייבת להיות שווה לאפס. שכן לכולם אני,
איקסאני - איקס = 0
המשמעות היא שכל ערך נתונים שווה לממוצע. תוצאה זו יחד עם זו שלמעלה מאפשרת לנו לומר שסטיית התקן לדוגמה של מערך נתונים היא אפס אם ורק אם כל הערכים שלה זהים.