בהינתן א רצף נתונים, שאלה אחת שאנחנו עשויים לתהות היא אם הרצף התרחש על ידי תופעות מקריות, או אם הנתונים אינם אקראיים. קשה לזהות את האקראיות, שכן קשה מאוד פשוט להסתכל בנתונים ולקבוע אם הם הופקו במקרה בלבד. שיטה אחת שניתן להשתמש בה כדי לעזור לקבוע אם רצף התרחש באמת במקרה נקראת מבחן הריצות.
מבחן הריצות הוא מבחן בעל משמעות או מבחן השערה. ההליך לבדיקה זו מבוסס על ריצה, או רצף, של נתונים שיש להם תכונה מסוימת. כדי להבין כיצד עובד מבחן הריצות, עלינו לבחון תחילה את מושג הריצה.
רצפי נתונים
נתחיל בבחינת דוגמא לריצות. שקול את הרצף הבא של ספרות אקראיות:
6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5
אחת הדרכים לסווג את הספרות הללו היא לפצל אותן לשתי קטגוריות, גם אם (כולל הספרות 0, 2, 4, 6 ו 8) או משונות (כולל הספרות 1, 3, 5, 7 ו 9). אנו מסתכלים על רצף הספרות האקראיות ונציין את המספרים השווים כמספרים E ומספרים אי-זוגיים כ- O:
E E O O E E O O E O E E E E E E O O E E O O
קל יותר לראות את הריצות אם אנו משכתב את זה כך שכל האוסים יחד וכולם הם יחד:
EE O EE OO E O EEEEE O EE OO
אנו סופרים את מספר הבלוקים של מספרים אחידים או אי-זוגיים ורואים שיש בסך הכל עשר ריצות עבור הנתונים. ארבע ריצות באורך אחת, חמש באורך שתיים ואחת יש אורך חמש
תנאים
עם כל מבחן משמעות, חשוב לדעת אילו תנאים נחוצים לביצוע הבדיקה. למבחן הריצות נוכל לסווג כל ערך נתונים מהמדגם לאחת משתי קטגוריות. אנו נספור את מספר הריצות הכולל ביחס למספר ערכי הנתונים הנכללים בכל קטגוריה.
המבחן יהיה א מבחן דו צדדי. הסיבה לכך היא שמעט מדי ריצות פירושו כי ככל הנראה אין מספיק וריאציה ומספר הריצות שיופיעו מתהליך אקראי. יותר מדי ריצות ייווצרו כאשר תהליך מתחלף בין הקטגוריות בתדירות גבוהה מדי מכדי שתיאר אותו במקרה.
השערות וערכי P
לכל מבחן בעל משמעות יש א null והשערה חלופית. למבחן הריצות ההשערה האפסית היא שהרצף הוא רצף אקראי. ההשערה האלטרנטיבית היא שרצף נתוני הדגימה אינו אקראי.
תוכנה סטטיסטית יכולה לחשב את ערך p שתואם נתון מבחן מסוים. ישנם גם טבלאות הנותנות מספרים קריטיים בנקודה מסוימת רמת המשמעות למספר הכולל של הריצות.
פועל דוגמא לבדיקה
נעבור בדוגמה הבאה בכדי לראות כיצד מבחן הריצות עובד. נניח שבמשימה, התלמיד מתבקש להעיף מטבע 16 פעמים ולשים לב לסדר הראשים והזנבות שהופיע. אם נסיים עם מערך הנתונים הזה:
H T H H H T T H T T T H T H T H H
אנו עשויים לשאול אם התלמיד אכן עשה את שיעורי הבית שלו, או שהוא רימה ורשם סדרה של H ו- T שנראים אקראיים? מבחן הריצות יכול לעזור לנו. ההנחות מתקיימות למבחן הריצות שכן ניתן לסווג את הנתונים לשתי קבוצות, כראש או זנב. אנו ממשיכים לספור את מספר הריצות. התארגנות מחדש אנו רואים את הדברים הבאים:
H T HHH TT H TT H T H T HH
יש עשר ריצות לנתונים שלנו עם שבעה זנבות הם תשעה ראשים.
השערת האפס היא שהנתונים הם אקראיים. האלטרנטיבה היא שזה לא אקראי. לגבי רמת משמעות של אלפא השווה ל- 0.05, אנו רואים על ידי התייחסות לטבלה הנכונה כי אנו דוחים את השערת האפס כאשר מספר הריצות הוא פחות מ -4 או יותר מ -16. מכיוון שיש עשר ריצות בנתונים שלנו, אנחנו לא לדחות השערת האפס H0.
קירוב רגיל
מבחן הריצות הוא כלי שימושי כדי לקבוע אם רצף עשוי להיות אקראי או לא. עבור מערך נתונים גדול ניתן לפעמים להשתמש בקירוב רגיל. קירוב רגיל זה מחייב אותנו להשתמש במספר האלמנטים בכל קטגוריה ואז לחשב את הממוצע וסטיית התקן של המתאים התפלגות רגילה.