נניח שיש לנו א דגימה אקראית מאוכלוסייה בעלת עניין. יתכן שיש לנו מודל תיאורטי לאופן בו אוכלוסייה מופץ. עם זאת יתכנו מספר אוכלוסיות פרמטרים שאנחנו לא יודעים מהם הערכים. אומדן הסבירות המרבי הוא דרך אחת לקבוע פרמטרים לא ידועים אלה.
הרעיון הבסיסי העומד מאחורי הערכת הסבירות המרבית הוא שאנו קובעים את ערכי הפרמטרים הלא ידועים הללו. אנו עושים זאת בצורה כדי למקסם פונקציה של צפיפות הסתברות מפרקים קשורה או פונקציה מסת מסתית. נראה זאת ביתר פירוט בהמשך. לאחר מכן נחשב כמה דוגמאות להערכת הסבירות המרבית.
שלבים להערכה מרבית של הסבירות
ניתן לסכם את הדיון לעיל בשלבים הבאים:
- התחל עם מדגם של משתנים אקראיים עצמאיים X1, איקס2,... איקסn מתפוצה נפוצה שלכל אחד מהם פונקצית צפיפות ההסתברות f (x; θ1,.. .θk). התאים הם פרמטרים לא ידועים.
- מכיוון שהמדגם שלנו אינו תלוי, ההסתברות להשיג את המדגם הספציפי שאנו צופים נמצאת על ידי הכפלת ההסתברויות שלנו יחד. זה נותן לנו פונקצית סבירות L (θ1,.. .θk) = f (x1 ;θ1,.. .θk) f (x2 ;θ1,.. .θk)... f (xn ;θ1,.. .θk) = Π f (xאני ;θ1,.. .θk).
- בשלב הבא אנו משתמשים חשבון למצוא את ערכי התטא שממקסמים את תפקוד הסבירות שלנו ל.
- ליתר דיוק, אנו מבדילים את פונקציית הסבירות L ביחס ל θ אם יש פרמטר יחיד. אם ישנם מספר פרמטרים אנו מחשבים נגזרות חלקיות של L ביחס לכל אחד מפרמטרי התטא.
- כדי להמשיך בתהליך המיקסום, קבעו את הנגזרת של L (או נגזרות חלקיות) שווה לאפס ופתרו עבור תטא.
- לאחר מכן נוכל להשתמש בטכניקות אחרות (כגון מבחן נגזר שני) כדי לוודא שמצאנו מקסימום לתפקוד הסבירות שלנו.
דוגמא
נניח שיש לנו חבילה של זרעים, שלכל אחד מהם הסתברות קבועה ע של הצלחה של נביטה. אנו שותלים n מבין אלה וספור את מספר הנבטים. נניח שכל זרע נובט ללא תלות באחרים. כיצד נקבע את אומדן הסבירות המרבי של הפרמטר ע?
אנו מתחילים בלשים לב כי כל זרע מעוצב על ידי חלוקה של ברנולי בהצלחה של ע. אנחנו נתנו איקס להיות 0 או 1, ותפקוד מסת ההסתברות לזרע יחיד הוא ו( איקס; ע ) = עאיקס(1 - ע)1 - x.
המדגם שלנו מורכב n שונה איקסאני, לכל אחד מהם יש חלוקה של ברנולי. הזרעים שנובטים יש איקסאני = 1 ולזרעים שלא מצליחים לנבוט יש איקסאני = 0.
פונקציית הסבירות ניתנת על ידי:
L ( ע ) = Π עאיקסאני(1 - ע)1 - איקסאני
אנו רואים שניתן לשכתב את פונקציית הסבירות על ידי שימוש בחוקי המרחבים.
L ( ע ) = עΣ xאני(1 - ע)n - Σ xאני
בשלב הבא אנו מבדילים פונקציה זו ביחס ל ע. אנו מניחים שהערכים של כל איקסאני ידועים, ומכאן שהם קבועים. כדי להבדיל בין פונקציית הסבירות עלינו להשתמש בפונקציה כלל מוצרים יחד עם כלל הכוח:
L '( ע ) = Σ xאניע-1 + Σ xאני (1 - ע)n - Σ xאני- (n - Σ xאני ) עמ 'Σ xאני(1 - ע)n-1 - Σ xאני
אנו משכתב חלק מהמצבים השליליים ויש לנו:
L '( ע ) = (1/ע) Σ xאניעΣ xאני (1 - ע)n - Σ xאני- 1/(1 - ע) (n - Σ xאני ) עמ 'Σ xאני(1 - ע)n - Σ xאני
= [(1/ע) Σ xאני - 1/(1 - ע) (n - Σ xאני)]אניעΣ xאני (1 - ע)n - Σ xאני
כעת, בכדי להמשיך בתהליך המקסום, אנו קובעים את הנגזרת הזו שווה לאפס ונפתור עבור p:
0 = [(1/ע) Σ xאני - 1/(1 - ע) (n - Σ xאני)]אניעΣ xאני (1 - ע)n - Σ xאני
מאז ע ו 1- ע) הם לא אחרים שיש לנו את זה
0 = (1/ע) Σ xאני - 1/(1 - ע) (n - Σ xאני).
הכפלת שני צידי המשוואה על ידי ע(1- ע) נותן לנו:
0 = (1 - ע) Σ xאני - ע (n - Σ xאני).
אנו מרחיבים את הצד הימני ורואים:
0 = Σ xאני - ע Σ xאני - עn + pΣ xאני = Σ xאני - עn.
כך Σ xאני = עn ו- (1 / n) Σ xאני = p. משמעות הדבר היא שמעריך הסבירות המרבי של ע הוא מדגם ממוצע. ליתר דיוק זהו שיעור המדגמים של הזרעים שנבטו. זה תואם לחלוטין את מה שהאינטואיציה הייתה אומרת לנו. על מנת לקבוע את שיעור הזרעים שיינבטו, ראשית יש לקחת בחשבון מדגם מאוכלוסיית העניין.
שינויים בשלבים
יש כמה שינויים ברשימת השלבים שלעיל. לדוגמה, כפי שראינו לעיל, בדרך כלל כדאי להקדיש זמן להשתמש באלגברה כלשהי כדי לפשט את ביטוי פונקציית הסבירות. הסיבה לכך היא להקל על הבידול בביצוע.
שינוי נוסף ברשימת הצעדים שלמעלה הוא התחשבות בלוגריתמים טבעיים. המקסימום עבור הפונקציה L יתרחש באותה נקודה שהיא תהיה עבור הלוגריתם הטבעי של ל. לפיכך מקסום ln L שווה למקסום הפונקציה L.
פעמים רבות, בגלל נוכחותם של פונקציות מעריכיות ב- L, לקיחת הלוגריתם הטבעי של L תפשט מאוד חלק מהעבודה שלנו.
דוגמא
אנו רואים כיצד להשתמש בלוגריתם הטבעי על ידי בחינה מחדש של הדוגמה מלמעלה. אנו מתחילים בפונקציית הסבירות:
L ( ע ) = עΣ xאני(1 - ע)n - Σ xאני .
לאחר מכן אנו משתמשים בחוקי הלוגריתם שלנו ורואים כי:
R ( ע ) = ב L ( ע ) = Σ xאני ln p + (n - Σ xאניln (1 - ע).
אנו כבר רואים כי הנגזרת הרבה יותר קלה לחישוב:
ר '( ע ) = (1/ע) Σ xאני - 1/(1 - ע)(n - Σ xאני) .
כעת, כמו קודם, אנו קובעים את הנגזרת הזו שווה לאפס ומכפילים את שני הצדדים ב ע (1 - ע):
0 = (1- ע ) Σ xאני - ע(n - Σ xאני) .
אנו פותרים עבור ע ולמצוא את אותה התוצאה כמו קודם.
השימוש בלוגריתם הטבעי של L (p) מועיל בדרך אחרת. הרבה יותר קל לחשב נגזרת שנייה של R (p) כדי לוודא שבאמת יש לנו מקסימום בנקודה (1 / n) Σ xאני = p.
דוגמא
לדוגמא אחרת, נניח שיש לנו דוגמא אקראית X1, איקס2,... איקסn מאוכלוסייה שאנחנו מדגמים עם התפלגות מעריכית. פונקציית צפיפות ההסתברות למשתנה אקראי אחד היא של הצורה ו( איקס ) = θ-1ה -איקס/θ
פונקציית הסבירות ניתנת על ידי פונקצית צפיפות ההסתברות המפרקית. זהו תוצר של כמה מפונקציות צפיפות אלה:
L (θ) = Π θ-1ה -איקסאני/θ = θ-נה -Σאיקסאני/θ
שוב מועיל לקחת בחשבון את הלוגריתם הטבעי של תפקוד הסבירות. הבחנה זו תדרוש פחות עבודה מאשר הבחנה בין פונקציית הסבירות:
R (θ) = ln L (θ) = ln [θ-נה -Σאיקסאני/θ]
אנו משתמשים בחוקי הלוגריתמים שלנו ומקבלים:
R (θ) = ln L (θ) = - n ln θ + -Σאיקסאני/θ
אנו מבדילים ביחס ל θ ויש לנו:
R '(θ) = - n / θ + Σאיקסאני/θ2
קבע נגזרת זו שווה לאפס ואנחנו רואים ש:
0 = - n / θ + Σאיקסאני/θ2.
הכפל את שני הצדדים על ידי θ2 והתוצאה היא:
0 = - n θ + Σאיקסאני.
כעת השתמש באלגברה כדי לפתור עבור θ:
θ = (1 / n) Σאיקסאני.
אנו רואים מכאן שממוצע המדגם הוא זה שממקסם את פונקציית הסבירות. הפרמטר θ שמתאים למודל שלנו אמור פשוט להיות הממוצע של כל התצפיות שלנו.
חיבורים
ישנם סוגים אחרים של אומדנים. סוג הערכה חלופי אחד נקרא an אומדן חסר משוא פנים. עבור סוג זה, עלינו לחשב את הערך הצפוי של הסטטיסטיקה שלנו ולקבוע אם הוא תואם לפרמטר המקביל.