ב בַּלשָׁנוּת, ביעור הוא תהליך של קביעה איזה מובן של א מִלָה נמצא בשימוש מסוים הֶקשֵׁר. ידוע גם בשם ביעור מילוני.
בבלשנות חישובית, תהליך ההבחנה הזה נקרא ביעור חוש-מילה (WSD).
דוגמאות ותצפיות
"מקרה שלנו תִקשׁוֹרֶת, בשונה שפות כאחד, מאפשר להשתמש באותה צורת מילה למשמעות של דברים שונים בעסקאות תקשורת אינדיבידואליות. התוצאה היא שצריך להבין, בעסקה מסוימת, את המשמעות המיועדת של מילה נתונה בין החושים הפוטנציאליים הקשורים לה. בזמן ש אי בהירות הנובעים מאותם אסוציאציות מרובות צורה-משמעות נמצאים ב לֵקסִיקָלִי רמה, לעתים קרובות יש לפתור אותם באמצעות הקשר גדול יותר מה- שִׂיחַ הטמעת המילה. מכאן שניתן היה להבדיל בין המובנים השונים של המילה "שירות" רק אם ניתן היה להסתכל מעבר למילה עצמה, כמו בניגוד ל"ה שירות השחקן בווימבלדון' עם 'שירות המלצר בשרתון'. תהליך זה של זיהוי משמעויות מילים בשיח הוא בדרך כלל ידוע כ חוש מילה ביעור (WSD)." (אוי קווונג, פרספקטיבות חדשות על אסטרטגיות חישוביות וקוגניטיביות לביטול חוש מילים. ספרינגר, 2013)
ביעור מילולי וביעור חוש מילים (WSD)
"לֵקסִיקָלִי ביעור בהגדרה הרחבה ביותר שלה הוא לא פחות מאשר קביעת המשמעות של כל מילה בהקשר, שנראה כתהליך לא מודע ברובו אצל אנשים. כבעיה חישובית, היא מתוארת לעתים קרובות כ'מלאה בינה מלאכותית', כלומר בעיה שפתרונה מניח פתרון להשלמה
שפה טבעית הבנה או הגיון בריא (Ide and Véronis 1998)."בתחום הבלשנות החישובית, הבעיה נקראת בדרך כלל ביטוי מובן של מילים (WSD) והיא מוגדרת כ הבעיה של קביעה חישובית איזה 'חוש' של מילה מופעל על ידי השימוש במילה במילה מסוימת הֶקשֵׁר. WSD היא בעצם משימה של סיווג: חושי מילים הם המחלקות, ההקשר מספק את ראיות, וכל הופעה של מילה מוקצית לאחת או יותר מהמחלקות האפשריות שלה בהתבסס על עֵדוּת. זהו האפיון המסורתי והנפוץ של WSD שרואה בו תהליך מפורש של ביעור ביחס למלאי קבוע של חושי מילים. מניחים למילים יש קבוצה סופית ובדידה של חושים מא מילון, בסיס ידע מילוני, או אונטולוגיה (באחרון, החושים תואמים למושגים שמילה משמיעה). ניתן להשתמש גם במלאי ספציפי לאפליקציה. לדוגמה, בהגדרת תרגום מכונה (MT), אפשר להתייחס לתרגומי מילים כאל חושי מילים, an גישה שהופכת ליותר ויותר ישימה בגלל הזמינות של רב לשוני גדול מַקְבִּיל קורפוסים שיכולים לשמש נתוני אימון. המלאי הקבוע של WSD המסורתי מפחית את מורכבות הבעיה, אך קיימים שדות חלופיים.. .." (אנקו אגרה ופיליפ אדמונדס, "מבוא". פירוש חוש מילים: אלגוריתמים ויישומים. ספרינגר, 2007)
הומונימיה וביעור
"לֵקסִיקָלִי ביעור מתאים במיוחד למקרים של הומונימיה, למשל, התרחשות של בַּס יש למפות על כל אחד מהפריטים המילוניים בס1 או בס2, בהתאם למשמעות המיועדת.
"התערבות מילונית מרמזת על בחירה קוגניטיבית והיא משימה המעכבת תהליכי הבנה. יש להבחין בינה לבין תהליכים המובילים להבדלה בין חושי המילים. המשימה הראשונה מבוצעת בצורה מהימנה למדי גם ללא מידע הקשרי רב בעוד שהאחרונה לא (ראה. Veronis 1998, 2001). כמו כן, הוכח שמילים הומוניות, הדורשות ביעור, מאטים את הגישה המילונית, בעוד שמילים פוליסמיות, המפעילות ריבוי של חושי מילים, מאיצות את הגישה המילונית (Rodd e.a. 2002).
"עם זאת, הן השינוי היצרני של ערכים סמנטיים והן הבחירה הפשוטה בין פריטים שונים מבחינה מילונית יש במשותף שהם דורשים מידע נוסף שאינו לקסיקלי." (פיטר בוש, "פרודוקטיביות, פוליסמיה, ואינדקסיקליות פרדיקטים." לוגיקה, שפה וחישוב: סימפוזיון טביליסי הבינלאומי השישי בנושא לוגיקה, שפה וחישוב, עורך מאת באלדר ד. טן קייט והנק וו. זאבת. ספרינגר, 2007)
ביעור קטגוריות לקסיקליות ועקרון הסבירות
"Corley and Crocker (2000) מציגים מודל בכיסוי רחב של קטגוריה מילוניתביעור מבוסס על ה עקרון הסבירות. באופן ספציפי, הם מציעים זאת עבור משפט המורכב ממילים w0... wנ, מעבד המשפטים מאמץ את הסבירות ביותר חלק מהדיבור סדר פעולות ט0... טנ. ליתר דיוק, המודל שלהם מנצל שתי הסתברויות פשוטות: (אני) ההסתברות המותנית של מילה wאני נתון לחלק מסוים של דיבור טאני, ו (ii) ההסתברות של טאני בהתחשב בחלק הקודם של הנאום טi-1. כאשר נתקלים בכל מילה במשפט, המערכת מקצה לה את חלקי הדיבור הזה טאני, אשר ממקסם את המכפלה של שתי ההסתברויות הללו. מודל זה מנצל את התובנה שרבים תַחבִּירִי לעמימות יש בסיס מילוני (MacDonald et al., 1994), כמו ב-(3):
(3) מחירי/ייצור המחסן זולים יותר מהשאר.
"משפטים אלה אינם חד משמעיים זמנית בין קריאה שבה מחירים אוֹ עושה האם ה פועל ראשי או חלק מא שם עצם מורכב. לאחר הכשרה על קורפוס גדול, המודל חוזה את החלק הסביר ביותר של הדיבור עבורו מחירים, תוך התחשבות נכונה בעובדה שאנשים מבינים מחיר כשם עצם אבל עושה כפועל (ראה Crocker & Corley, 2002, וההפניות המובאות בו). לא רק שהמודל מסביר מגוון של העדפות ביעור המושרשות בקטגוריה מילונית אי בהירות, זה גם מסביר מדוע, באופן כללי, אנשים מאוד מדויקים בפתרון אי בהירות כאלה." (מת'יו וו. קרוקר, "מודלים רציונליים של הבנה: טיפול בפרדוקס הביצועים." פסיכו-בלשנות של המאה העשרים ואחת: ארבע אבני פינה, עורך מאת אן קטלר. לורנס ארלבאום, 2005)