תרגום מכונה

  • תרגום מכונה (אנגלית: machine translation – mt) הוא פעולת תרגום משפה אחת לשפה אחרת המבוצעת על ידי תוכנת מחשב. התוכנה קולטת נוסח (לרוב טקסט כתוב) בשפה אחת, הנקראת שפת המקור, ופולטת תרגום של נוסח זה בשפת היעד. תרגום מכונה נקרא גם "תרגום ממוחשב", "תרגום אוטומטי", או "תרגום באמצעות מחשב".

    תרגום מכונה הוא אחד מהנושאים הראשונים שהתעניינו בהם במדעי המחשב. אף שתרגום באמצעות מכונה הוא יעד חמקמק, כיום ישנן כמה מערכות המועילות לצרכים מסוימים. הענף במדעי המחשב העוסק בתרגום מכונה ובסוגיות דומות נקרא "עיבוד שפה טבעית" (natural language processing - nlp).

    המונח תרגום מכונה מתייחס לתרגום של טקסטים שלמים, ולא של מילים בודדות. תוכנה לתרגום של מילים בודדות נקראת לעיתים מילון ממוחשב, משום שהמבנה שלה דומה למילון דו-לשוני מודפס. תרגום מילים הוא מלאכה פשוטה יחסית, ותוכנות מסחריות כמו "בבילון" ואחרות מבצעות אותה בהצלחה רבה. התוכנות מציעות בדרך כלל מספר תרגומים אפשריים לכל מילה.

    תרגום טקסטים שלמים הוא משימה קשה לאין שיעור, משום שלא די בו במציאת התרגומים האפשריים של כל מילה, אלא נדרשת הבנה של המשמעות הנכונה בהקשר. על הקושי שבביצוע משימה זו ניתן ללמוד מהסיפור (הבדיוני, כנראה) הבא:

    תוכנת תרגום התבקשה לתרגם מאנגלית לרוסית את המשפט (שמקורו בברית החדשה) the spirit is willing but the flesh is weak ("הן הרוח חפצה והבשר רפה"). כדי לבדוק את נכונות התרגום התבקשה התוכנה לתרגם את פרי עמלה חזרה מרוסית לאנגלית, והתוצאה שפלט המחשב הייתה the vodka is good but the meat is rotten (הוודקה טובה אבל הבשר רקוב).

    כיום, רוב מערכות תרגום המכונה מייצרות "תרגום גרעיני", כלומר תרגום שנותן את עיקרו של טקסט המקור, אך לבד מזה הוא אינו שמיש. על מנת להפוך את התרגום לטקסט שימושי בשפת היעד נדרשת התערבות אנושית - עריכה לפני התרגום ואחריו. אולם בתחומים שבהם אוצר המילים מוגבל ומבנה המשפטים פשוט, למשל בדיווחים מטאורולוגיים, תרגום מכונה יכול להניב תוצאות טובות.

    direct translation and transfer translation pyramid.svg
  • תרגום בסיוע מכונה
  • הקדמה
  • גישות בלשניות
  • היסטוריה של תרגום מכונה
  • שימוש בתרגום מכונה כיום
  • ראו גם
  • קישורים חיצוניים

תרגום מכונה (אנגלית: Machine Translation – MT) הוא פעולת תרגום משפה אחת לשפה אחרת המבוצעת על ידי תוכנת מחשב. התוכנה קולטת נוסח (לרוב טקסט כתוב) בשפה אחת, הנקראת שפת המקור, ופולטת תרגום של נוסח זה בשפת היעד. תרגום מכונה נקרא גם "תרגום ממוחשב", "תרגום אוטומטי", או "תרגום באמצעות מחשב".

תרגום מכונה הוא אחד מהנושאים הראשונים שהתעניינו בהם במדעי המחשב. אף שתרגום באמצעות מכונה הוא יעד חמקמק, כיום ישנן כמה מערכות המועילות לצרכים מסוימים. הענף במדעי המחשב העוסק בתרגום מכונה ובסוגיות דומות נקרא "עיבוד שפה טבעית" (Natural Language Processing - NLP).

המונח תרגום מכונה מתייחס לתרגום של טקסטים שלמים, ולא של מילים בודדות. תוכנה לתרגום של מילים בודדות נקראת לעיתים מילון ממוחשב, משום שהמבנה שלה דומה למילון דו-לשוני מודפס. תרגום מילים הוא מלאכה פשוטה יחסית, ותוכנות מסחריות כמו "בבילון" ואחרות מבצעות אותה בהצלחה רבה. התוכנות מציעות בדרך כלל מספר תרגומים אפשריים לכל מילה.

תרגום טקסטים שלמים הוא משימה קשה לאין שיעור, משום שלא די בו במציאת התרגומים האפשריים של כל מילה, אלא נדרשת הבנה של המשמעות הנכונה בהקשר. על הקושי שבביצוע משימה זו ניתן ללמוד מהסיפור (הבדיוני, כנראה) הבא:

תוכנת תרגום התבקשה לתרגם מאנגלית לרוסית את המשפט (שמקורו בברית החדשה) The spirit is willing but the flesh is weak ("הן הרוח חפצה והבשר רפה"). כדי לבדוק את נכונות התרגום התבקשה התוכנה לתרגם את פרי עמלה חזרה מרוסית לאנגלית, והתוצאה שפלט המחשב הייתה The vodka is good but the meat is rotten (הוודקה טובה אבל הבשר רקוב).

כיום, רוב מערכות תרגום המכונה מייצרות "תרגום גרעיני", כלומר תרגום שנותן את עיקרו של טקסט המקור, אך לבד מזה הוא אינו שמיש. על מנת להפוך את התרגום לטקסט שימושי בשפת היעד נדרשת התערבות אנושית - עריכה לפני התרגום ואחריו. אולם בתחומים שבהם אוצר המילים מוגבל ומבנה המשפטים פשוט, למשל בדיווחים מטאורולוגיים, תרגום מכונה יכול להניב תוצאות טובות.

Direct translation and transfer translation pyramid.svg