טכנולוגיות תרגום - הרבה, הרבה יותר ממה שחשבת

שוק התרגומים הוא בין השווקים הטכנולוגיים ביותר. 

לא ניתן היה לקיים מערכת עסקית כה דינמית וחוצת מדינות וגבולות ללא טכנולוגיות מתקדמות כמו שהתעשייה הזו מאמצת בזרועות פתוחות.

למרות זאת, התפיסה הרווחת היא כי תרגום ניתן לבצע על בסיס מסמכי Office או PDF, במקרה הטוב.

אז בואו נבחן את הטכנולוגיות המובילות ואלו שגם יובילו את התעשייה בשנים הקרובות.

בסופו של דבר, על מנת לתרגם צריך תכנים. 

לא משנה אם אלו תכנים לאתר אינטרנט, אפליקציית מובייל, תוכנה חוזה משפטי או מסמך רפואי.

מישהו אי-שם בעולם צריך לקבל ממך את הטקסטים הנדרשים לתרגום לכל שפה שהיא.

מכיוון שאין מספר רשמי לגבי מספר המילים המתורגמות מדי יום בעולם, אפשר להעריך בצורה מאוד זהירה כי מדי יום מתורגמים מעל 10 מליון מילים.

10 מליון מילים אשר צריכות להיות "משונעות" בין מדינות, בין יבשות ובין אזורי זמן וצריכות להיות מוכנות לאחר תרגום לאחר X ימים ואף שעות בודדות.

 

לכן, בין הטכנולוגיות החשובות ביותר הקיימות בשוק התרגומים הנן טכנולוגיות ניהול פרויקטים. תוכנת דוא"ל ו/או Excel ממש לא מספיק על מנת לאפשר ניהול כה דינמי של פרויקטים, כאשר בחלק מהמקרים לא מדובר על תרגום של שפה אחת. לעיתים קרובות, מדובר על מסמך או קובץ בודד אשר צריך להיות מתורגם למספר שפות, לעיתים יותר מ-20 בעת ובעונה אחת.

אך זו רק ההתחלה.

הקונוטציה הראשונה שעולה במוחם של רבים כאשר הם שומעים את צירוף המילים טכנולוגיה ותרגום היא טכנולוגיית התרגום האוטומטי, כאשר המפורסמת מביניהן היא Google Translate.

טכנולוגיות (MT (Machine Translation הן בהחלט טכנולוגיות שמאתגרות את שוק השפה, אך הן כבר לא חוד החנית. גם בגלל השם הרע שיצא להן אבל בעיקר כי הן לא תמיד נוחות לשימוש, כאשר מדובר למשל על טקסטים שאינם רציפים ושמכילים משתני מערכת כמו טקסט של תוכנה. (אך הרשו לנו להפתיע אתכם במעט. רק עוד כמה פסקאות בנוגע לכך. Hold your breath.)

לכן, בארבע השנים האחרונות מתפתחת לה בקצב מדהים טכנולוגיית התרגום מבוססת AI.

הכירו את טכנולוגיות ה-AI

מדי יום, Facebook מבצעת 4.5 מיליארד תרגומים.

אם יש לכם אנשי קשר ממדינות שונות, אשר מעלים פוסטים בשפות שאינכם מבינים, יש לכם אפשרות ללחוץ על See Translation והופ…יש תרגום.

המכניזם שמפעיל את האופציה הזו הנו מנוע מבוסס AI, אשר לא משתמש בטכנולוגיית ה-MT, אלא במנועים עוצמתיים יותר, אשר יודעים לפענח גם הקשרים, סלנג ופרמטרים לשוניים רבים נוספים.

הסתכלו בדוגמה פה מצד שמאל, בתמונה המכילה שני פוסטים שתורגמו מטורקית לאנגלית. הפוסט הראשון הוא תרגום מבוסס MT במודל ישן. השני מבוסס AI.

הבדל עצום!

זוהי רק דוגמה ליכולת של מנועי תרגום לבצע למידה עצמית ולתכנת את עצמם ועל ידי כך להסיק מסקנות מתוך מאגרי תרגום עצומים בגודלם ולנסח משפטים בשפות שונות מתוך תובנות מתוכנתות שיהיו מאוד דומים למבנה המשפט התקין בו אנשים משתמשים ובהתאם להקשר בו משפט או קובץ שלם כתוב, גם כאשר מדובר על שיחה או נאום. יכולת העיבוד של מנועי תרגום AI היא בהחלט מרשימה ומשאירה הרבה פיות פעורים מתדהמה.

כל עוד הנתונים הראשוניים המתוכנתים לתוך אותו מנוע הם נתונים נכונים.

 

למרות ההתקדמות הרבה במודל תרגום AI, יישומי המודל כרגע נמצאים מאחורי הקלעים, ביכולת לבצע אוטומציה בניהול הפרויקט עצמו בין חברת התרגום לבין הספקים השונים שלה, על מנת לאפשר ניהול פרויקט מהיר יותר, קל יותר כך שגם העלויות התפעוליות יוכלו לרדת ולאפשר שירות טוב יותר.

אנחנו ב-BlueLion משתמשים למשל בפלטפורמת Protemos המאפשרת אוטומציה שכזו ולקוחותינו נהנים מרמת שירות טובה ומהירה יותר.

כנראה שעוד רחוק היום שתרגום מבוסס AI יחליף את המתרגם המקצועי ועד שחברות יסכימו כי החוזים החשובים שלהן או האתרים שלהן שאמורים להציג את מלוא תפארת השירות והמוצר יתורגמו ללא מגע יד אדם, אשר למרות הכל מאפשר תרגום מדויק יותר בניואנסים דקים יותר אשר מותאמות לקהלי יעד מקומיים. עד אז, התעשייה תמשיך להתבסס על כלי התרגום (CAT) הותיקים והאמינים.

כלי CAT

כלי (CAT (Cumputer Assisted Translation הנם משפחה שלמה של כלים טכנולוגיים אשר נועדו להיות לעזר עבור המתרגם המקצועי ולא להחליפו.

כלים אלו מאפשרים ניהול מקצועי של כל תרגום לכל פלטפורמה, יודעות לקבל קבצים טקטסטואליים ממגוון רחב של תבניות, החל מ-Office ועד לקובצי תוכנה, web ועוד.

והנה עצה ראשונה: אל תגבילו את עצמכם לקובצי Office בלבד. היו פתוחים לעבודה עם כל קובץ שתרצו – xml, txt, json, Properties, xliff ועוד.

אותם כלים מאפשרים ניהול מסד נתוני שפה, כך שבכל נקודת זמן חברת התרגום שלכם אמורה לדעת מה כבר תירגמתם ומה התווסף ויכולה לתמחר את הפרויקט שלכם בצורה שכזו, שהנה הרבה יותר אפקטיבית מתמחור מבוסס עלות המתרגם. תמחור חכם שכזה יאפשר לכם להנות מכל העולמות: חברת התרגום תבחר את המתרגם המתאים ביותר למשימה ואתם תשלמו עבור הטקסטים החדשים בלבד.

בנוסף לכך, יש פונקציות עשירות נוספות שמאפשרות ניהול פרויקט חכם, כגון סינון הקודים והמשתנים על פי פרמטרים מסוימים לבין הטקסט הנדרש לתרגום, צירוף של מילון מונחים לכל פרויקט, יצירת פילטרים לתרגום אוטומטי של מספרים בהתאם למדינת היעד כך שלא רק שהמספרים יופיעו במדויק – הם יופיעו בהתאם לתצורה המקובלת במדינת היעד (מפרידי אלפים, מפרידים עשרוניים, תצורת תאריך ועוד).

יש עוד עשרות פונקציות שכאלו וקצרה היריעה מלהרחיב על כולם.

אנחנו ב-BlueLion גאים לעבוד עם memoQ, אותו הטמענו לעבודה עוד לפני שהיה לנו אתר, כי הבנו שכלי שכזה יאפשר לתת לנו שירות מתקדם ואיכותי יותר עבור קהל לקוחותינו.

והנה ההבטחה – בהרבה מאוד מכלי ה-CAT מוטמעים טכנולוגיות AI, כך שניתן לקבל את הטוב מכל העולמות. תרגום מקצועי מבוסס מתרגמים מקצועים אשר יכולים לקבל תובנות והחלטות טובות יותר לגבי התרגום באמצעות מנועי AI המוטמעים בתוך כלי ה-CAT.

אז אחרי שראינו כי יש כל כך הרבה טכנולוגיות בתעשיית השפה, אל תסתפקו במועט.

אל תתפשרו על מה שאתם יכולים לקבל. דרשו מחברת התרגום איתה אתם עובדים שתתאים את עצמה אליכם, על מנת שלכם יהיה יותר קל לקבל את התכנים המתורגמים ולעשות איתם את מה שאתם צריכים לקבל.

יש לכם תוכנה? ייצאו קובצי תוכנה אורגניים, הכוללים את הקודים הרלוונטיים לכם כך שהטקסטים המתורגמים יוכלו לשלב את המשתנים השונים ולאפשר חווית משתמש טובה יותר בתוכנה.

יש לכם אתר אינטרנט? ייצאו קובצי web אורגניים מהאתר, כך שהאתר יוכל לייבא חזרה את הטקסטים בצורה טובה יותר ולחסוך מעל 95% מהבאגים העלולים לצוץ כאשר עובדים עם Word או קישורים בלבד.

יש לכם חומרים שיווקים? עבדו על בסיס InDesign או Illustrator. אין צורך להעתיק ל-Word. חבל על הזמן שלכם.

בכל מקרה, דעו כי האפשרויות רבות וכי בתעשיית השפה הכה מרתקת והכה סוערת ניתן לעבוד בצורה מקצועית על בסיס טכנולוגיות תומכות. כאלו שיאפשרו לכם לבנות גשר ביניכם לבין קהל היעד שלכם.

דברו איתנו