װען דער איבערזעצער איז אַ מאַשין

When Translators Aren't Human

Yehuda Blum

פֿון איציק בלימאַן

Published January 18, 2017, issue of January 27, 2017.

אין סעפּטעמבער 2016 האָט די גרױסע טעכנאָלאָגיע־פֿירמע „גוגל“ געמאָלדן, אַז מע האָט איבערגעבױט די אױטאָמאַטישע איבערזעץ־סיסטעם פֿון נײַן װעלטשפּראַכן. די פֿריִערדיקע טעכנאָלאָגיע האָט געפּרוּװט איבערצוזעצן דעם מקור־טעקסט פֿראַזעסװײַז, און די איבערזעצונג איז אין די מערסטע פֿאַלן געװען גאָר שװער צו לײענען. די נײַע טעכנאָלאָגיע, װאָס איז באַזירט אױף אַן אַװאַנסירטן מאַטעמאַטישן מאָדעל (דעם אַזױ גערופֿענעם „נערװננעץ־אַנאַליז“, אױף ענגליש: neural network analysis) שטעלט זיך פֿאַר אַ ציל איבערצוזעצן דעם מקור־טעקסט זאַצנװײַז. די איבערזעצונגען זענען טאַקע אַ סך פֿאַרלאָזלעכער און לײַכטער צו פֿאַרשטײן װי פֿריִער. (צום באַדױערן האָט מען נאָך נישט באַנײַט די טעכנאָלאָגיע, װאָס שטעלט צונױף די ייִדישע איבערזעצונגען.)

די הילע פֿון „דער עקאָנאָמיסט“ מיט אַ באַריכט װעגן נײַע שפּראַכיקע טעכנאָלאָגיעס
די הילע פֿון „דער עקאָנאָמיסט“ מיט אַ באַריכט װעגן נײַע שפּראַכיקע טעכנאָלאָגיעס

די נײַע טעכנאָלאָגיע שטעלט מיט זיך פֿאָר אַ רעװאָלוציע אױפֿן געביט פֿון „מאַשין־איבערזעצונג“. דאָס האָט געצױגן דעם אױפֿמערק נישט נאָר פֿון ספּעציאַליסטן אין קאָמפּיוטער־װיסנשאַפֿט און לינגװיסטיק. דעם 7טן יאַנואַר איז אַרױס אין דעם ענגלישן זשורנאַל „עקאָנאָמיסט“ אַ לאַנגער באַריכט אין גאַנצן אָפּגעגעבן די נײַע אַנטװיקלונגען אין שפּראַכיקע טעכנאָלאָגיעס. ספּעציעל אינטערעסאַנט איז די געשיכטע פֿון די „סמאַרטפֿאָנס“ און די „פּערזענלעכע אַסיסטענטן“ („סירי“ פֿון עפּל, „אַלעקסאַ“ פֿון אַמאַזאָן אאַז״װ): הײַנט צו טאָג רעדט מען נישט נאָר דורך דעם טעלעפֿאָן, נאָר דװקא מיט דעם טעלעפֿאָן, אַזױ װי ער װאָלט געװען אַ לעבעדיקער מיטשמועסער. און יעדן טאָג װערן די שמועסן אַלץ גרינגער און נאַטירלעכער.

װי גוט קענען װערן די קאָמפּיוטער־איבערזעצערס? דער קלאַסישער ענטפֿער איז, „אַזױ גוט װי די מענטשלעכע איבערזעצערס“, אָבער נישט בעסער פֿון זײ. פֿאַר װאָס נישט בעסער? װײַל די „קינסטלעכע אינטעליגענץ“ פֿון אַ קאָמפּיוטער איז באַזירט אױף אַ טרעניר־קאָרפּוס (ד”ה, אַ גרױסע צאָל שױן איבערגעזעצטע זאַצן צװישן פּאָרלעך שפּראַכן, הין און צוריק) װאָס לעבעדיקע מענטשן האָבן אַלײן צונױפֿגעשטעלט. װען דער קאָמפּיוטער װאָלט געקענט איבערזעצן „בעסער“ װי לעבעדיקע מענטשן װאָלטן מיר, אין פּרינציפּ, נישט באַמערקט קײן חילוק.

נישט קוקנדיק אױף די גװאַלדיקע פֿאַרבעסערונגען זענען מיר נאָך װײַט פֿון דעם ציל. געבױרענע ענגליש־רעדערס קענען באַלד דערקענען װען אַ דאָקומענט איז איבערגעזעצט געװאָרן פֿון אַן אױטאָמאַטישן קאָמפּיוטער־איבערזעצער — שױן אָפּגערעדט אַ ליטעראַרישער טעקסט (למשל, אַ ליד) װאָס פֿאָדערט די ספּעציעלע פֿעיִקײטן פֿון אַ פּראָפֿעסיאָנאַל. די קװאַליטעט פֿון די איבערזעצונגען אױף „קלענערע“ שפּראַכן (ייִדיש בתוכם) איז נאָך גאַנץ שלעכט. אין פֿאַרגלײַך מיט ענגליש אָדער שפּאַניש אָדער דײַטש זענען פֿאַראַן זײער װײניק ייִדישע װעבזײַטלעך, און דערפֿאַר קענען די מאַטעמאַטישע „נערװננעץ“־מאָדעלן נישט פֿונקציאָנירן װי געהעריק. כּדי צו שאַפֿן גוטע איבערזעץ־מיטלען אױף ייִדיש דאַרף מען אױסניצן אַן אַנדער מעטאָד, װאָס נעמט אַרײַן די גראַמאַטישע כּללים פֿון דער שפּראַך. און דאָס פֿאָדערט, פֿאַרשטײט זיך, אַ מאַנשאַפֿט ייִדישע לינגװיסטן װאָס זאָלן מיטאַרבעטן מיט גוגלס אינזשענירן.

אין מײַן קומעדיקן אַרטיקל װעל איך באַהאַנדלען אַן אַנדער פּראָבלעם פֿון דער קאָמפּיוטער־לינגװיסטיק: די אױטאָמאַטישע טראַנסקריפּציע פֿון נאַטירלעכע רײד. װי אַזױ קען אַ מאַשין פֿאַרשטײן אַז װען מע רעדט אַרױס דעם זאַץ „איכװילעסנשאָקאָלאַד“ (ד”ה, אַ סעריע קלאַנגען, אָן קײן שום פּױזעס) זענען דאָ פֿיר װערטער, נישט מער און נישט װײניקער? צי קען מען ניצן „סירי“ (עפּלס קאָמפּיוטער־אַסיסטענט) אַז מע רעדט מיט אַ פֿרעמדן אַקצענט? איך װעל בלי־נדר ענטפֿערן אױף די פֿראַגעס, און אַז אַ נײַע טעכנאָלאָגיע קומט אױף ביז מײַן אַרטיקל דאַרף אַרױסקומען, װעל איך זיך אָפּגעבן דערמיט אױך.