איר ווילט זיך גוט אָנלאַכן? ניצט „גוגל־טרענסלייט‟ פֿאַר ייִדיש

The Laughable Results Of Google Translate For Yiddish


פֿון יואל מאַטוועיעוו

Published March 06, 2018.

שײַכותדיקע אַרטיקלען: https://yiddish2.forward.com/node/2776.html;
//yiddish.forward.com/articles/179393/dr-eliza-eugene-goostman-s-real-name/?p=all

מיט עטלעכע יאָר צוריק האָב איך געשריבן אין אַן אַרטיקל אינעם „פֿאָרווערטס‟, אַז ווען מע זוכט אויף ייִדיש אין דער אינטערנעץ אומשולדיקע פֿראַזעס מיטן וואָרט „מיידלעך‟, באַווײַזן זיך אויבן־אָן פּאָרנאָגראַפֿישע וועבזײַטן, רעקלאַמעס פֿון קאַנאַדער זונות וכּדומה. אין יענער צײַט, פֿלעגט די זוך־מאַשין אויטאָמאַטיש איבערזעצן די געזוכטע ווערטער אויף ענגליש און אַרויפֿברענגען די שײַכותדיקע וועבזײַטן. אין אַ ווײַל אַרום, האָט דער „גוגל‟ פֿאַרראָכטן די דאָזיקע פּראָבלעם, וועלכע האָט אויך פֿאַרפּלאָנטערט די אינטערנעץ־סטאַטיסטיק.

די זוך־סיסטעם האָט זיך דעמאָלט באַנוצט מיט דער קלאַסישער טעכנאָלאָגיע, באַגרינדעט אויפֿן סטאַטיסטישן אַנאַליז פֿון איבערגעזעצטע טעקסטן. אויב אַ געוויס וואָרט איז געווען בנימצא אין דער אינפֿאָרמאַציע־באַזע, האָט די סיסטעם עס איבערגעזעצט, און אויב נישט — איבערגעלאָזט ווי עס איז אָדער טראַנסליטערירט אות נאָך אות. ווי אַ רעזולטאַט, האָט דער סינטאַקס פֿון דער איבערזעצונג אויסגעזען מאָדנע און אומנאַטירלעך. נישט געקוקט אויף פֿאַרשיידענע אויסטערלישע פֿאַלן, איז עס פֿאָרט געווען מער אָדער ווייניקער פֿאַרשטענדלעך.

אינעם יאָר 2016 האָט דער „גוגל‟ אײַנגעפֿירט אַ נײַע טעכנאָלאָגיע, באַגרינדעט אויף אַ גרויס־מאַסשטאַביקער קינסטלעכער נייראָן־נעץ. אַנשטאָט איבערצולאָזן אומבאַקאַנטע ווערטער, שטרעבט די מאַשין אָפּצוטרעפֿן, וואָס דער מחבר האָט געמיינט, און צו קאָנסטרויִרן אַ פֿאַרשטענדלעכן און נאַטירלעכן זאַץ לויטן קאָנטעקסט.

יעדעס נערוון־קעמערל בײַ חיות און מענטשן באַקומט און שיקט אַרויס עלעקטרישע סיגנאַלן דורך די סינאַפּסן, אַ מין נאַטירלעכע דראָטן, געדענקענדיק דעם אינפֿאָרמאַציע־אויסטויש. די נייראָן־נעץ בײַם מוח פֿון אַ מורעשקע באַשטייט פֿון אַרום 250,000 צעלן; בײַ אַ קאַץ — 250 מיליאָן, און בײַ אַ מענטש — 86 מיליאַרד.

די אַנטוויקלונג פֿון מאָדערנער מעדיצין אינעם פֿאַרגאַנגענעם יאָרהונדערט האָט דערמעגלעכט צו פֿאַרשטיין, בדרך־כּלל, די פֿונקציעס פֿון לעבעדיקע נערוון־צעלן. אויפֿן סמך פֿון פֿאָרלויפֿיקע פֿאָרשונגען אינעם דאָזיקן געביט, האָט דער פּסיכאָלאָג פֿראַנק ראָזענבלאַט, אַן אַמעריקאַנער ייִד, צוגעטראַכט אינעם יאָר 1957 אַ פּשוטע קאָמפּיוטער־מאָדעל פֿון אַ נייראָן — דעם אַזוי־גערופֿענעם פּערצעפּטראָן. אין אַ שמועס מיט דער „ניו־יאָרק טײַמס‟ איז ראָזענבלאַט דעמאָלט אויפֿגעטראָטן מיט סענסאַציאָנעלע פֿאַנטאַסטישע ווערטער, אַז אין דער צוקונפֿט וועט אויפֿקומען אַ גאַנצע ציוויליזאַציע פֿון טראַכטנדיקע ראָבאָטן מיט קינסטלעכע נערוון.

שפּעטער האָט זיך אַרויסגעוויזן, אַז די מאַשינען זענען מסוגל נאָכצומאַכן, צום בעסטן, בלויז אַ פּיצל־קליינעם מוח פֿון אַ ווערעמל. דער אינטערעס צו קינסטלעכע נייראָן־נעצן האָט זיך באַנײַט מיט 20 יאָר צוריק, ווען אין דער וועלט האָבן זיך באַוויזן גענוג גרויסע קאָמפּיוטערס און קאָמפּיוטערישע נעצן. אין דער זעלבער צײַט, האָבן די פֿאָרשונגען אין נייראָ־פּסיכאָלאָגיע געהאָלפֿן בעסער צו פֿאַרשטיין די אינפֿאָרמאַציע־פּראָצעסן אינעם מענטשלעכן מוח. הײַנט ווערן די קאָמפּיוטער־מאָדעלן פֿון נייראָנען באַנוצט מיט גרויס דערפֿאָלג אין אַ גאַנצער ריי פּראַקטישע געביטן. אַ דאַנק זיי, דערקענען ספּעציעלע פּראָגראַמען די פּנימער, אותיות און אַנדערע וויזועלע אָביעקטן; זיי קאָנען פֿאָרויסזאָגן עקאָנאָמישע פּראָצעסן און רעגולירן דעם טראַנספּאָרט־פֿאַרקער און העלפֿן די דאָקטוירים צו שטעלן דעם ריכטיקן דיאַגנאָז.

נישט לאַנג צוריק האָט דער „גוגל‟ געשאַפֿן אַ קאָמפּיוטער־פּראָגראַם, וועלכע האָט אין מײַ 2017 צום ערשטן מאָל געוווּנען אַ גאָ־פֿאַרמעסט מיט אַ וועלט־טשעמפּיאָן. גאָ איז די עלטסטע טיששפּיל אין דער וועלט, וואָס ווערט שוין דערמאָנט מיט 2,500 יאָר צוריק אין אוראַלטע כינעזישע דאָקומענטן. די שפּיל זעט אויס פּשוט, אָבער אין דער אמתן איז גאָר קאָמפּליצירט. ביז לעצטנס, האָבן די פּראָפֿעסיאָנעלע שפּילער געגלייבט, אַז די קאָמפּיוטערס זענען נישט מסוגל זיך ערנסט צו פֿאַרמעסטן מיט מענטשן; דער „גוגל‟ האָט געוויזן, אַז די נייראָן־נעצן קאָנען אַרויסווײַזן די נייטיקע כּמו־מענטשלעכע פֿעיִקייטן.

פֿון דער צווייטער זײַט, לײַדן די נייראָן־נעצן, אַזוי ווי אונדזערע אויגן, פֿון געוויסע חסרונות. ווען מיר שרײַבן אָדער לייענען, באַמערקן מיר נישט אַלעמאָל די גרײַזן און אַפֿילו גאַנצע פֿעלנדיקע ווערטער, ווײַל דאָס מענטשלעכע אויג פֿאַרלאָזט זיך אויף באַקאַנטע ווערטער און שפּראַכיקע מאָדעלן און פֿילט אויס אומבאַוווּסטזיניק דעם טעקסט אינעם מוח.

הגם די נײַע איבערזעצונג־שיטה פֿונעם „גוגל‟ קלינגט ווי אַ וויכטיקער פֿאָרשריט, קומט זי באַגלייט מיט גרויסע חסרונות. ערשטנס, בלײַבט ענגליש דאָס איינציקע אינערלעכע מאַמע־לשון פֿון דער סיסטעם. צווייטנס, אַנשטאָט צו וואָרענען, אַז עפּעס אַ וואָרט איז אומבאַקאַנט, שטעלט די מאַשין אויטאָמאַטיש אַרײַן אירע אייגענע „שעפֿערישע‟ בײַטונגען און הוספֿות, טאַקע נאָכמאַכנדיק אין אַ גראָבער גראָטעסק־פֿאָרעם דעם מענטשלעכן מוח־פּראָצעס.

די צאָל קינסטלעכע צעלן אין דער נײַער נעץ קאָן זײַן זייער גרויס — אַפֿילו גרעסער פֿונעם מענטשלעכן מוח. פֿון דעסט וועגן, איז כּדאַי זיך צו דערמאָנען, אַז אַ העלפֿאַנד פֿאַרמאָגט אין זײַן קאָפּ דרײַ מאָל מער נייראָנען, ווי אַ מענטש. קיין שפּראַכן־קענער טרעפֿן זיך אָבער נישט צווישן די חיות. אַ סך פּראָצעסן אינעם מענטשלעכן מוח בלײַבן אַ רעטעניש; דערווײַל לאָזט זיך נישט זיי נאָכצומאַכן, ווי גרויס די קאָמפּיוטער־מאָדעלן זאָלן נישט זײַן.

ס׳איז מעגלעך, אַז דער עיקר־צוועק פֿון דער נײַער סיסטעם איז לאַוו־דווקא די קוואַליטעט פֿון איבערזעצונגען, נאָר אַן אַלגעמיינער גלאָבאַלער עקספּערימענט מיטן באַנוצן די נייראָן־פּרינציפּן בײַם באַאַרבעטן די לעבעדיקע מענטשלעכע שפּראַכן. איר קאָנט זיך גרינג באַטייליקן אינעם דאָזיקן עקספּערימענט און עס אַליין אָפּשאַצן אויף אײַער קאָמפּיוטער אָדער טעלעפֿאָן. האָט אין זינען, אַז די אויסטערלישע אָפּטײַטשן בײַטן זיך, ווען מע גיט צו אַן אַרטיקל, אַ פּרעפּאָזיציע צי אַן אַנדער עלעמענט, אַפֿילו אַ קאָמע צי אַ שטריכל. די חרדישע און אַפֿילו סאָוועטישע אָרטאָגראַפֿישע וואַריאַנטן פֿון ייִדיש ווערן אָפֿט בעסער אָנערקענט דורכן קאָמפּיוטער, ווי דער ייִוואָ־אויסלייג.

צום בײַשפּיל, להיפּוך צו דער דערמאָנטער טשיקאַווער מעשׂה מיט דער אַלטער ווערסיע פֿונעם „גוגל־איבערזעצער‟, ווערט „שאַנדהויז‟, אָנגעשריבן ווי איין באַזונדער וואָרט, איבערגעטײַטשט גאַנץ אומשולדיק ווי Shamrock [קלעווער־בלעטל] — אַ באַקאַנטער אירלענדישער נאַציאָנאַלער סימבאָל. פֿון דער צווייטער זײַט, ווערט דאָס ענגלישע וואָרט whoredom אָפּגעטײַטשט אויף ייִדיש ווי „ווערטערבוך‟.

ס׳איז טשיקאַווע, אַז ווען מע זוכט „שאַנדהויז‟ אין דער אינטערנעץ, דערקענט דער „גוגל‟ דאָס דאָזיקע וואָרט און שיקט גלײַך צו אונדזער צײַטונג, נעמלעך, צו מײַן אַנומלטיקן אַרטיקל וועגן שלום אַשס סקאַנדאַליעזער ליטעראַרישער ירושה. ווי געזאָגט, האָט די זוך־מאַשין אָפּגעשאַפֿן, צוליב גוטע סיבות, אויטאָמאַטישע איבערזעצונגען מיט עטלעכע יאָר צוריק; עס באַווײַזן זיך בלויז אייניקע זײַטלעך אויף ייִדיש. איבערקוקנדיק מײַן אַרטיקל אויפֿן קאָמפּיוטער־גענערירטן כּמו־ענגליש, בין איך געווויר געוואָרן, אַז „ספֿרי־קודש‟ איז דער טײַטש Sri Krishna.

עס קאָן זײַן, אַז במשך פֿון צײַט וועט דער נײַער „העלפֿאַנדישער‟ קינסטלעכער מוח אַרויסווײַזן מער קלוגשאַפֿט. דערווײַל זעט אָבער אויס זײַן ווערטערבוך, צום באַדויערן, טאַקע ווי אַ שאַנדהויז.