montrealex (montrealex) wrote,
montrealex
montrealex

Сделал статью в новом редакторе, потому что в старом перекосоежилось.

Предисловие к переводу статьи Дугласа Хофстадтера о переводчике Гугл.


В самом начале Дуглас, переводчик Пушкина, не знающий, по его собственному признанию русского, недоумевает по поводу того, почему говорящие на датском люди общаются с помощью ГТ (так я далее буду называть для краткости «Гугл Транслейт»). А вот у меня лично, начавшего изучать французский язык на советском инязе в возрасте 17 лет, в страшно далёком уже, можно сказать ископаемом 1973 году, и в 20 лет начавшего углублять усвоенный кое-как в средней школе английский, такого вопроса не возникло. Зато возникло недоумение, почему автор этого не понимает.



Ведь он сам пишет, что его друг Фрэнк умеет только говорить по-датски, так как в детстве жил в Дании. Ничто не свидетельствует в тексте автора о том, что Фрэнк умеет на нём писать!  Если бы Дуглас учился на нашем карельском инязе, ему на первой же паре английского объяснили, что человек овладевает языком только тогда, когда может свободно функционировать на всех уровнях так называемой цепочки Палмера – говорении, аудировании (восприятии речи на слух), чтении и письме. Говорить на языке априори не значит знать его. Я лично был знаком с переводчиком, и неплохим, инженером по образованию, который годами успешно переводил технические тексты, но не умел разговаривать на английском, как не умел воспринимать английскую речь на слух. Ему надо было увидеть написанный термин, тогда он его точно и правильно переводил, но как этот термин звучит на иностранном языке, он просто не знал. Ему это было не нужно.

Поэтому перевел я его статью, как сейчас говорит молодёжь, «по приколу». И только до места, где он начинает разбирать машинный перевод немецкого языка. Причина проста: мне, работающему в первую очередь с французским, и во вторую – с английским немецкий совершенно неинтересен, хотя 20 с лишним лет назад я переводил и с него и мог выкручиваться на нём в Германии, если окружающие не знали английского, как однажды случилось, когда я сел в городе Киль не в тот автобус.

Предлагаю вам сначала прочитать целиком его статью в моём переводе, а потом ознакомиться с моим послесловием.

Неглубокий переводчик от Гугла

Программа использует самые современные методы информационных технологий, но простые тесты показывают, что ей ещё далеко до реального понимания текстов.

ДУГЛАС ХОФСТАДТЕР


30 января 2018 г.


Однажды в воскресенье мой друг Фрэнк привел на один из еженедельных сеансов сальсы гостя: свою подружку из Дании.

Я знал, что Фрэнк хорошо говорит по-датски, так как его мать датчанка, да и он сам ребенком жил в Дании. Что касается его подруги, то она свободно говорила по-английски, как практически все скандинавы. Однако, к моему удивлению, во время вечернего непринужденного общения выяснилось, что они обмениваются электронными письмами, переведенными ГТ. Фрэнк писал сообщение на английском, а затем запускал его в Гугл, который создавал новый текст на датском. И наоборот, подруга писала сообщение на датском языке, а потом отдавала онлайн переводчику, чтобы тот превратил его в  английский текст.


Как странно! Почему два умных человека, каждый из которых хорошо говорит на языке другого, делают это? Мой собственный опыт работы с программным обеспечением для машинного перевода всегда заставлял меня скептически относиться к нему. Но мой скептицизм явно не разделялся этими двумя. Действительно, многие вдумчивые люди в восторге от программ перевода и не находят в них критики. Это сбивает меня с толку.


Как любитель языка и страстный переводчик, как учёный-исследователь и пожизненный поклонник тонкости человеческого разума, я десятилетиями следил за попытками механизировать перевод. Когда впервые заинтересовался этим вопросом, в середине 1970-х годов, наткнулся на письмо, написанное в 1947 году математиком Уорреном Уивером, одним из первых энтузиастов машинного перевода, Норберту Винеру, ключевой фигуре в кибернетике, в которой Уивер сделал это любопытное заявление, сегодня довольно знаменитое:


«Когда я смотрю на статью на русском языке, то говорю себе: «Это на самом деле написано на английском, но закодировано в каких-то  странных символах. Теперь я перехожу к декодированию».


Несколько лет спустя он предложил другую точку зрения: «Ни один разумный человек не считает, что машинный перевод может когда-либо достичь законченной  элегантности и стиля. Пушкину не нужно вертеться в гробу».


Вау! Посвятив один незабываемо напряженный год жизни переводу блестящего романа Александра Пушкина в стихах «Евгений Онегин» на мой родной язык[1] (то есть радикально переработав эту великую русскую работу в англоязычный роман в стихах), я нахожу это  замечание Уивера гораздо более глубоким, чем его предыдущее высказывание, которое раскрывает странно упрощенный взгляд на язык. Тем не менее, его взгляд на перевод как декодирование в 1947 году на долгое время стал кредо, к которому обращались все, кого интересовали вопросы машинного перевода.


С тех пор «переводческие машины» всё время  совершенствовались, и использование в последнее время так называемых «глубоких нейронных сетей» даже заставило некоторых публицистов (см. «Великое пробуждение ИИ (The Great AI Awakening)» Гидеона Льюиса-Крауса в журнале The New York Times) и «Машинный перевод: выше Вавилонской башни (Machine Translation: Beyond Babel)» Лейна Грина в журнале «The Economist») говорить о том, что переводчики-люди могут стать вымирающим видом. В таком  сценарии люди этой профессии через несколько лет станут просто контролерами качества и корректорами, а не производителями нового текста.


Такое развитие событий вызвало бы большие  потрясения в моей интеллектуальной жизни. Несмотря на то, что я полностью понимаю интерес к  попыткам заставить машину делать хороший  перевод, я ни в коем случае не хочу, чтобы живые переводчики были заменены неодушевленными машинами. Такая мысль меня страшит и возмущает одновременно. На мой взгляд, перевод - это невероятно тонкое искусство, которое постоянно опирается на многолетний жизненный опыт и творческое воображение. Если бы в один «прекрасный» день переводчики стали бы пережитками прошлого, мое уважение к человеческому разуму претерпело бы глубокое потрясение, шок заставил бы меня замереть в  ужасной растерянности, а душу заполонила бы всеохватная и вечная печаль.


Каждый раз, когда я читаю статью, в которой утверждается, что переводчики скоро преклонят выи пред страшным и молниеносным ятаганом  какой-то новой технологии, я чувствую необходимость самостоятельно проверить такую информацию, отчасти из чувства ужаса, что этот кошмар уже подстерегает тебя в ближайшем тёмном переулке, но более в надежде заверить себя, что пока ещё не идёт речь о ближайшем переулке, и, наконец, делаю я это, руководствуясь своей давней верой в то, что важно бороться с раздутыми претензиями искусственного интеллекта. Итак, после прочтения строк о том, как старая идея об искусственных нейронных сетеях, недавно принятая филиалом Гугл под названием Google Brain, а теперь усовершенствованная «глубоким обучением», привела к появлению нового типа программного обеспечения, которое, якобы, произвело революцию в машинном переводе.


Я решил, что нужно проверить последнюю версию переводчика Гугл. На самом ли деле речь идёт о революции, которую сыграли Deep Blue и AlphaGo в сфере достопочтенных игр в шахматы и в го?


Я узнал, что, хотя старая версия Google Translate может работать с очень большим набором языков, ее новая ипостась с «глубоким обучением» в то время работала только с девятью из них. (Теперь их список расширен до 96). Соответственно, я ограничил свои исследования английским, французским, немецким и китайским языками[2]. Прежде чем показать свои выводы, я должен отметить, что в своей статье я эксплуатирую неясность прилагательного «глубокий». Когда мы слышим, что Гугл купил компанию DeepMind, (дословно «глубокий разум»), чьи продукты имеют «глубокие нейронные сети», усиленные «глубоким обучением», то понимаем под этим прилагательным и «мощный» и «проницательный» и «мудрый». На самом же деле, значение «глубокий» в данном контексте происходит просто от того факта, что эти нейронные сети имеют больше слоев (скажем, 12), чем старые, имевшие всего два-три. Но подразумевает ли такая глубина, что всё производимое сетью на само деле глубинно? Вряд ли. Речь здесь просто идёт о пиаре.


Я очень настороженно отношусь к ГК, особенно учитывая всю шумиху вокруг него. Но, несмотря на мое неприятие программы, я признаю, что существуют удивительные факты в отношении  этого моего bête noire. Он доступен бесплатно любому человеку на земле и преобразует текст на любом из примерно 100 языков в любой другой. Это даёт мне урок скромности. Если я горжусь тем, что называю себя «пилингвом» (то есть сумма всех языков, которыми я владею, как число «пи» чуть больше трёх, знаете, такой легковесный способ отвечать на вопрос «На скольких языках вы говорите?»), то насколько больше имеет переводчик Гугл оснований гордиться собой! Ведь он смело  может величать себя «бай лингвом[3]» («бай» на китайском означает «сто»). Для пилингва байлингв – величина недосягаемая. Более того, если я скопирую текст на языке А и засуну его в ГТ, то пройдёт всего несколько секунд, а у меня уже будет страница на языке Б. И это постоянно происходит на всей планете с десятками языков.


Практическая польза ГТ и аналогичных технологий бесспорна, и, вероятно, в целом это хорошо, но в программе все еще отсутствует то, что передается одним словом: понимание. Машинный перевод никогда не был ориентирован на понимание языка. Вместо этого автомат всегда пытался «расшифровать» - ввыкрутиться, не сильно заботясь о понимании и смысле. А разве может такое быть,  чтобы понимание не нужно было для того, чтобы хорошо переводить? Может ли структура, человеческая или машинная, сделать качественный перевод, не обращая внимания на то, чем собственно язык и является? Чтобы пролить свет на этот вопрос, я перехожу к экспериментам, которые провел.


* * *


Я начал свои изыскания с короткого фрагмента, вызывающего в уме простую картину:


In their house, everything comes in pairs. There’s his car and her car, his towels and her towels, and his library and hers.


Задача, поставленная перед ГТ кажется простой, но во французском (и других романских языках) слова «его» и «ее» не совпадают по роду с владельцем, а согласуются с предметом, которым он или она владеют.


Итак, вот что я получил:


Dans leur maison, tout vient en paires. Il y a sa voiture et sa voiture, ses serviettes et ses serviettes, sa bibliothèque et les siennes[4].


Программа попала в ловушку, поставленную мной: она не поняла, в отличие от любого читателя, что я говорю о супружеской паре и подчеркиваю, что для каждого его предмета, у нее был точно такой же. Например, механизм глубокого обучения использовал слово «sa» как определитель к автомашине (ж.р. во французском), то есть получилась «его/её машина», и читателю на французском не ясно, какого пола владелец автомобиля. Аналогично, он использовал бесполое множественное число «ses» для «полотенец», и, наконец, программа встала в тупик перед конечным «s» в слове «hers» и почему-то решила, что это «s» представляет множественное число («les siennes»)[5]. Французский перевод ГТ потерял всякий смысл.


После чего я сам перевел эту с сохранением смысла: Chez eux, ils ont tout en double. Il y a sa voiture à elle et sa voiture à lui, ses serviettes à elle et ses serviettes à lui, sa bibliothèque à elle et sa bibliothèque à lui. На русский: В их доме все идет парами. Это его машина и ее машина, его полотенца иее полотенца, его библиотека и ее. Фраза «sa voiture à elle» значит «ее машина», и аналогично, «sa voiture à lui» не может восприниматься иначе, как «его автомобиль». Тут я подумал, что ГТ одной левой сделает теперь правильный перевод с французского обратно на английский, но не тут-то было. Вот что меня ожидало:


At home, they have everything in double. There is his own car and his own car, his own towels and his own towels, his own library and his own library.


Дома у них все в два раза. Есть его собственная машина и его собственная машина, его собственные полотенца и свои полотенца, его собственная библиотека и его собственная библиотека.


Шта?! Ведь во введенном в машину предложении гендеры владельцев орут, как резаные! Переводчик же этих воплей не замечает и делает всех мужчинами! Почему он отбросил самую важную информацию предложения?


Мы, люди, знаем все о супружеских парах, домах, личных вещах, гордости, соперничестве, ревности, неприкосновенности частной жизни и о многих других нематериальных вещах, которые порождают такие выкрутасы, что муж имеет полотенце с вышитым «его», а жена с «её». ГТ такие ситуации неизвестны. Неведомы они ему совсем, и всё тут. Точка. Он знаком исключительно со строками, состоящими из слов, которые состоят из букв. Проблема - в сверхбыстрой обработке фрагментов текста, а не в мышлении, воображении, запоминании или понимании. Он даже не знает, что слова означают вещи. Может быть я забегаю вперёд, но скажу, что компьютерная программа, безусловно, в принципе может знать, для чего предназначен язык, и может иметь идеи, может воспоминать, набираться опыта и использовать его, но это не является предназначением ГТ. Его разработчики и близко не ставили такой задачи.


Ну, посмеялся я над этим неудачным спектаклем, с облегчением продемонстрировав, что мир, в конце концов, не так близок к тому, чтобы заменить переводчиков-людей на автоматы. Но я все еще чувствовал, что должен проверить машину повнимательнее. Ведь один глоток не утоляет жажду.


Действительно, как насчет этой недавно придуманной фразы «Один глоток не утоляет жажду» (намекая, конечно, на народную мудрость Une hirondelle ne fait pas le printemps - Одна ласточка весны не делает[6]»)? Я не удержался, и ввёл фразу в ГТ. Вот какая перчатка прилетела мне в лицо: «Une hirondelle n’aspire pas la soif (Одна ласточка не вдыхает жажды)». Грамматически верное, но совершенно непонятное  французское предложение. Сначала машина называет вполне определенную в тексте птицу («une hirondelle» - ласточка), затем говорит, что эта птица не вдыхает («n'aspire pas»), и, наконец, обнаруживает, что предмет, который не вдыхается - жажда («la soif»).


Ясно, что ГТ не понял значения введенной фразы, блин вышел «бычьим комом»: (It merely came out with a heap of bull – Il sortait simplement avec un tas de taureau (Это просто вышло с кучей быка).


Прошу прощения за мой французский, а точнее - псевдо-французский язык от ГТ (Google Translate).


На этом кончается авторский текст Дугласа, и начинается моё


Послесловие.


Чтобы не уходить далеко, давайте проведем эксперимент с фразой, над переводом которой так издевается автор. Как говорили мы в студенчестве: «стебётся». А именно: It merely came out with a heap of bull.


Всякий человек, хорошо знакомый с современным состоянием языка Вильяма нашего Шекспира, возьмёт быка, о котором тут говорится, за рога сразу же. Мне совершенно понятно, например, почему Дуглас этого не сделал. А по одной простой причине. Он просто был одержим желанием доказать, что ГП пока ещё никуда не годится. Поэтому и не добавил к слову «бык» продукта его жизнедеятельности, который, согласитесь, тут прямо просится в строку и в таком сочетании не только означает совсем другой предмет, но и превращается в прилагательное. Вы уже догадались, что речь идёт о слове “bullshit”.  Давайте введем его в ГК, приставив к быку и посмотрим, что получим. Voilà! - Это просто вышло с кучей ерунды. Согласитесь, что смысл фразы совсем не потерян, и никакого быка уже и в помине нет.


Ну и попытаемся сделать заключение. Для этого вернемся к фразе того же Дугласа: «На мой взгляд, перевод - это невероятно тонкое искусство, которое постоянно опирается на многолетний жизненный опыт и творческое воображение».


Это верно, но только отчасти. Дело в том, что он забыл одно слово «художественный» перед словом «перевод». Или литературный, или фикшн – это слово тоже вошло в русский словарь. Но какую часть вообще занимает художественный перевод в доле всех переводов, над которыми корпят миллионы переводчиков во всём мире? Я не могу назвать, естественно, точной цифры, но исходя из собственного опыта и того, что читал и слышал в ходе обучения в двух канадских университетах, это соотношение равно примерно 10 к 90%. Ну ладно, дадим художественному переводу 20%, будем щедрыми. Всё остальное – это перевод документов, то есть в широком смысле технический. А всем известно, что в техническом переводе почти нет ни метафор с метонимиями, синекдохами и литотами, ни идиоматических выражений. А если они затесались, то легко вычленяются. Они, что называется, «бросаются в глаза», вот вам пример метафоры, который не встретится в техническом переводе, потому что если, допустим, в глаза прыснет скважинная жидкость или влетит болт или гайка, а не дай бог металлическая стружка, то будет не до метафоры совсем. Технический перевод вовсем не чурается повторов, более того, если ты в переводе конракта, скажем, в одном месте напишешь «контракт», а через параграф – «соглашение», желая показать, что ты не лыком шит и твой тезаурус огого, то заказчик будет в корне неправ, если даст тебе после этого ещё хоть один заказ.


Когда я только – только начинал возвращаться к переводческой деятельности в начале 2019 года, то разослал резюме в примерно 500 переводческих бюро, из которых откликнулись примерно 50, а десятка два прислали тесты. Одно БП[7],  прислало тестовое задание по десятку отраслей, из которых 9, условно говоря, были техническими, а одно, надо было перевести диалоги к компьютерным играм, условно можно было назвать художественным. Я тогда рвался работать и перевел все тесты. Ответа не получил. Спросил в чём дело. Мне сказали по мейлу, что тест я завалил как «носитель языка» (я нигде не писал, что когда либо носил какой-либо другой язык, кроме родного русского), но как не носитель его прошёл. А вот в переводе на английский было у меня аж 10 ошибок! Я робко заикнулся о том, что хорошо бы посмотреть на ошибки. К моему удивлению мне прислали файл в Экселе, где редактор, надо полагать, носитель английского (правда он в одном месте написал English c маленькой буквы) – вся редактура была на этом языке, говорил, например, что формы глагола to prove proved не существует и надо писать “proven”. Что, конечно, является тем самым «быком», о котором шла речь выше[8]. У меня были и другие вопросы к этому редактору – «носителю», но, в конечном итоге я даже обрадовался, что мне не надо будет работать за копейки с таким дремучим редактором, который в примерно ста словах своей рецензии сделал две грубых ошибки, тогда как я в 3642 допустил их всего 10, да и то, если не считать описок. Но больше всего я смеялся в душе над его «общим заключением» по поводу того, что с техническими терминами у меня «более-менее» всё в порядке, а вот с «креативностью» похуже. Это заключение, на мой взгляд, та самая пресловутая унтер-офицерская вдова (бесполезно было бы разъяснять такому редактору, что это значит), которая вопиет о профессиональной непригодности «правщика». Креативность – это тягчайший грех технического переводчика! Если он начнёт выдумывать термины вместо того, чтобы найти эквивалент в языке перевода, то его надо из профессии гнать.
Как изящно выражалась моя мама: «В жопу мешалкой».


И да, ещё чуть не забыл. В моём тексте перевода про характеристики вертолёта, в частности длину его главного винта он поставил саркастическое rotating (main) rotor – really? И… просто снял rotating, оставив main. Да, конечно, я мог бы написать, для красоты стиля, допустим in rotation или  in (the) state of rotation, но, согласитесь, это абсолютно не принципиально. Во – первых, это не моя вина, что главный винт вертолёта называется по-английски ротором, а во-вторых, в исходном тексте не случайно написано про винт в состоянии вращения. Редактор-носитель, протирающий штаны над переводами диалогов компьютерных игр может того, конечно, не знать, но всякий разумный человек вам скажет, что когда вертолёт не летит, его главный винт сильно обвисает, и разница в длине вращающегося винта по сравнению с обвисшим в состоянии покоя может достигать значительной длины. Убрав в своей правке важный элемент исходного текста, руководствуясь соображениями стиля, мол, не надо повторять один и тот же термин, «редактор» совершил грубую смысловую ошибку.


То есть, подобъём окончательный итог.


ГП никогда не задумывался как подспорье для толмачей, занимающихся художественным, «креативным» переводом. Он служит миллиардам, наверное, людей, которые хотят перевести ДОКУМЕНТ. Или понять, о чём говорится, скажем, в газетной статье.
Техническому переводчику он сильно облегчит работу, хотя бы в том смысле, что не надо будет стучать по клавишам, набирая порой одно и то же.
При условии, само собой, что переводчик потом хорошо отредактирует выданное им на-гора.

[1] Один из отзывов об этом переводе: Перевод "Онегина" корявый, с нулевой музыкальностью, английские стихи у него не получаются. Предпринят был с юношеским задором опровергнуть набоковский запрет переводить Пушкина стихами.

[2] Два последних я ампутировал (прим. перев.)

[3] Несмотря на то, что по-английски слово билингв тоже произносится как «байлингуал» в силу правила открытого слога, к слову имеющему массу исключений, мы пишем в русском этот новомодный термин (до перестройки почти неизвестный), как билингв.

[4] Я проверил эту фразу 17 апреля 2019 года и увидел, что ГТ на самом деле «учится», хотя и помаленьку. Например, он исправил «les siennes» на «la sienne», оставив всё остальное, как у Дугласа: Dans leur maison, tout vient par paires. Il y a sa voiture et sa voiture, ses serviettes et ses serviettes, et sa bibliothèque et la sienne.

[5] Как мы уже заметили, программа из тупика успешно вышла со времени выхода статьи в свет менее полутора лет назад и мы не знаем, может быть уже в феврале 2018 обучение произошло.

[6] В английском swallow означает одновременно глагол «глотать» и ласточку, потому что птичка заглатывает в полёте воздух вместе с насекомыми. Любопытно, что во французском тоже есть птичка, этимология названия которой идёт ровно от той же особенности глотать воздух, только у французов, в силу поэтичности галльского народа, она глотает ветер и называется Engoulevent ( лат. Caprimulgus). Да, и заметим походя, что в английском одинокая ласточка не делает лето (One swallow doesn’t make a summer), а в русском и французском – весну.

[7] я не думаю, что должен скрывать его название, так как не собираюсь там работать вообще никогда, даже если попросят, что вряд ли. Речь идёт о хвастливо сующем всюду рекламу ЛОГРУСЕ ГЛОБАЛ. При клике на сайт этой компашки мой антивирус говорит следующее:

This site is not secure

This might mean that someone’s trying to fool you or steal any info you send to the server. You should close this site immediately.

[8] Proved is the past tense of the verb prove. Both proved and proven are acceptable as past participle forms. https://www.dailywritingtips.com/proved-vs-proven/

Tags: Переводы
Subscribe

Posts from This Journal “Переводы” Tag

  • Post a new comment

    Error

    default userpic
    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 1 comment