АПК     САФУ     МП     УП    отрасль     АКМ     новости     how-to
Поделиться
Назад
02 октября 2023

Обучение постредактированию машинного перевода в вузе

Е. С. Коканова кандидат филологических наук, доцент, заведующая базовой кафедрой технологий и автоматизации перевода в бюро переводов АКМ-Вест, Северный (Арктический) федеральный университет имени М. В. Ломоносова, г. Архангельск
С.Ю. Светова директор компании «Т-Сервис», авторизованного реселлера решений Trados, г. Санкт-Петербург
М.В. Берендяев доцент базовой кафедры технологий и автоматизации перевода в бюро переводов АКМ-Вест, САФУ, первый заместитель генерального директора – операционный директор АКМ-Вест, г. Москва
Н.Ю. Куликов доцент базовой кафедры технологий и автоматизации перевода в бюро переводов АКМ-Вест, САФУ, генеральный директор АКМ-Вест, г. Москва

Аннотация. В статье рассматриваются особенности обучения постредактированию машинного перевода в высшем учебном заведении. Уделяется внимание необходимости развития критического мышления, умения анализировать и оценивать результат машинного перевода, навыков поиска и верификации информации, навыков быстрой печати, а также освоения систем автоматизации перевода на раннем этапе обучения и совершенствования навыков постредактирования машинного перевода в выбранной тематике. Ключевые слова: постредактирование машинного перевода, результат машинного перевода, обучение, критическое мышление, автоматизация перевода.

Обучение постредактированию машинного перевода в вузе

Любые исследования в области искусственного интеллекта следует рассматривать как попытки дальнейшего развития технологий в континууме здравого смысла. Это касается и исследований по машинному переводу (МП). Важно, чтобы они не стали предположениями о существовании какого-то почти мистического видения, чтобы оправдать стабильно высокое качество МП, или полным отрицанием того факта, что его можно грамотно использовать.

Нужно ли учить постредактированию МП в современном вузе – или МП и так уже достаточно широко используется в процессе перевода, без какого-либо специального обучения? Существуют разные точки зрения.

Никто не будет спорить, что МП стал ценным источником получения дополнительной информации и автоматически сгенерированного текста. Без постредактирования результат МП может применяться только тогда, когда целью является быстрый доступ к данным на иностранном языке – и без предъявления особых требований к качеству перевода (навигация по сайту, чтение сообщения в социальной сети и т. п.), а также в том случае, когда риском искажения смысла или неточностей в переводе можно пренебречь. Когда же речь идет об использовании текста машинного перевода для решения «серьезных» задач, в качестве эквивалентной «полной замены» текста оригинала, все мы в той или иной степени сталкиваемся с необходимостью его постредактирования.

Опыт преподавания переводческих дисциплин показывает, что без целенаправленного обучения постредактированию МП студенты, уже имеющие опыт работы с памятью переводов (англ. Translation Memory, TM), могут ошибочно начать использовать МП аналогичным образом. Однако многие приемы постредактирования ТМ не вполне применимы или недостаточно эффективны для работы с результатом МП, так как типология ошибок МП существенно отличается от всех известных типологий ошибок, разработанных для «человеческого» перевода и его редактирования. В переводческой деятельности следует понимать разницу между применением ТМ и МП. Умение постредактировать ТМ и МП одновременно становится необходимостью в современных реалиях. Кроме того, как отмечают руководители переводческих компаний, МП следует обязательно включать в программу обучения еще и для того, чтобы образование в вузе отражало реальные потребности рынка переводов, чтобы поддерживать тренды и помогать выходу выпускников в новый мир, то есть обеспечить или облегчить трудоустройство выпускаемых специалистов. Подготовка к выполнению реальных задач и по актуальным специальностям является средством повышения рейтинга вуза. В противном случае не только вузы теряют привлекательность, но и компаниям приходится тратить время и средства на дообучение и переобучение студентов.

Итак, изучение средств автоматизации перевода в вузе, безусловно, необходимо. Следующим дискуссионным вопросом является обсуждение того, когда начинать и чему именно учить. Традиционный подход предполагает обучение «традиционному ручному» переводу до того, как студентам будут представлены средства автоматизации. Но возможен ли и целесообразен ли такой подход в современных условиях? При широком выборе легкодоступных онлайн-переводчиков будущие студенты сталкиваются с МП еще задолго до поступления в вуз и в любом случае продолжают его использовать при обучении переводу [2]. В итоге, студенты смешивают два разных процесса – перевод и постредактирование, причем последнее производится интуитивно и не способствует формированию у студентов необходимых компетенций, как переводческих, так и технологических.

Между тем, специалист, в первую очередь, должен уметь редактировать, и для этого необходим определенный набор навыков. Студенту нужно сначала научиться рассчитывать стабильную скорость работы: быстро печатать, быстро читать, быстро анализировать, сопоставлять и т. д. Важно развивать у студентов критическое мышление в целом, и критическое отношение к результату МП. Иначе будущие специалисты не смогут адекватно оценить качество результата МП и взять на себя ответственность за качество получившегося перевода: им так удобнее, за них решение принимает система МП. Например, они не видят и не могут сразу найти результат МП в тексте, не видят ошибки МП, особенно если он выглядит гладким, так как не учитывают многие аспекты при работе с МП. Таким образом, невозможность избежать использования МП студентами и комплексность компетенций, необходимых для работы с системами автоматизации перевода, в том числе с МП, свидетельствуют о том, что в вузе следует включать в программу как можно раньше работу не только со средствами ТМ и МП, но и QA (контроль качества перевода).

Еще одним аргументом в пользу параллельного изучения перевода и средств автоматизации, в том числе МП, является то, что при раннем включении таких дисциплин в программу (непосредственно с 1 курса) у переводчика формируется соответствующее мышление и понимание переводческих процессов, в то время как включение их на 4 курсе может рассматриваться как насилие над творческой личностью и сложившимися стереотипами.

При обучении постредактированию МП важно, чтобы студенты учились работать с результатом МП разного уровня качества и вносить только необходимые правки. Привыкание к профессиональному человеческому переводу приводит к тому, что переводчики и редакторы хуже справляются с проблемами постредактирования. Поскольку существующие немногочисленные стандарты определяют два основных уровня постредактирования («лѐгкое» и «полное» постредактирование), следует научить студентов редактировать до нужного уровня качества. Кроме того, переводчики должны уметь оценивать пригодность текста к МП, быстро находить необходимую информацию, не доверять слепо МП, сохранять связность текста при постредактировании МП [4].

Значительно упрощает работу постредактора серьезное владение тематикой. Чем раньше начать осваивать тематику, тем проще будет адаптироваться к процессу и не дать МП сбить себя с толку.

Важным аспектом при обучении постредактированию МП является экспланаторность при выполнении упражнений, в частности соотносимость технологий автоматизированного и машинного перевода, типологии ошибок МП и типологии ошибок человека-переводчика, постредактирования МП с предредактированием текстов для МП и т. д. Этот подход предполагает учет когнитивной нагрузки [3] и стрессоустойчивости будущего постредактора.

С навыком постредактирования тесно связаны умения настраивать и оценивать МП. Сложность формирования обозначенных умений может заключаться в том, что сейчас только крупные компании могут себе позволить настройку МП, поэтому студенты зачастую ограничиваются сравнением результатов МП браузерных версий самых распространенных отечественных и зарубежных бесплатных систем МП. Тем не менее, есть надежда, что постепенно все смогут себе позволить настройку МП. Например, уже появилась возможность подключения терминологических баз и баз ТМ.

Точно так же, с прицелом на будущее, необходимо осваивать навыки обучения систем МП, например, подготовку датасетов, в надежде на то, что в ближайшее время настройка МП будет экономически целесообразна и финансово доступна не только крупным компаниям, но и отдельным переводчикам-фрилансерам.

Таким образом, изучение автоматизации перевода и МП как необходимого инструмента должно быть включено в образовательную программу как обязательная дисциплина. При этом, неоспоримым остается факт, что переводчик, работающий в сценариях с использованием МП, должен быть обязательно обучен хорошо переводить даже безо всяких средств автоматизации. Главными качествами переводчика и(или) постредактора должны быть гибкость, умение учиться и адаптироваться, причем, всю жизнь.

К обсуждению компетенций будущего активно подключаются академическое и профессиональное переводческое сообщества, а также сами студенты. В рамках ХI Всероссийской научно-практической конференции с международным участием «Развитие Севера и Арктики: потенциал наставничества и инновации в социально-гуманитарной сфере» в апреле 2023 г. состоялся Круглый стол с работодателями «Постредактирование машинного перевода. Наставничество и профессиональное развитие» [1]. Выражаем благодарность ключевым докладчикам Круглого стола: старшему эксперту «Амберит СНГ» Ренату Бикматову, генеральному директору «ПАЛЕКС» Павлу Кошаку, менеджеру по лингвистическому качеству «ПАЛЕКС» Ксении Крапивиной, руководителю отдела лингвистики и машинного перевода «Неотэк» Евгении Забабуриной и редактору технических текстов «Неотэк» Андрею Чудецкому, чьи ценные мысли и идеи были положены в основу статьи.

Библиографический список
1. В САФУ прошел Круглый стол «Постредактирование машинного перевода. Наставничество и профессиональное развитие» // САФУ. Официальный сайт. URL: https://narfu.ru/hssshic/novosti/all/378606/, свободный (дата обращения: 05.09.2023).
2. Коканова, Е. С. Зачем навыки постредактирования студенту, или как оценивать студенческий машинный перевод? // Языки и культуры: междисциплинарные исследования: сб. статей II Международной конференции. СПб: Изд-во СПбГУ, 2021. С. 97–101.
3. Коканова, Е.С., Пак, Н.С. Когнитивный подход в исследовании постредактирования машинного перевода // Когнитивные исследования языка. 2021. № 3(46). С. 346–351.
4. Лютянская, М.М., Коканова, Е.С. Сохранение связности текста в процессе постредактирования машинного перевода (когнитивный аспект) // Когнитивные исследования языка. 2022. № 3(50). С. 680–683.