Файл: I. Машинный перевод История машинного перевода.doc

ВУЗ: Не указан

Категория: Реферат

Дисциплина: Не указана

Добавлен: 24.04.2024

Просмотров: 118

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.


— оценка понимания перевода путем постановки вопросов по тексту;

— оценка ясности смысла перевода по шкале «ясно», «неяс­но», «бессмысленно» Ни один из этих методов не дает четкого ответа на вопрос о том, каковы критерии качества машинного перевода и каков до­пустимый уровень качества. (№ 11)


Глава II. Система машинного перевода PROMT


    1. Возможности машинного переводчика семейства PROMT.

С начала 1990-х гг. на рынок систем ПК выходят отечественные разработчики.  В июле 1990 года на выставке PC Forum в Москве была представлена первая в России коммерческая система машинного перевода под названием PROMT (PROgrammer's Machine Translation). В 1991 г. было создано ЗАО "ПРОект МТ", и уже в 1992 г. компания "ПРОМТ" выиграла конкурс NASA на поставку систем МП (ПРОМТ была единственной неамериканской фирмой на этом конкурсе). В 1992 г. "ПРОМТ" выпускает  целое семейство систем под новым названием STYLUS для перевода с английского, немецкого, французского, итальянского и испанского языков на русский и с русского на английский, а в 1993 г. на базе STYLUS создается первая в мире система МП для Windows. В 1994 г. вышла версия STYLUS 2.0 для, а в 1995-1996 гг. представлено третье поколение систем машинного перевода, полностью 32-разрядных STYLUS 3.0 для Windows 95/NT, одновременно с этим успешно завершена разработка совершенно новых, первых в мире русско-немецкой и русско-французской систем МП.

В 1997 г. подписано соглашение с французской фирмой Softissimo о создании систем перевода с французского языка на немецкий и английский и обратно, а в декабре этого года была выпущена первая в мире система немецко-французского перевода. В этом же году компания "ПРОМТ" компания выпустила систему, реализованную по технологии Гигант — для поддержки нескольких языковых направлений в одной оболочке, а также специальный переводчик для работы в Интернете WebTranSite.

В 1998 г. выпускается целое созвездие программ под новым названием PROMT 98. Через год компания ПРОМТ выпустила два новых продукта: уникальный пакет программ для работы в Интернете - PROMT Internet,  и переводчик для корпоративных почтовых систем — PROMT Mail Translator. Для корпоративных клиентов разработаны также специальные серверные решения – корпоративный сервер переводов PROMT Translation Server (PTS) и Интернет-решение PROMT Internet Translation Server (PITS). В 2000 г. "ПРОМТ" обновила всю линию своих программных продуктов, выпустив МП системы нового поколения: PROMT Translation Office 2000, PROMT Internet 2000 и Magic Gooddy 2000. 

В основе всех продуктов ПРОМТ лежит единое переводческое ядро – система анализа входного текста и синтез связного перевода на выходе; в них тоже реализованы общие принципы автоматизации перевода. Лингвистический
редактор ПРОМТ позволяет переводить документы, проводить настройку на тематику документа и позволяет редактировать текст. Программа обеспечивает быстрый перевод, поддерживая практически все текстовые редакторы. Размер переводимого текста ограничен только ресурсами самого компьютера.

Переводчик можно применять в двух режимах: без настроек для оперативного чернового перевода (включается только базовый словаря) и с дополнительной настройкой (подключение дополнительных тематических словарей) для обеспечения более качественного перевода. Программа включает более 100 специализированных словарей, что даёт возможность сделать перевод более точным, однако даже большое количество специализированных словарей не может заменить пользовательского словаря.

Уникальной технологией реализованной в последних версиях компании ПРОМТ является механизм ассоциативной памяти (АП). Дело в том, что многие документы содержат часто встречающиеся одинаковые обороты и даже фрагменты текста, которые логично переводить единожды и впоследствии применять готовый перевод. В базе переводов АП сохраняются сегменты оригинального и переведенного текстов, которые используются при необходимости перевести аналогичный фрагмент текста. Это обеспечивает возможность обучения системы и сохранения результатов труда пользователя для последующего применения.

Полезная особенность программ последнего поколения – способность исключать из процесса перевода имена собственные с возможностью их транслитерации. Еще одн способ настройки заключается в выборе лингвистических алгоритмов. Для каждого направления перевода существует свой список алгоритмов, которые может настроить пользователь. ( № 8,5)

Система PROMT XT осуществляет перевод по следующим направлениям: англо-испанский, англо-немецкий, англо-русский, англо-французский,  испанско-английский, испанско-русский, испанско-французский, итальянско-русский, немецко-английский, немецко-русский, немецко-французский, русско-английский, русско-немецкий, русско-французский, французско-английский, французско-испанский, французско-немецкий, французско-русский. Язык интерфейса системы: английский, русский, французский, немецкий.

Системой предоставляются следующие дополнительные возможности:


  • редактирование словарных статей в пользовательских словарях (кроме некоторых специальных слов: предлогов, союзов, местоимений, некоторых омонимичных форм);

  • определение иерархии подключенных словарей (при наличии нескольких вариантов перевода система выбирает перевод из словаря, приоритет которого определен пользователем как самый высокий);

  • поиск переводов в электронных словарях (только для англо-русского и русско-английского направлений);

  • автоматическое определение тематики текста (по ключевым словам) и подключение специальных словарей;

  • установка алгоритмов перевода некоторых конструкций (например, перевод англ. you как "ты", "вы" или "Вы";

  • подключение препроцессоров (позволяющих не переводить некоторые специальные элементы, такие, как имена файлов, адреса электронной почты и веб-страниц);

  • определение зарезервированных слов (например, терминов, собственных имен), которые не будут переводиться программой

  • использование баз переводов Ассоциативной памяти (упрощенный вариант технологии Translation Memory). 

Последняя разработка компании ПРОМТ, электронный переводчик PROMT XT Office - первый продукт, реализующий новую концепцию автоматического перевода, основанную на технологии Ассоциированной Памяти. Новый уровень лингвистических алгоритмов обеспечивает улучшение качества перевода для не менее, чем 55% предложений.

PROMT XT Office решает следующие задачи:

  • Перевод документов следующих форматов: DOC, RTF, TXT, HTML. Впервые реализована возможность перевода документов в формате Adobe Acrobat.

  • Комфортная работа с иноязычными документами в приложениях Microsoft Word, Excel, PowerPoint обеспечивается благодаря интеграции программы в приложения MS Office 2000/XP и Microsoft Office System 2003.

  • Перевод электронной почты.

  • Онлайн-перевод Web-сайтов с сохранением форматирования. (№ 9)

Направления перевода: английский <-> русский, немецкий <-> русский, французский <-> русский, испанский <-> русский, итальянский -> русский, Гигант (англ.<->рус., нем.<->рус., фран.<->рус.)

Основные возможности системы перевода:


  • Перевод документов основных форматов: DOC, RTF, HTML, TXT.

  • Сохранение форматирования при переводе.

  • Сохранение результата перевода в файлах формата: RTF и TXT.

  • Перевод PDF-документов непосредственно в Adobe Acrobat 4.х/5.х и Adobe Acrobat Reader 4.х/5.х.

  • Встраивание функций перевода во все основные приложения Microsoft Office 2000/XP (Word, Excel, PowerPoint, FrontPage) и Microsoft Office System 2003*.

  • Перевод электронной почты. Автоматический перевод электронной почты в Microsoft Outlook. Маршрутизация писем по папкам.

    • Все для работы в ИнтернетеОнлайн-перевод Web-сайтов с сохранением форматирования.

    • Перевод запросов для поисковых систем и отправка на указанный сервер.

    • Настройка перевода на базе технологии SmartURL - программа сама запоминает параметры перевода страниц. При повторном посещении страницы параметры перевода восстанавливаются.

    • Создание сайтов на иностранном языке во FrontPage при помощи интегрированных переводческих модулей.

  • Перевод содержимого буфера Windows Clipboard.

  • Интеллектуальные алгоритмы самообучения системы при использовании Ассоциированной Памяти. Ассоциированная Память (АП) - работает по принципу накопления: в процессе перевода сохраняется исходный сегмент (предложение или его часть) и его перевод. При подключении базы АП, система сравнивает каждое предложение с сохраненными в базе сегментами. Если сегмент идентичный исходному найден, он может быть использован для перевода.

  • Мощный лингвистический редактор PROMT, обеспечивающий возможность интерактивного управления переводом.

    • Удобные средства редактирования перевода - синхронная "прокрутка" оригинала и его перевода. Цветовая подсветка связанных фрагментов в оригинале и переводе.

    • Мгновенный перевод любого слова при подведении курсора мышки. Просмотр всех переводов и словоформ выделенного слова.

    • Интеллектуальные алгоритмы автоматического определения языка и тематики текста.

    • Сохранение параметров перевода в шаблонах тематики.

  • Повышение качества перевода за счет персональных настроек:

    • Возможность подключения специализированных словарей, выпускаемых компанией ПРОМТ для различных предметных областей;

    • Создание и пополнение собственных пользовательских словарей.

    • Создание списка зарезервированных слов. Резервирование слов с указанным форматом, например, выделенных курсивом. Резервирование выделенных фрагментов текста.

    • Задание признаков транслитерации незнакомых слов.

    • Выбор алгоритмов перевода (режимы перевода некоторых языковых конструкций, которыми невозможно управлять, модифицируя словарные данные).

    • Подключение макросов для обработки исходного текста и текста перевода.

    • Использование баз Ассоциированной Памяти (АП).

  • Эффективное средство настройки словарей - Dictionary Editor:

    • Возможность просмотра, редактирования, копирования, удаления и восстановления словарных статей из пользовательских словарей.

    • Различные режимы доступа к содержимому словарных статей - "Начинающий" и "Специалист".

    • Интеллектуальные алгоритмы пополнения словарей.

    • Одновременное пополнение связанных словарей в двух направлениях.

    • Возможность ввода в словарь из текстового файла и экспорта словарных статей в текстовый файл или документ RTF.

  • Большой электронный словарь для перевода отдельных слов (реализован для англо-русского, русско-английского, французско-русского, русско-французского, немецко-русского и русско-немецкого направлений перевода).

  • Поддержка внешних программ сканирования, проверки орфографии и электронных словарей.

  • Озвучивание текста при наличии установленных на компьютере средств синтеза речи, совместимых со стандартом Text-To-Speech (TTS). (№ 22,23)