Автоматические переводчики текста

Машинный перевод — процесс перевода текстов с одного естественного языка на другой с помощью специальной компьютерной программы. Теоретической основой начального (конец 1940-х — начало 1950-х годов) периода работ по машинному переводу был взгляд на язык как кодовую систему. Пионерами МП были математики и инженеры. Описания их первых опытов, связанных с использованием только что появившихся ЭВМ для решения криптографических задач, были опубликованы в США в конце 1940-х годов. Датой рождения машинного перевода как исследовательской области обычно считают март 1947; именно тогда специалист по криптографии Уоррен Уивер впервые поставил задачу машинного перевода, сравнив ее с задачей дешифровки. Вскоре началось финансирование исследований; в 1952 состоялась первая конференция по машинному переводу, организованная логиком и математиком Й.Бар-Хиллелом.

Помимо очевидных практических нужд важную роль в становлении машинного перевода сыграло то обстоятельство, что предложенный в 1950 английским математиком А.Тьюрингом знаменитый тест на разумность («тест Тьюринга») фактически заменил вопрос о том, может ли машина мыслить, на вопрос о том, может ли машина общаться с человеком на естественном языке таким образом, что тот не в состоянии будет отличить ее от собеседника-человека. Тем самым вопросы компьютерной обработки естественно-языковых сообщений на десятилетия оказались в центре исследований по кибернетике (впоследствии по искусственному интеллекту), а между математиками, программистами и инженерами-компьютерщиками, с одной стороны, и лингвистами — с другой установилось продуктивное сотрудничество.

В 1954 общественности были предъявлены первые результаты: фирма IBM совместно с Джорджтаунским университетом (США) успешно осуществили первый эксперимент (вошедший в историю под названием Джорджтаунского), в ходе которого система, использовавшая словарь из 250 слов и грамматику из 6 синтаксических правил, осуществила перевод 49 заранее отобранных предложений. В том же 1954 первый эксперимент по машинному переводу был осуществлен в СССР И.К.Бельской (лингвистическая часть) и Д.Ю.Пановым (программная часть) в Институте точной механики и вычислительной техники Академии наук СССР. После этого работы начались во многих информационных институтах, научных и учебных организациях страны.

Идея машинного перевода стимулировала развитие исследований в теоретическом и прикладном языкознании во всем мире. Появились теории формальных грамматик, большое внимание стало уделяться моделированию языка и отдельных его аспектов, языковой и мыслительной деятельности, вопросам языковой формы и количественных распределений лингвистических явлений. Возникли новые направления лингвистической науки — вычислительная, математическая, инженерная, статистическая, алгоритмическая лингвистика и ряд других отраслей прикладного и теоретического языкознания.

5 стр., 2046 слов

Филипас 1. Термодинамическое исследование скважин

... пласта для определения его параметров. Эти исследования также можно применять и для изучения газовых скважин. 1. Термодинамическое исследование скважин. Известно, что колебания температуры на земной ... геотерма. Термограмма - распределение температуры в работающей скважине имеет отклонения от геотермы, которые связаны с термодинамическими и гидродинамическими процессами, происходящими в продуктивном ...

Исследования по машинному переводу за свою пятидесятилетнюю историю переживали как подъемы, так и спады. В начале 1960-х годов завершился первоначальный этап в развитии МП, чему в сильнейшей степени способствовала публикация так называемой «Черной книги машинного перевода» — доклада Специального комитета по прикладной лингвистике, в котором была констатирована невозможность создания в ближайшем будущем универсальных систем высококачественного машинного перевода. Следствием этой публикации было сокращение финансирования и общее снижение интереса к проблематике МП, однако полного сворачивания исследований, в особенности теоретических, не произошло.

Новый подъем исследований в области МП начался в 1970-х годах и был связан с серьезными достижениями в области компьютерного моделирования интеллектуальной деятельности. Соответствующая область исследований, возникшая несколько позже, получила название искусственного интеллекта, а создание систем машинного перевода было осмыслено в 1970-е годы как одна из частных задач этого нового исследовательского направления.

В ходе развития идей и создания промышленных систем машинного перевода были разработаны способы автоматического морфологического анализа для основных европейских языков, методы автоматического обнаружения синтаксических структур, сформулированы требования к семантическим компонентам систем. В рамках эффективного международного сотрудничества и обмена терминологией созданы большие автоматические словари с разнообразной лексической информацией, банки терминологических данных по разным тематическим областям. Результаты работ по МП способствовали началу и развитию исследований и разработок в области автоматизации информационного поиска, логического анализа естественно-языковых текстов, экспертных систем, способов представления знаний в вычислительных системах и т.д.

В СССР в качестве головной организации по машинному переводу был в 1974 определен Всесоюзный центр переводов научно-технической литературы и документации (ВЦП), взявший на себя координацию работ в масштабе страны. Под его эгидой был проведен ряд крупных международных научных конференций по машинному переводу и проблемам научно-технического перевода. В ВЦП были созданы промышленные системы машинного перевода с английского языка на русский АМПАР (на основе исследований и разработок коллектива Ю.А. Моторина), с немецкого языка на русский НЕРПА, с французского языка на русский ФРАП, автоматические терминологические словари в помощь человеку-переводчику. Система АМПАР длительное время находилась в промышленной эксплуатации. В ВПЦ была также разработана система МП с русского языка на английский АСПЕРА. Большой вклад в разработку промышленных систем МП был сделан ленинградской общесоюзной группой «Статистика речи», а также группами специалистов по компьютерной лингвистике в Минске, Кишиневе, Махачкале, и др. На базе исследований группы «Статистика речи» были впоследствии разработаны и сейчас находятся в коммерческом использовании такие системы машинного перевода, как Stylus, Socrat и другие.

31 стр., 15272 слов

Исследование лимфатической системы

... направляется в протоки , через которые вливается в венозное русло. В лимфатических узлах и других органах лимфоидной системы лимфа подвергается биологической очистке и обновлению своего клеточного состава; здесь ...

В настоящее время в Российской Федерации продолжаются в незначительных масштабах некоторые работы по системам МП, основанным на подходе «текст-смысл-текст», не всегда явно проговариваемым лозунгом которого в момент обоснования этого подхода в 1960-х годов был «машинный перевод без перевода, без машин, без алгоритмов». Идея подхода заключалась в том, что от лингвиста требуется только декларативное описание фактов языка, а алгоритмы перевода составят программист и математик. В рамках этих исследований были получены значительные теоретико-лингвистические результаты (в частности, создана теория так называемых лексических функций, нашедшая применение в лексикографии).

1.1 Теория машинного перевода

Машинный перевод — выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. Современный машинный, или автоматический перевод осуществляется с помощью человека. Пред-редактор предварительно обрабатывает подлежащий переводу текст, интер-редактор участвует в процессе перевода, и пост-редактор, исправляет ошибки и недочеты в переведенном машиной тексте. Для осуществления машинного перевода в компьютер вводится специальная программа, реализующая алгоритм перевода, под которым понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в данной паре языков L1 — L2 при заданном направлении перевода (с одного конкретного языка на другой).

Система машинного перевода включает в себя двуязычные словари для обеспечения передачи эквивалентных, вариантных и трансформационных переводных соответствий, а также алгоритмические средства грамматического анализа. Они снабжены необходимой грамматической информацией (морфологической, синтаксической и семантической).

Имеются также отдельные системы машинного перевода, рассчитанные на перевод в рамках трех и более языков, но они в настоящее время являются экспериментальными. Наиболее распространенной является следующая последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода:

1. На первом этапе осуществляется ввод текста и поиск входных словоформ во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме. В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы.

2. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области; определение основных грамматических характеристик элементов входного текста, производимое в рамках входного языка; разрешение омографии; лексический анализ и перевод лексем. Обычно на этом этапе однозначные слова отделяются от многозначных. После чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие/отсутствие контекстных определителей значения.

3. Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типа сани, ножницы глагол должен стоять в форме множественного числа, притом, что в оригинале может быть и единственное число).

5 стр., 2103 слов

Средства автоматизированного перевода

... программы, обеспечивающие автоматизацию перевода, можно разделить на следующие группы: электронные словари программы и системы памяти переводов (TM-программы) программы машинного перевода Электронный словарь - словарь в ... текста и поиск входных слов в конкретной грамматической форме (например дательного падежа множественного числа) во входном словаре (словаре языка, с которого производится перевод) ...

4. Синтез выходных словоформ и предложения в целом на выходном языке.

В зависимости от особенностей морфологии, синтаксиса и семантики конкретной языковой пары, а также направления перевода общий алгоритм перевода может включать и другие этапы, а также модификации названных этапов или порядка их следования, но вариации такого рода в современных системах, как правило, незначительны. Анализ и синтез могут производиться как пофразно, так и для всего текста, введенного в память компьютера; в последнем случае алгоритм перевода предусматривает определение так называемых анафорических связей.

Действующие системы машинного перевода ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языком. Качество машинного перевода зависит от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эффективности программного обеспечения. Современные аппаратные и программные средства допускают использование словарей большого объема, содержащих подробную грамматическую информацию. Информация может быть представлена как в декларативной, так и в процедурной (учитывающей потребности алгоритма) форме.

Современный машинный перевод следует отличать от использования компьютеров в помощь человеку-переводчику. В последнем случае имеется в виду автоматический словарь, помогающий человеку быстрее подбирать нужный переводной эквивалент. Хотя и в том, и в другом случае компьютер работает вместе с человеком (переводчиком или редактором).

В содержание термина «машинный перевод» входит представление о том, что большую часть работы по переводу и отысканию переводных эквивалентов и переводных соответствий машина берет на себя, оставляя человеку лишь контроль и исправление ошибок, в то время как компьютерный словарь в помощь человеку — это чисто вспомогательное средство для быстрого нахождения переводных соответствий. Однако, в такого рода словарях в ограниченной степени могут быть реализованы и некоторые функции, присущие системам машинного перевода. В практике переводческой деятельности и в информационной технологии различаются два основных подхода к машинному переводу. С одной стороны, результаты машинного перевода могут быть использованы для поверхностного ознакомления с содержанием документа на незнакомом языке. В этом случае он не требует тщательного редактирования. Другой подход предполагает использование машинного перевода вместо обычного «человеческого». Это предполагает тщательное редактирование и настройку системы перевода на определенную предметную область. Здесь играют роль полнота словаря, ориентированность его на содержание и набор языковых средств переводимых текстов, эффективность способов разрешения лексической многозначности, результативность работы алгоритмов извлечения грамматической информации, нахождения переводных соответствий. На практике перевод такого типа становится экономически выгодным, если объем переводимых текстов достаточно велик, если тексты достаточно однородны, словари системы полны и допускают дальнейшее расширение, а программное обеспечение удобно для постредактирования. Такого рода системы машинного перевода используются в организациях, потребности которых в оперативных и качественных переводах достаточно велики.

34 стр., 16694 слов

Расчеты в строительных работах

... канализации, отопления, вентиляции, газоснабжения строительных конструкций и так далее. 3 часть – правила производства и приёмки строительных работ содержат главы, касающиеся общих ... устанавливается нормативными документами. Проектная организация – организация, разрабатывающая на договорной основе проектно-сметную документацию. Упрощённая организационная структурная модель строительства. 1.3 ...

1.2 Проблемы машинного перевода

Проблема автоматического (машинного) перевода текстов возникла более двух десятков лет назад. Ее суть сводится к построению автомата, на вход которого поступает текст на одном естественном языке (например, немецком), а на выходе порождается текст на другом языке (например, английском).

Сейчас в роли упомянутого автомата используются электронные вычислительные машины, для которых разрабатываются алгоритмы перевода и словари.

Современный этап развития машинного перевода может быть охарактеризован как этап синтаксического пословного перевода. Основной единицей смысла является слово, а грамматические формы и порядок следования слов в порождаемом тексте определяются на основе синтаксических связей между словами в тексте-оригинале. По аналогии со сложившимися традициями словари для автоматического перевода строятся преимущественно как словари слов (доля словосочетаний в них невелика).

Между тем в естественных языках слово не является единственной единицей смысла. В них одновременно используется несколько уровней семантических единиц (уровень морфем, уровень слов, уровень словосочетаний, уровень предложений и др.), причем смысл единиц более высокого уровня не всегда может быть определен исходя из смысла единиц более низкого уровня. Следовательно, и словари для автоматического перевода должны содержать единицы различных уровней.

Многовековой опыт общения народов, говорящих и пишущих на различных языках, свидетельствует о том, что хороший переводчик должен не только понимать смысл переводимого текста, но и владеть фразеологическим богатством языка, на который осуществляется перевод. Таким образом, ручной перевод текстов представляет собой скорее фразеологический, чем пословный. Это обстоятельство нужно учитывать при автоматическом переводе.

Качественный машинный перевод научно-технических и деловых текстов может быть построен на основе использования комплексов словарей, включающих в свой состав семантические единицы различных уровней слова, словосочетания, предложения. Ведущее место должны занимать словосочетания, так как в указанных текстах наименования понятий чаще всего выражаются словосочетаниями и значительно реже отдельными словами. В процессе перевода должно соблюдаться правило предпочтения, согласно которому, прежде всего, следует вычленять и переводить семантические единицы высших уровней, а к единицам более низких уровней обращаться во вторую очередь и только в том случае, если нет иной возможности выполнить перевод.

Важное место в системах машинного перевода должна занимать автоматизированная словарная служба, в задачу которой входит создание и ведение (дополнение, корректировка).

Роль человека в автоматизированной словарной службе будет заключаться в разметке иностранных текстов с целью выделения из них элементов словарей и назначении последним соответствующих эквивалентов на выходном языке. Разметка текстов может быть переложена и на машину.

31 стр., 15106 слов

Дипломная работа особенности синхронного перевода

... настоящей работы обусловлена следующими факторами: 1) большой спрос на синхронный перевод на международных мероприятиях большого и малого масштаба; 2) распространение синхронного перевода во ... оборудованием. В зарубежной литературе, выделяется работа Б. Мозер-Мерсер [1998] — первое исследование когнитивной нагрузки при синхронном переводе. Для исследования аспекта психофизиологической нагрузки ...

В настоящее время проблема машинного перевода в полном объеме еще не решена. Для ее решения необходимы не только глубокие теоретические исследования, но и большая по объему экспериментальная работа.

Исследования в области машинного перевода следует отнести к разряду фундаментальных исследований. Их нужно вести не только и не столько потому, что это позволит в будущем сэкономить средства на переводах иностранных текстов и облегчить процесс обмена научно технической и деловой информацией между различными странами. Они необходимы как один из наиболее эффективных путей поиска технических решений по ряду проблем автоматической обработки информации, а уровень развития средств и методов автоматической обработки информации оказывает непосредственное влияние на темпы научно-технического прогресса. В любом случае, бум, связанный с появлением простейших электронных словарей, позволяющих относительно быстро произвести поиск того или иного слова, уже в прошлом. С развитием технологии систем OCR, о которых я уже упоминала, стали разрабатываться автоматизированные системы машинного перевода.

перевод текст машинный компьютерный

2 .1 Оффлайн переводчики

Magic Gooddy — самый универсальный семейный переводчик. Он вполне годится для перевода учебных текстов, писем, руководств к программам, интерактивной справки, и многого другого, вплоть до кулинарных рецептов. Те, кому уже приходилось сталкиваться с «Волшебником Гудди», настоятельно рекомендуют эту программу детям. Для них она окажется не только помощником и подсказчиком при выполнении домашних заданий по английскому языку. Magic Gooddy является ценным дополнением к обучающим программам, главным образом благодаря возможности читать вслух произвольные тексты. Он пробудит в детях интерес к иностранным языкам, а возможно, и к нелегкому труду переводчика. Что касается качества перевода, скорее всего у вас не будет проблем с переводом руководства к кухонному комбайну, кулинарного рецепта или письма.

«Коперник» лучше всего подойдет для домашнего офиса профессионального переводчика. Он обладает достаточными возможностями для подготовки переводных текстов высокого качества. Программа хорошо переводит тексты самых разнообразных тематик, иногда даже без дополнительных словарей. В некоторых случаях после подключения словарей и несложного постредактирования удается получить переводы, удовлетворяющие всем правилам грамматики и стилистики русского языка. Кроме того, эта программа поддерживает четыре языка, в том числе украинский, что в последнее время весьма актуально. К тому же единственная система, которая может работать с таким же набором языков, — Language Master 98 — стоит на порядок дороже. А интеграция с Word и функция выбора вариантов перевода слов позволяют значительно сократить затраты времени на постредактирование.

«Сократ Персональный 3.0.3» — это предельно простая система для ознакомительного перевода небольших фрагментов текста. Ее козыри — компактность и наличие встроенного электронного словаря, она нетребовательна к квалификации пользователя и максимально автоматизирована. Качество перевода этой системы не всегда высокое, но зато мало зависит от тематики текста. Соответственно, эта программа найдет применение при интенсивной работе с разнообразными иностранными текстами на ознакомительном уровне. Лучше всего поддаются переводу с ее помощью тексты интерактивной справки. Их смысл удается понять во всех случаях, а большинство предложений построены грамотно. Также хорошие результаты можно получить при работе с деловыми письмами — здесь сказываются хорошая сбалансированность словаря, большой запас экономической лексики, а также строгость и шаблонность делового стиля речи, под который, в частности, и настраивался программный алгоритм «Сократа». Удовлетворительными можно считать результаты работы с документацией к программам и руководствами к бытовым приборам, однако, понять их содержание, как правило, можно. Слабым местом программы являются научные тексты, личная переписка, разговорные темы и особенно руководства к компьютерным играм. В первом случае сказывается отсутствие в составе «Сократа» словарей специальных терминов. Остальные же представляют собой естественное затруднение для всех систем машинного перевода, вызванное неформализованной лексикой, сложностью оборотов и стилистическим разнообразием указанных текстов.

4 стр., 1506 слов

Принцип автоматического исполнения программ в ЭВМ

... о разработке проблемы автоматического исполнения программ в ЭВМ, приходиться признать, что многие вопросы требуют дальнейшего исследования. 1. ОБЩИЕ ПРИНЦИПЫ РАБОТЫ ПК ... в программе организуется выполнение циклов и подпрограмм). Более того, команды одной программы могут быть получены как результаты исполнения другой программы. На этом принципе основаны методы трансляции – перевода текста программы ...

Компания ПРОМТ — мировой лидер в сфере лингвистических IT-решений для корпораций и частных пользователей с центром разработки в России. Системы перевода и словари PROMT обеспечивают перевод текстов с английского, русского, немецкого, французского, испанского, португальского, итальянского и литовского языков, поддерживая 26 направлений перевода. Клиентами ПРОМТ являются более 10000 компаний мира и миллионы частных пользователей. PROMT Professional 9. — бизнес-решение с максимальными возможностями для управления качеством перевода. PROMT Professional 9.0 позволяет быстро и качественно перевести документ, сайт или сообщение, а также создавать и объединять корпоративные базы переведенных текстов, что удобно при работе с типовыми документами — например, договорами или инструкциями. Использование PROMT Professional 9.0: рекомендовано для перевода документов в приложениях Microsoft Office 2000-2007 (Word, Excel, Outlook, PowerPoint) и Adobe Acrobat, Adobe Professional, для перевода web-ресурсов в браузерах Internet Explorer и MozillaFirefox, для работы с текстами, содержащими специализированную или отраслевую лексику и термины. Переводчик PROMT Professional поставляется в 2 комплектациях: Англо-русско-английской и Гигант. PROMT Freelance 9.0 — инструмент для автоматизации процесса перевода текстов, предназначенный для переводчиков, работающих вне офиса. Работа с PROMT Freelance 9.0 рекомендуется для поддержки работы бюро переводов или отдела переводов компании. PROMT Language Service Provider (LSP) 9.0- новый продукт в линейке корпоративных решений PROMT, позволяющий повысить эффективность работы бюро переводов или отдела переводов компании. Он подходит для коллективной работы над переводческими проектами в локальной сети. Для поддержки проектов по переводу технической документации, контрактов и других типовых документов; поддержки корпоративного документооборота, включающего документы на иностранных языках; для работы с корпоративными базами Translation Memory, и перевода больших объемов информации с высоким качеством. Переводчики для пользователей всех возрастов и уровней владения компьютером. Эти программы легко освоить, а получить с их помощью необходимый перевод можно в считанные секунды. Обратите внимание на комплекты программ, состоящие из программы-переводчика и словарей PROMT. С комплектом программ вы сможете быстро получить перевод любого объема — от одного слова до целого текста.

5 стр., 2296 слов

«Фразеологические словари. Словари антонимов, синонимов,омонимов, ...

... нем. Школьный фразеологический словарь русского языка В. П. Жуко­ва (1980) адресован учащимся и содержит наиболее употребительные фразеологизмы русского языка. отдельные слова русского языка; свободные словосочетания русской речи; пословицы русского языка; фразеологические единицы русского языка; иноязычные фразеологизмы. ...

PROMT Standard 9.0 ГИГАНТ + 123 словаря Универсальные возможности для быстрого перевода любого объема информации.PROMT Standard ГИГАНТ + Большой электронный словарь = комплект программ для работы с любой информацией на 6 европейских языках, включающий в себя переводчик текстов и электронный словарь для быстрого перевода слов по 123 тематикам. тот комплект программ предоставляет пользователю универсальные возможности для работы с информацией из любой среды — электронной почты, ICQ, документов Microsoft Office и PDF. Программы PROMT, входящие в комплект, поддерживают 6 европейских языков и помогают в переводе любого объема информации — от целого текста до одного слова. Вы можете выбрать способ перевода, наиболее подходящий для конкретной задачи: Если вам нужен быстрый перевод целого текста — обратитесь к программе-переводчику PROMT Standard ГИГАНТ Если вам нужно быстро перевести незнакомое слово или словосочетание, загляните в Большой электронный словарь Комплект программ поддерживает 6 основных европейских языков: английский, немецкий, французский, итальянский, испанский, русский. Вы можете переводить сообщения в MS Outlook , тексты, PDF-документы, ICQ сообщения. Создавать собственные словари и использовать готовые специализированные словари. PROMT 4U версия 9.0 — программа-переводчик текстов, позволяющая быстро понять смысл переводимой информации. Этот переводчик разработан для частных пользователей всех возрастов. Работать с ним удобно и просто. Мы рекомендуем PROMT 4U версия 9.0 для перевода сообщений в ICQ, Skype, QIP, MSN Messenger , для перевода сайтов в Internet Explorer, Mozilla Firefox, для общения в международных социальных сетях и интернет-сообществах , для быстрого понимания сути текстов и документов, написанных на иностранных языках. Компания ПРОМТ разработала программы-переводчики для мобильных устройств — коммуникаторов, КПК и смартфонов. С технологиями PROMT общение становится по-настоящему свободным и мобильным: функция перевода, встраиваемая в программы мобильных устройств, позволяет получить перевод необходимой информации в любой точке мира, где есть доступ к интернету и мобильной связи. PROMT Mobile Английский и Немецкий. PROMT Mobile + PROMT VER-Dict — комплект программ для мобильных устройств на платформе Windows Mobile, включающий в себя переводчик текстов и электронный словарь для быстрого перевода слов по 108 тематикам. Первая версия переводчиков PROMT для смартфонов, КПК и коммуникаторов. Быстрый и точный перевод текстовых документов, SMS-сообщений и электронной почты, Web-сайтов или диалога с иностранцем. Поддерживает платформы Windows Mobile 2003/ 5.0/ 6.0. Если вам нужно быстро перевести незнакомое слово или выражение, загляните в большой электронный словарь PROMT Ver-Dict. Promt система перевода текстов Компания ПРОМТ — инновационно-технологическая компания, основанная в 1991 году. Основная деятельность компании — исследования в области естественных языков и разработка технологий машинного перевода (МП).

36 стр., 17534 слов

Обогащение словаря детей старшего дошкольного возраста посредством экскурсий

... 1.2 Природа как средство обогащения словаря детей дошкольного возраста Развитие словаря дошкольников - актуальная проблема методики развития речи. Содержание словарной работы в дошкольном учреждении определяется программой развития и воспитания детей. Одним из путей ее ...

Использование современных достижений в области лингвистической науки в сочетании с технологическим совершенством процесса разработки позволило компании ПРОМТ стать одним из мировых лидеров в области разработки систем машинного перевода и словарей для европейских языков. PROMT — это программа, представляющая собой профессиональную среду для перевода и мощный лингвистический редактор с широким набором функций настройки перевода.

PROMT — это единая среда переводчика, в которой можно не только переводить, но также и редактировать перевод, работать со словарями для всех языковых направлений одновременно. Эта программа позволяет выполнять как простой и быстрый, так и сложный профессиональный перевод текста, а также выполнять лингвистический анализ перевода, который затем можно использовать для улучшения качества перевода других текстов сходной тематики. PROMT — гибкая система, настраиваемая на перевод конкретного текста. Для этого предусмотрена возможность подключения специализированных предметных словарей, поставляемых компанией ПРОМТ, а также создания собственных пользовательских словарей. Удобным средством настройки системы является также имеющаяся возможность выбора тематики документа, автоматически определяющей, какие словари подключать, какие слова оставить без перевода и как обрабатывать специальные конструкции типа электронных адресов, даты и времени. Широкие возможности повышения качества перевода появляются за счет использования баз переводов Ассоциированной памяти, подключения макросов и настройки алгоритмов перевода.В программе PROMT можно как переводить тексты, которые находятся в файлах, так и непосредственно набирать их и тут же переводить.Существует еще одна программа — это утилита QTrans, на сегодняшний день поставляемая только в комплекте с PROMT 98. В ней реализованы довольно мощные функции перевода и предельно простой пользовательский интерфейс. К тому же, объединив QTrans с новой коллекцией тематических словарей под названием «Домашняя», компания ПРОМТ могла бы предложить отличный продукт, удовлетворяющий и начинающих, и более опытных пользователей.

2. 2 Онлайн-переводчики

Сейчас наблюдается новый всплеск интереса к системам МП в связи с развитием сети Интернет. Миллионы людей, говорящих на разных языках, оказались в едином информационном пространстве. Доминирует в Сети английский язык, но есть пользователи, которые им не владеют, как, впрочем, есть множество Web­страниц, написанных не по-английски. Для облегчения просмотра страниц Интернет на незнакомом пользователю языке появились дополнения к браузерам, которые осуществляют немедленный перевод выбранных пользователем фрагментов просматриваемой Web­страницы. Достаточно лишь выделить часть текста мышкой и перенести ее на специальную панель либо нажать указателем на специальную кнопку меню. Примером такого переводчика является система Web Trans Site фирмы ПРОМТ, созданная на базе программы Stylus, которая подключается как к браузеру Netscape Navigator, так и к браузеру Microsoft Internet Explorer.

Онлайновый перевод информации в Интернете становится все более популярным. Интернет стремительно превращается из преимущественно англоязычной в многоязычную среду, что вынуждает владельцев Web-сайтов предоставлять информацию на нескольких языках. Наиболее часто к услугам МП прибегают информационные и поисковые сайты, которые стремятся привлечь на свои страницы разноязычных пользователей.

Интересной особенностью Web-сайтов, знакомящих с программами МП, электронными словарями и другими программами лингвистической поддержки, является то, что с работой многих программных продуктов можно познакомиться в интерактивном режиме, используя версию, установленную на сервере и имеющую шлюз для удаленного общения через Web-интерфейс. На сервере Web-издательства «ИнфоАрт» организована интерактивная демонстрация словарей Lingvo и «МультиЛекс». Вы можете ввести слово или словосочетание и мгновенно получить перевод, толкование, примеры употребления и устойчивые словосочетания.

Что же посоветовать пытливому читателю, решившемуся на штурм языкового барьера в Интернет? Его оружием могут стать WebTranSite 98, WebView, PROMT Internet или Socrat Internet. Наиболее универсальным из них является PROMT Internet. Купив этот пакет, вы получите сразу несколько программ для перевода Web-страниц, и не только их. Можно с уверенностью сказать, что возможностей данного набора приложений вполне достаточно для полноценной работы с документами на английском, французском и немецком языке.

Если вы предполагаете использовать универсальную переводящую программу WebTranSite 98 или

Что касается WebView, то это — инструмент пользователя интернета, много времени проводящего на иноязычных серверах и не желающего пропустить ни одной крупицы информации. Программа WebView — полноценный браузер для загрузки и просмотра Web-страниц. Так что, используя его при работе с Интернет-документами на иностранном языке, вы можете даже отказаться от привычных Internet Explorer и Netscape Navigator. WebView — это своеобразный «гибрид» браузера Internet Explorer 4.0 и системы машинного перевода PROMT 98. Полученная в результате такого «скрещивания» программа позволяет переводить Web-страницы, полностью сохраняя их внешний вид. WebView может работать с тремя иностранными языками: английским, французским и немецким, причем переводит как с любого из них на русский, так и в обратном направлении. Функции перевода в этой программе шире, чем в WebTranSite 98, и их набор практически такой же, как в PROMT 98. Так, в дополнение к рассмотренным выше операциям со словарями WebView позволяет вводить в них новые слова и фразы. Чтобы облегчить вашу задачу, программа составляет список незнакомых ей выражений, встретившихся в тексте, подсчитывает количество появлений каждого из них и выводит результаты в специальном диалоговом окне. Выбрав любое из этих слов, вы можете либо запретить его перевод, либо добавить в пользовательский словарь. Единственный недостаток, который портит хорошее впечатление о WeView — это то, что программа иногда зависает при несовпадении направления перевода и языка оригинальной страницы. Однако программы WebTranSite 98 и Web View по отдельности уже сняты с производства. Да и экономия по сравнению с покупкой PROMT Internet не так уж велика.

Socrat Internet — это аналог «переводящего браузера» WebView. С ее помощью можно выполнять «синхронный» перевод Web-страниц с сохранением их форматирования. Однако если WebView по возможностям настройки опций перевода ничем не уступает профессиональной системе PROMT 98, то в Socrat Internet никаких средств управления этими функциями нет вообще. Браузер от компании «Арсеналъ» не позволяет подключать тематические словари, что сильно ухудшает качество перевода специальных текстов (их, кстати, в Интернет очень много).

Простота использования, которой так добивались разработчики, отнюдь не пошла на пользу программе, потерявшей гибкость и управляемость, такие важные для систем машинного перевода. В итоге Socrat Internet существенно уступает продуктам «ПРОМТ» по многим параметрам, в том числе и по самому важному — качеству выходного текста.

2.3 Электронные словари

Электронные словари (ЭС) начали разрабатываться значительно раньше, чем аль тернативные им системы МП, поэтому в настоящее время на рынке программного обеспечения имеется чрезвычайно широкий выбор словарей — от самых простейших (например, DIC) до мощных систем, объединяющих в одной программной оболочке несколько лексических баз данных — специализированных тематических словарей, последовательность подключения которых определяется пользователем (LINGVO).

Выбор того или иного программного продукта зависит исключительно oт аппаратных возможностей компьютера, которым располагает пользователь, финансовых соображений и конкретных условий, в которых работает переводчик.Потенциальную аудиторию этих программ можно определить совершенно точно — это учащиеся и студенты, использующие словарь как одно из пособий при изучении иностранного языка, а также домашние и бизнес-пользователи, которым нужен универсальный и простой в применении словарь-справочник для эпизодического перевода деловых бумаг и корреспонденции. Ниже представлена классификация электронных словарей по их основным техническим и эксплуатационным характеристикам. Всю совокупность ЭС можно подразделить по следующим критериям.

1. По используемой операционной системе. Наиболее простые электронные словари (DIC) работают под управлением ОС MS-DOS, начиная с версий 2.21 и 3.30, что позволяет их использовать практически на любых IBM-совместимых персональных компьютерах, включая XT, АТ-286. Наиболее сложные многооконные и многофункциональные ЭС, позволяющие в одной оболочке подключать различные тематические базы данных, работают под управлением ОС WINDOWS 3.11, WINDOWS NT, WINDOWS 95 и т.д. Естественно, что для их успешного функционирования необходим более мощный компьютер (типа AT-486DX) с оперативной памятью не менее 8 МБ.

2. По способу загрузки. Можно подразделить на нерезидентные и резидентные. К первым относятся простейшие программы (например, подстрочечный словарь DIC), которые работают только в собственной среде и не вызываются из других оболочек, например из текстовых редакторов. В большинстве случаев они функционируют в режиме автоматического («пакетного») перевода. Вторые загружают свое ядро в оперативную память компьютера (например, «LINGVO for DOS») и могут вызываться в любой момент работы компьютера, например из любого текстового редактора, при помощи нажатия комбинации «горячих клавиш» — клавиш оперативного вызова. Эти словари обеспечивают работу переводчика в интерактивном режиме.

3. По количеству подключаемых словарных баз (словарей).

Ранние версии ЭС позволяли подключать только один словарь. Современные программы, например «Система электронных словарей LINGVO», независимо от того в какой ОС они работают, позволяют подключать до нескольких десятков словарных баз и устанавливать приоритет последних.

4. По возможностям расширения словарной базы. Устаревшие ЭС не имели возможности расширения словарных баз пользователем, современные версии, например LINGVO 4.6 и выше, имеют специальные утилиты для создания пользователем собственных и расширения существующих словарей.

5. По режиму перевода. Можно выделить два основных режима перевода: автоматический пакетный (подстрочечный) и интерактивный (режим «запрос — ответ»).

В первом случае программа вызывается с указанием имени текстового файла, который необходимо перевести, или маски для целой группы текстовых файлов, предназначенных для перевода. Далее автоматически, без участия переводчика, производится прямой перевод каждого отдельного слова с выводом на экран монитора или на печатающее устройство только переведенных слов или исходного текста, под каждым переведенным словом которого будет стоять его значение на русском языке, под теми словами, которых не оказалось в ЭС обычно ставится знак «?». Такой режим называется подстрочечным. Словарные базы подобных ЭС весьма ограниченны, качество перевода оставляет желать лучшего. Подобные программные продукты вряд ли смогут оказать помощь профессиональному переводчику.

Во втором случае программа работает следующим образом. После загрузки резидентной части программы в оперативную память компьютера, пользователь, работая, например, в текстовом редакторе либо непосредственно в оболочке словаря, вводит с клавиатуры неизвестное слово на языке оригинала, а затем, выделив его, чаще при помощи «мыши», нажатием комбинации «горячих клавиш» активизирует ЭС, который заменяет текст оригинала на русскоязычный перевод. Время доступа к переводу составляет примерно 0,2 секунды, что значительно ускоряет работу переводчика. Именно такие электронные словари, с учетом возможности расширения и одновременного подключения нескольких словарных баз, могут значительно облегчить и ускорить работу переводчика любого уровня профессионализма.

Заключение

Перспективы развития машинного перевода связаны с дальнейшей разработкой и углублением теории и практики перевода, как машинного, так и «человеческого». Для развития теории важны результаты сопоставительного языкознания, общей теории перевода, теории закономерных соответствий, способов представления знаний, оптимизации и совершенствования лингвистических алгоритмов. Новые и более эффективные словари с необходимой словарной информацией, строгие теории терминологизации лексики, теория и практика работы с подъязыками помогут повысить качество перевода лексических единиц. Формальные грамматики, ориентированные на перевод, дадут возможность оптимизировать алгоритмы нахождения переводных соответствий в данной коммуникативной ситуации, которая может быть описана в рамках соответствующих прикладных теорий представления знаний. Наконец, новые возможности программирования и вычислительной техники также будут вносить свой вклад в совершенствование и дальнейшее развитие теории и практики машинного перевода.

1. Англо-русский словарь. Под рук. Мюллера В.К. — М.Русский язык, 1985.

2. Аристов Н.В. Основы перевода. — изд-во литер. на иностр. языках, 1959.

3. Архипов А.Ф. Самоучитель перевода с немецкого языка на русский.

4. Бархударов Л.С. Язык и перевод. — М.: Международные отношения, 1975.

5. Бреус Е.В. Основы тории и практики перевода с русского языка на английский. — М.: УРАО, 1998.

6. Ванников Ю.В. Языковая сложность текста как фактор трудности перевода. — М.: Всесоюзный центр переводов, 1988.

7. Вейзе А.А, Киреев Н.Б., Мирончиков К. Перевод технической литературы с ангилийского языка на русский. — Минск, 1997.

8. Вейзе А. А., Мирончиков И. К. Перевод технического текста с английского языка на русский. — Мн.: МГЛУ, 1995.

9. Васильев А. (Компьютер на месте переводчика).

Подводная лодка. — 1998.

10. Винокуров А.А.,Чуканов В.О.Новый метод оценки машинного перевода. Тенденции и перспективы — Сборник статей: М., Международная академия информатизации, 1997.

11. Гвишиани Н.Б. Язык научного общения. -М.: Высш. шк.; 1986.

12. Левин А. Самоучитель работы на компьютере. — 4-е изд., испр. И доп. М.: Ноллидж, 1997.

13. Каничев М. (Встреча компьютерных толмачей).

// Мир ПК. — 1998, № 8.

14. Климзо Б.Н. Перевод патентов. — М.: МГПИИЯ им. М.Тореза, 1976.

15. Рецкер Я.И. Теория перевода и переводческая практика. — М.: Международные отношения, 1974.