Управление перспективных исследовательских проектов (DARPA) США выделило
компании Raytheon дополнительные 5,9 миллиона долларов на разработку
программы автоматизированного анализа и перевода документов MADCAT
(Multilingual Automatic Document Classification, Analysis and
Translation). Об этом сообщается на сайте компании.
Целью программы является создание универсального продукта, способного
оперативно переводить на английский язык содержание рукописных и
печатных документов без необходимости последующей обработки лингвистами и
аналитиками. Услуги последних допускаются лишь для более детального
изучения содержания документов.
Как пояснил глава профильного подразделения Raytheon Прем Натараджан
(Prem Natarajan), перевод с иностранных языков в полевых условиях
является медленным, ненадежным, труднодоступным и затратным.
Программа MADCAT реализована на базе портативного компьютера (ноутбука) и
оснащена модулем оптического распознавания изображений. Разработка
программы ведется последние четыре года. Сколько средств на нее было
выделено до сих пор, не отмечается.
В настоящее время на рынке коммерческих продуктов по распознаванию и
автоматизированному переводу текстов, в частности, представлены такие
программы как FineReader, Trados, Promt, а также онлайн-переводчик
Google Translate. При этом FineReader способна только распознавать
текст, а Trados является скорее ассистентом переводчика и работает с
заложенными в базу языковыми парами. Возможностей работы программ Promt и
Google Translate для понимания смысловых нюансов при переводе,
зачастую, недостаточно.
|