«У каждого языка есть свои проблемы, — соглашается Реджина Бардзилэй. — Скорее всего, для удачной расшифровки придётся подготовить свои методы». Но, отмечает она, на разгадку угаритского языка ушли годы, а новая система справилась за немножко часов. Хотя она и не способна заменить человека, этот мощный инструмент может стать очень хорошим помощником.
Новинка могла бы также расширить универсальность машинного перевода (Google Translate управляется «от мала до велика» с 57 языками). Многие онлайн-переводчики тоже пользуются сравнением параллельных текстов на разнообразных языках. Новая система просто делает это намного лучше.
Более подробно с результатами обследования можно ознакомиться здесь.
Подготовлено по материалам Массачусетского технологического университета.
В книге «Забытые языки» (2002) Эндрю Робинсон, английский популяризатор науки, заявил, что «успешная дешифровка требует синтеза логики и интуиции, коей компьютеры не обладают и, скорее всего, никогда обладать не будут».
Реджина Бардзилэй, адъюнкт-профессор Лаборатории компьютерных наук и искусственного ума Массачусетского технологического института, её последипломный студент Бен Снайдер и сотрудник Университета Южной Калифорнии Кевин Найт (все — США) взяли это на свой счёт. Через месяц на ежегодном собрании Ассоциации вычислительной лингвистики в Швеции они изобразят новую компьютерную систему, которая в течение нескольких часов расшифровала значительную часть угаритского языка (древний представитель семитской семейства). В дальнейшем она может посодействовать не только дешифровке восьми (или около того) мёртвых языков, над которыми разрушили голову лингвисты, но и усовершенствованию машинных систем перевода вроде Google Translate.
«Интуицию» исследователи заменили несколькими допущениями. Во-первых, компьютеру предложили известный стиль, тесно связанный с угаритским. Им стал иврит. Во-вторых, была составлена карта частотности употребления алфавитных признаков в обоих языках из расчёта, что часто употребляющийся символ одного языка, скорее всего, коррелирует с символом похожего стиля, обладающим аналогичной частотностью. Здесь надо заметить, что угаритский и иврит пользовались различными порядками письменности, но в данном случае это не имеет значения, важна лишь частотность знаков.
В-третьих, языки должны иметь по крайней мере несколько слов с общественными корнями, как «main» и «mano» («рука», «кисть руки»), «homme» и «hombre» («человек», «мужчина») во французском и испанском.
Страницы:[1] 2
Вася комментирует:
Уважаемый давай зачетку
12.11.2010