Почерк Войнича: никакой искусственный интеллект не может его расшифровать

Вопреки распространенному мнению, Уилфрид М. Войнич - не автор элегантной рукописной книги, носящей его имя, а продавец книг, который купил ее в 1912 году. Пока неизвестно, является ли рукопись Войнича книгой о колдовстве., кулинарные рецепты или пособие по лекарственным травам. С причудливыми рисунками растений, обнаженными беременными женщинами, купающимися в зеленых жидкостях, и астрологическими знаками, никто никогда не расшифровывал это - даже искусственный интеллект.

Когда это применяется к тексту, исследования обычно отклоняются вскоре после этого, потому что это не имеет смысла (или искусственный интеллект не настолько интеллектуален, как мы думали, что это было в переводе).

Неопознанные корни и растения заполняют страницы рукописи. (Источник: Getty Images / Универсальный архив истории)

Одна из последних попыток была предпринята в 2016 году, когда профессор компьютерных наук Грег Кондрак и студент Брэдли Хауэр из Университета Альберты (Канада) вычислили текст, но только несколько вещей, например, как часто появляются буквы и какие комбинации являются наиболее распространенными. Теоретически они могли бы сравнить рукопись с существующими языками и таким образом найти соответствие.

В качестве основы они использовали Всеобщую декларацию прав человека, написанную на 380 языках. Никакие нейронные сети или глубокое обучение не использовались; алгоритмы были основаны на статистическом анализе современных языков, что уже было необычно с тех пор, как рукопись была написана в 15 веке.

Тайна остается

Публикуя статью, пара сообщила, что обнаружила, что исходным языком рукописи Войнича был иврит, который впоследствии был закодирован. Многие люди задавались вопросом, как они пришли к такому выводу, поскольку ИИ не был обучен этому языку в его архаичной форме.

Хотя алгоритмы указывали на язык, они не могли оценить вероятность каждого совпадения. Это означает, что на самом деле неизвестно, был ли текст на иврите. Кондрак и Хауэр предположили, что рукопись была анаграммой, что означало, что буквы в каждом слове были перетасованы, что дало бы большую свободу при интерпретации текста - то есть это могла быть книга колдовства, кулинарные рецепты или травяной справочник,

Оператор по контролю качества испанского издательства Siloe работает над воспроизведением рукописного кодекса в Бургосе, Испания. (Getty Images / Сезар Мансо)

Использование искусственного интеллекта для разгадки тайны рукописи Войнича - и она с треском проваливается - поднимает другой вопрос: у искусственного интеллекта есть трудности с полным пониманием сложностей человеческого языка. Для главного научного сотрудника южнокорейской компании по искусственному интеллекту Mind Ai Джона Доу существует большая разница между обработкой естественного языка, подмножеством искусственного интеллекта и тем, что он называет «естественным языком мышления».

По его словам в Medium, обработка естественного языка основана на обучении компьютера манипулированию человеческим языком, и это зависит от алгоритмов машинного обучения и нейронных сетей. Это происходит, например, когда мобильный пользователь разговаривает с Алекса или Сири или когда он узнает, как закончить свои предложения (как в Gmail).

Продавец книг Уилфрид М. Войнич в своем магазине в Сохо, штат Нью-Йорк, около 1899 г. (Источник: Wikipedia Commons / Public Domain)

Будучи хорошими в том, что они делают каждый день, для Иоанна Доу ИИ «никогда не достигнет овладения языком, потому что алгоритмы не знают, что они делают». То есть ИИ должен обладать подлинным человеческим интеллектом, чтобы понимать контекст, тон и значение сказанного, и это включает в себя раскрытие тайны, скрытой на страницах рукописи Войнича.