Ученые Лаборатории цифровой лингвистики НИЯУ МИФИ и и Института русского языка имени В.В. Виноградова разработали лингвистическую интеллектуальную среду «Рукописное наследие Древней Руси» по рукописям XI–XVIII веков, основанную на алгоритмах искусственного интеллекта, сообщают «Известия». Система может распознавать документы допечатного периода и представлять выборку данных под конкретный запрос, передает сайт Учебного комитета.
Сейчас алгоритм обучен поиску по оцифрованным рукописям миней (церковных книг с праздничными службами), которые хранятся в российских библиотеках и музеях. В дальнейшем базу дополнят летописи, литературные произведения и другие тексты Древней Руси.
Система представляет собой комплекс программ на основе нейросетей и других алгоритмов обработки больших данных. Она поможет исследователю распознавать рукописи и производить из них выборку по различным параметрам — по времени, теме, фрагментам. Важно, что программа позволяет формулировать требования длинными фразами. Также можно указывать, в какой части рукописи следует производить выборку. Например, в основном тексте или в вязи — декоративном письме, которым оформляли заголовки и орнаменты.
«Для работы с текстами создан сетевой ресурс «Рукописное наследие Древней Руси», оснащенный специальным интерфейсом. Процедура запросов в нем обрабатывается как в обычном интернет-поисковике. Кроме того, разработана онлайн-клавиатура, которая дает возможность набирать слова старославянскими символами. Поиск выполняется по оцифрованным текстам из различных хранилищ — Российской государственной библиотеки, Исторического музея и региональных учреждений культуры, — пояснил руководитель проекта, доцент кафедры кибернетики НИЯУ МИФИ Дмитрий Демидов.