Наука и технологииТехнологии

Искусственный интеллект научили читать средневековые манускрипты

20:37 20 фев 2019.  742Читайте на: УКРРУС

Оцифровывать бесценные рукописи из далекого прошлого помогает простая в применении «умная» система.

Тирольский Государственный архив в Инсбруке хранит множество документов. Некоторые из них датированы XI веком. Преобразовать эти книги в электронный вид - задача не из простых. Но этот архив работает с учёными над автоматизацией оптического распознавания текстов с использованием новейших компьютерных технологий.

Как сообщает Еuronews, для оцифровки таких книг учёные, работающие над Европейским исследовательским проектом Read, разработали простую в применении систему. В её основе - специальное приложение для смартфонов. Оно срабатывает, когда страницы переворачиваются, и автоматически делает фотографии высокого разрешения каждой из них.

«Это сочетание низкотехнологичных методов и новейших технологий. Этот навес - относительно простой, низкотехнологичный аксессуар. Но он работает с высокотехнологичным приложением, установленным на смартфоне. Устройство подключено к платформе «Транскрибус». Приложение загружает изображения на сервер. А он, в свою очередь, распознаёт рукописный текст», - рассказывает Гюнтер Мюльбергер, координатор проекта READ, исследователь в области оцифровки (Инсбрукский Университет).

«Транскрибус» значительно упрощает задачи, на выполнение которых обычно уходят годы, помогая учёным в работе со сложным почерком и необычными макетами.

«Преимущество этой технологии заключается в том, что она обеспечивает связь между изображением и текстом и делает это очень простым способом. Так, расшифровщик получает полную картину. Это позволяет свести число ошибок к минимуму. Любым другим способом такого результата достичь нельзя», - уверяет Марио Кларер, профессор литературы и истории культуры Инсбрукского Университета.

Сервер, находящийся в университете, использует специальные алгоритмы машинного обучения для того, чтобы компьютер мог работать с новыми шрифтами. После того как пользователи вводят в компьютер часть манускрипта вручную, ПО самостоятельно идентифицирует новые символы, а затем завершает расшифровку остального текста, делая это с точностью, превышающей 95%.

Эта система способна расшифровать текст на любом языке. Она объединяет лингвистов, учёных, архивистов и волонтеров из многих стран. Разработчики планируют сделать «Транскрибус» коммерчески доступным пользователям по всему миру.

Натальи Братусь

Самое читаемое