Горно-Алтайский государственный университет продолжает свои исследования под руководством профессора П.В. Алексеева, которые осуществляются при поддержке Российского научного фонда и Правительства Республики Алтай. В рамках этого проекта была разработана уникальная ИТ-платформа под названием «DH-EuroTravel», открывающая новые горизонты для междисциплинарного анализа путевой прозы. Подробнее об этом можно узнать на сайте ГАГУ.
Это исследование стало первым в своей области в Республике Алтай, объединяя компьютерные методы и филологию. Платформа, созданная П.В. Алексеевым, включает специализированные скрипты на языке Python, которые позволяют интегрировать традиционные методы филологического анализа с современными инструментами цифровых гуманитарных наук. В соответствии с принципами открытой науки, код платформы, а также конфигурационные лексиконы и архитектура пайплайна были опубликованы для международного научного сообщества. Исходный код доступен на платформе GitHub по следующему адресу: GitHub. Это позволяет исследователям со всего мира не только верифицировать результаты анализа, но и использовать софт на своих собственных наборах данных.
Формирование репрезентативной базы данных стало одной из самых сложных задач для исследовательского коллектива ГАГУ. В рамках проекта был собран обширный массив путевой прозы, включающий более 200 оригинальных текстов травелогов на английском, французском и немецком языках, изданных в конце XIX — начале XX века. Этот корпус охватывает множество жанров, начиная от официальных отчетов научных и дипломатических экспедиций и заканчивая светскими путевыми заметками коммерсантов и охотничьими дневниками, а также образцами западноевропейской женской путевой прозы, в том числе английской викторианской и французской традиций.
Такой многоязычный и кросс-культурный подход необходим для преодоления границ национального восприятия и реконструкции целостной, наднациональной структуры западноевропейского имперского дискурса. Проведение традиционного филологического анализа вручную для столь обширного и лингвистически разнообразного текстового массива заняло бы десятилетия. Именно поэтому возникла необходимость в технологическом прорыве, который позволил бы перевести гуманитарные категории на язык цифр с использованием методов цифровых гуманитарных наук. Разработанная платформа может эффективно обрабатывать сотни тысяч страниц путевых нарративов и переводить их в проверяемые математические индексы и структурированные семантические матрицы.
Платформа «DH-EuroTravel» функционирует через следующий интеллектуальный пайплайн:
- Цифровая реставрация. Скрипты очищают оцифрованные исторические тексты от технических ошибок и шумов, возникающих при сканировании.
- Преодоление этнонимических ловушек. Европейские авторы прошлого часто путали народы, например, называли казахов киргизами и алтайцев-тюрок — калмыками. База данных платформы автоматически распознает и объединяет эти ложные номинации, собирая точный контекст.
- PIRO-разметка. Программа анализирует каждое упоминание сибирских народов по оригинальной четырехмерной методике, выделяя описания, эпитеты, речевые стереотипы и общую тональность образа.
- Математические фильтры. Используя статистический критерий логарифмического правдоподобия, программа оценивает значимость флуктуаций частоты слов в контекстах этнонимов, автоматически отсекая общеязыковой фон.
Программный комплекс уже продемонстрировал свою надежность в ходе тестовых испытаний. Например, во французском этнографическом травелоге были зафиксированы имперские оценки: алгоритмы выявили высокую плотность комплиментарных лексем при описании оседлого мусульманского населения, в то время как уровень стереотипизации и дегуманизации северных кочевых народов был критически низким.
Анализ британской путевой прозы показал так называемый феномен миметического Востока, где программа выявила скрытую иронию авторов и их систематическую ориентализацию на русских чиновников, которые изображаются как вторичные акторы, бесцельно копирующие внешние атрибуты европейской цивилизации.
Кроме того, в англоязычных и франкоязычных женских травелогах сетевой модуль графов продемонстрировал, что западные наблюдатели редко воспринимали автохтонный кочевой мир напрямую. Компьютерное моделирование показало, что образы коренных народов в текстах были жестко зажаты в сети посредников — между европейскими колонистами, проводниками и местными администраторами.
На финальном этапе работы к обработке численных матриц подключается большая языковая модель DeepSeek, которая, основываясь на строгих научных брифингах, помогает исследователям формулировать концептуальные выводы. Это позволяет выявлять специфику женского взгляда путешественниц, где колониальное высокомерие удивительным образом сочеталось с искренней гендерной эмпатией к сибирским женщинам разных национальностей.
Платформа «DH-EuroTravel» показала свою универсальность и в будущем может быть адаптирована для обработки любых массивов исторических документов и дневников, описывающих межнациональные контакты на имперских фронтирах. Один из ключевых векторов развития — это адаптация платформы для оцифровки и глубокого семантического анализа массивов исторических и культурных данных, связанных с наследием Республики Алтай. Использование данного инструмента позволит автоматизировать поиск уникальных этнокультурных маркеров и перевести сохранение исторической памяти региона на современный цифровой уровень.