
В России появился инновационный онлайн-калькулятор, который позволяет быстро определить уровень сложности текстов на малых языках страны. Разработкой занималась команда Центра языка и мозга Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ). Их цель — сделать обучение и научную работу на адыгейском, бурятском, удмуртском и других языках более доступными и эффективными.
В стране насчитывается более 150 языков, и многие из них имеют ограниченное число носителей. Например, на адыгейском говорят около 80 тысяч человек, а на бурятском, осетинском и удмуртском — от 250 до 350 тысяч. Несмотря на это, такие языки официально признаны государственными в республиках России. Для их сохранения важно не только поддерживать традиции, но и внедрять современные цифровые решения.
Языковое многообразие
В 2025 году в России был принят президентский указ, который определил стратегию государственной языковой политики. Документ подчеркивает необходимость развития и практического применения языков народов страны. Одним из ключевых направлений стала цифровизация — создание инструментов, способных облегчить работу с малоресурсными языками.
Новый калькулятор сложности текстов — это шаг к тому, чтобы преподаватели, исследователи и студенты могли подбирать материалы, соответствующие уровню владения языком. Инструмент анализирует тексты по нескольким критериям: длина и частотность слов, процент лексики из наиболее употребляемых слов, а также распределение частей речи. Такой подход позволяет учитывать уникальные особенности каждого языка.
Технологии и формулы
В основе работы калькулятора лежит адаптированная формула удобочитаемости Флеша. Оригинальная версия этой формулы была создана для английского языка, где структура слов и предложений отличается от многих языков России. Например, в адыгейском слова длиннее, а морфология сложнее. Поэтому ученые пересчитали коэффициенты специально для каждого языка, чтобы повысить точность оценки.
В 2025 году Ульяна Петрунина и Нина Здорова провели отдельное исследование, в ходе которого адаптировали формулу Флеша для адыгейского языка. Это позволило калькулятору учитывать не только длину слов и предложений, но и такие параметры, как лексическая плотность, разнообразие и динамичность текста.
Практическое применение
Разработчики отмечают, что их инструмент может быть легко перенастроен для других малых языков, независимо от их структуры. Для этого используются корпуса текстов, частотные списки и морфологический анализ. Такой подход делает калькулятор универсальным решением для работы с языками, которые ранее оставались вне поля зрения крупных лингвистических проектов.
Преподаватели смогут использовать калькулятор для подбора учебных материалов по уровню сложности, а ученые — для создания сопоставимых текстов в экспериментах. Это особенно важно для языков, где количество учебных пособий и научных публикаций ограничено.
Будущее проекта
В планах команды — расширить список поддерживаемых языков, добавив не только российские, но и другие малоресурсные языки мира. Такой шаг позволит сделать инструмент востребованным не только в России, но и за ее пределами. Разработчики уверены, что их калькулятор станет важным ресурсом для сохранения языкового многообразия и поддержки образования на родных языках.
Нина Здорова, один из авторов проекта, подчеркивает, что инструмент открывает новые возможности для исследований и преподавания. Теперь можно быстро оценить сложность любого текста и подобрать оптимальные материалы для обучения.
Если Вы не знали, Центр языка и мозга НИУ ВШЭ — ведущая российская научная организация, специализирующаяся на междисциплинарных исследованиях в области лингвистики, психолингвистики и нейронаук. Центр активно внедряет современные технологии в изучение языков, разрабатывает цифровые инструменты для образования и науки, а также участвует в международных проектах по сохранению языкового наследия. Среди сотрудников центра — признанные специалисты, чьи работы получили признание в России и за рубежом.










