В НИУ ВШЭ создали инструмент для оценки сложности текстов на малоресурсных языках
,_interior_77.jpg)
Исследователи Центра языка и мозга НИУ ВШЭ разработали инструмент, позволяющий определить сложность текстов на малоресурсных языках. В первой версии поддерживаются несколько малых языков России: адыгейский, башкирский, бурятский, татарский, осетинский и удмуртский. Это первая подобная разработка, адаптированная специально для этих языков и учитывающая их морфологические и лексические особенности.
По данным Института языкознания РАН, в России насчитывается 155 языков. Среди них есть малочисленные: например, на адыгейском говорят около 80 тысяч человек, на бурятском, осетинском и удмуртском — от 250 до 350 тысяч человек. Есть и языки с более чем миллионом носителей, например башкирский и татарский. Все эти языки имеют статус государственных в республиках России, поэтому важно не только сохранить их, но и создавать условия для их развития, а также возможности для обучения и реального использования, в том числе в образовании и науке.
В 2025 году был принят Указ Президента РФ «Об утверждении Основ государственной языковой политики Российской Федерации». Он поддерживает языковое многообразие и задает курс на развитие и практическое использование языков народов России. Один из способов достичь этих целей — создать цифровые инструменты, которые сделают работу с малоресурсными языками проще и доступнее.
Команда ученых из Центра языка и мозга НИУ ВШЭ разработала онлайн-инструмент — калькулятор сложности текстов, который помогает быстро и легко оценить сложность текста на нескольких малых языках с учетом их лингвистических особенностей. Калькулятор создавался с опорой на опыт Антонины Лапошиной и Марии Лебедевой, разработавших инструмент для оценки сложности русскоязычных текстов («Текстометр»).
Калькулятор, созданный психолингвистами НИУ ВШЭ, оценивает тексты по нескольким параметрам: во-первых, длина и частотность слов — они анализируются на основе данных из больших языковых корпусов, во-вторых, процент лексики из частотного списка, то есть учитывается доля слов, входящих в список 5000 наиболее употребляемых слов каждого языка, и, в-третьих, соотношение частей речи — анализируется распределение различных частей речи в тексте. Кроме того, калькулятор учитывает такие характеристики, как лексическая плотность, лексическое разнообразие, динамичность и описательность текста.
Ключевая инновация — использование формулы удобочитаемости Флеша, адаптированной для каждого языка отдельно. Это позволяет точнее оценивать сложность и удобство восприятия текста.
Индекс Флеша основан на количестве слов, предложений и слогов, но исходные коэффициенты были подобраны для английского языка и плохо работают для языков с иной структурой — например, для полисинтетического адыгейского, где средняя длина слова значительно больше. В исследовании 2025 года Ульяны Петруниной и Нины Здоровой коэффициенты в формуле были пересчитаны для адыгейского языка отдельно, что значительно повысило точность оценки.
Ульяна Петрунина
«Параметры нашего калькулятора адаптированы под структурные особенности каждого из шести малоресурсных языков России — на основе корпусов текстов, частотного и морфологического анализа. Аналогичным образом мы скорректировали и классический индекс удобочитаемости Флеша. Благодаря этому алгоритм можно легко перенастраивать на другие малоресурсные языки, независимо от их типологических характеристик», — поясняет один из разработчиков инструмента, научный сотрудник Центра языка и мозга НИУ ВШЭ Ульяна Петрунина.
Инструмент поможет создавать сопоставимые стимульные материалы в научных экспериментах и обеспечит преподавателей ресурсом для подбора качественного учебного материала по уровням сложности. Такая разработка — важный вклад в сохранение и развитие малых языков России, поддержку языкового многообразия страны.
Нина Здорова
«Наш инструмент позволяет исследователям и педагогам подбирать материалы с учетом их лингвистической сложности, что особенно важно для исследований и преподавания с ограниченным количеством ресурсов на данных языках», — отмечает Нина Здорова, один из авторов инструмента.
В следующих версиях планируется добавление других малоресурсных и мало представленных в лингвистике языков — не только на территории России.
Здорова Нина Станиславовна
Вам также может быть интересно:
В НИУ ВШЭ пройдет II конгресс «Генетика и сердце»
Высшая школа экономики, Национальная исследовательская лига кардиологической генетики (НИЛКГ) и Центральная государственная медицинская академия (ЦГМА) Управления делами Президента РФ организуют II Конгресс с международным участием «Генетика и сердце». Мероприятие состоится 7–8 февраля 2026 года в Центре культур НИУ ВШЭ.
Ученые ВШЭ выяснили, как сила авторитета формирует доверие
Исследователи Института когнитивных нейронаук НИУ ВШЭ выяснили, как мозг реагирует на аудиодипфейки — реалистичные поддельные записи речи, созданные с помощью ИИ. Выяснилось, что люди склонны доверять мнению авторитетного спикера даже в тех случаях, когда новые утверждения противоречат его прежней позиции. Это работает и в ситуациях, когда утверждение не согласуется с собственным мнением слушающего. Исследование опубликовано в журнале NeuroImage.
МИЭМ ВШЭ и Инновационный центр «Альфачип» заключили соглашение о сотрудничестве
Среди основных задач — совместные проекты в области микроэлектроники, участие специалистов компании в сопровождении научно-исследовательской деятельности студентов и аспирантов. Также планируется подготовка совместных научных публикаций, организация производственной практики и стажировок студентов, повышение квалификации специалистов компании.
«Я — профессионал»: ВШЭ — в лидерах по числу студентов в заключительном этапе
С сентября самые талантливые студенты со всей страны боролись за право стать частью вселенной карьерных возможностей «Я — профессионал» и получить доступ к бонусам при поступлении в магистратуру Высшей школы экономики, стажировкам в известных компаниях-партнерах («Яндекс», Сбербанк, ВТБ, РЖД и др.) и денежному вознаграждению до 300 000 рублей. Вышка вошла в число лидеров по количеству студентов, прошедших в заключительный этап олимпиады «Я — профессионал», который состоится с февраля по апрель 2026 года.
Математик из НИУ ВШЭ в Нижнем Новгороде нашел способ решить уравнение, нерешаемое с XIX века
Ученый из НИУ ВШЭ в Нижнем Новгороде и ИППИ РАН Иван Ремизов совершил концептуальный прорыв в теории дифференциальных уравнений. Ему удалось вывести универсальную формулу для решения задач, которые более 190 лет считались нерешаемыми аналитическим путем. Полученный результат радикально меняет картину мира в одной из старейших областей математики, важной для фундаментальной физики и экономики. Результаты работы опубликованы во Владикавказском математическом журнале.
НИУ ВШЭ и ГК InfoWatch подписали соглашение о сотрудничестве
Соглашение ознаменует новый этап сотрудничества между НИУ ВШЭ и ГК InfoWatch, который направлен на развитие образовательных программ и укрепление практико-ориентированного подхода в подготовке кадров для цифровой экономики. Стороны договорились совместно разрабатывать и проводить экспертизу учебных программ. Кроме того, эксперты ГК InfoWatch будут вести преподавательскую работу в рамках обучения студентов IT- и ИБ-направлений Высшей школы экономики.
В Вышке повысят квалификацию руководители, отвечающие за информационную безопасность
В НИУ ВШЭ стартовал набор на программу повышения квалификации «Кибербезопасность как стратегия», выпускники которой будут внедрять на своих предприятиях лучшие практики стратегического и операционного управления информационной безопасностью. Начало занятий запланировано на 16 марта. В чем актуальность программы, на кого она рассчитана и чему будут обучать слушателей, рассказал ее руководитель, директор Центра программных разработок и цифровых сервисов МИЭМ НИУ ВШЭ Антон Сергеев.
НИУ ВШЭ, MR и ГК «А101» будут готовить специалистов по территориальному развитию
В 2026 году на факультете городского и регионального развития (ФГРР) Вышки открывается новая образовательная программа бакалавриата «Девелопмент и городское планирование». Ключевые партнеры образовательной программы — компания MR и Группа компаний «А101».
МИЭМ ВШЭ проведет XXX, юбилейную межвузовскую конференцию имени Е.В. Арменского
20–27 апреля в Московском институте электроники и математики имени А.Н. Тихонова ВШЭ пройдет главное для МИЭМ научное студенческое событие года — юбилейная, XXX ежегодная межвузовская научно-техническая конференция студентов, аспирантов и молодых специалистов имени основателя и первого ректора МИЭМ Евгения Викториновича Арменского. В конференции могут принять участие студенты, аспиранты вузов и молодые специалисты, работающие в сфере электроники, в ИТ-области, телекоммуникациях, материаловедении. Отдельная секция конференции открыта для школьников.
Участники СВО и их дети впервые смогут поступить в НИУ ВШЭ на бюджетные места на онлайн-программы
В рамках приемной кампании 2026 года Высшая школа экономики впервые открыла бюджетный набор на онлайн-программы бакалавриата с целью выделить места для поступления абитуриентов по отдельной квоте. Ранее прием на образовательные программы, реализуемые в онлайн-формате, осуществлялся только на платной основе.


