Российские учёные создали ИИ, который переводит голосовые формулы в текст для научных статей

27.04.2026 16:08

Специалисты Института AIRI, «Иннополиса», МТУСИ, НИУ ВШЭ и МГУ разработали систему искусственного интеллекта, способную распознавать устную речь математиков и преобразовывать её в текстовые формулы в формате LaTeX — стандарте для научных публикаций.

Новый алгоритм, созданный в 2026 году на базе открытого российского набора данных, превосходит существующие аналоги по качеству «перевода» более чем на 36%.

Теперь исследователь может произнести формулу вслух, и система сразу выдаст структурированный текст, готовый для вставки в статью или учебник.

ноутбук
Фото: Pixabay

Как это работает

В основе разработки лежит уникальный датасет, собранный при участии математиков-добровольцев.

Он включает более 66 тысяч живых аудиозаписей, 571 тысячу синтетических, а также около 12 тысяч уникальных математических предложений и 10,7 тысяч отдельных уравнений на русском и английском языках.

Сочетание настоящей и сгенерированной речи сделало модель устойчивой к разным голосам, акцентам и особенностям произношения.

Зачем это нужно

По словам научного сотрудника AIRI Дмитрия Коржа, созданный набор данных полезен не только для перевода формул в LaTeX.

Он может применяться для автоматического распознавания речи, голосовой биометрии, защиты от подделки голоса и других задач, где важен анализ аудиосигнала.

Сама же система призвана стать специализированным помощником для математиков, упрощая оформление исследований и публикаций.

Подписаться: MAXOKVK

Валерия Кистерная Автор: Валерия Кистерная Редактор интернет-ресурса

Новости по теме:


Содержание
  1. Как это работает
  2. Зачем это нужно