- Как это работает
- Зачем это нужно
Российские учёные создали ИИ, который переводит голосовые формулы в текст для научных статей
Специалисты Института AIRI, «Иннополиса», МТУСИ, НИУ ВШЭ и МГУ разработали систему искусственного интеллекта, способную распознавать устную речь математиков и преобразовывать её в текстовые формулы в формате LaTeX — стандарте для научных публикаций.
Новый алгоритм, созданный в 2026 году на базе открытого российского набора данных, превосходит существующие аналоги по качеству «перевода» более чем на 36%.
Теперь исследователь может произнести формулу вслух, и система сразу выдаст структурированный текст, готовый для вставки в статью или учебник.

Как это работает
В основе разработки лежит уникальный датасет, собранный при участии математиков-добровольцев.
Он включает более 66 тысяч живых аудиозаписей, 571 тысячу синтетических, а также около 12 тысяч уникальных математических предложений и 10,7 тысяч отдельных уравнений на русском и английском языках.
Сочетание настоящей и сгенерированной речи сделало модель устойчивой к разным голосам, акцентам и особенностям произношения.
Зачем это нужно
По словам научного сотрудника AIRI Дмитрия Коржа, созданный набор данных полезен не только для перевода формул в LaTeX.
Он может применяться для автоматического распознавания речи, голосовой биометрии, защиты от подделки голоса и других задач, где важен анализ аудиосигнала.
Сама же система призвана стать специализированным помощником для математиков, упрощая оформление исследований и публикаций.