Ученые из России нашли способ борьбы с выдумыванием фактов нейросетями

Исследователи из Университета Решетнева представили инновационную методику, которая позволяет снизить вероятность появления так называемых "галлюцинаций" у нейросетей.

Как сообщили в пресс-службе вуза, разработка уже прошла первичные испытания и направлена на повышение достоверности ответов искусственного интеллекта.

Проблема "уверенной лжи" остается одной из самых острых при внедрении нейросетей в ответственные сферы, где каждая ошибка может иметь серьезные последствия.

Стресс-тест для алгоритмов

Стандартные методы борьбы с недостоверными ответами сегодня предполагают использование RAG-систем, где нейросеть обращается к внешней базе знаний.

Однако, как пояснили в университете, опечатки, неполнота данных или внутренние противоречия в запросе все равно приводят к сбоям. Команда под руководством доцента Анастасии Поляковой пошла дальше: специалисты проанализировали типичные сценарии появления ложных фактов и создали их полный классификатор.

"Чтобы решить эту задачу, команда проанализировала типовые сценарии "галлюцинаций" и создала их классификатор. Затем был разработан автоматизированный пайплайн стресс-тестирования: система генерирует тестовые запросы, сравнивает ответы с эталоном и оценивает точность",

— рассказали разработчики.

Универсальный модуль для реального времени

Ключевым элементом методики стал прототип мониторингового модуля, работающего в реальном времени. Он непрерывно логирует все входящие запросы и контекст беседы, вычисляя риск выдачи ошибочного или вымышленного ответа. Если степень уверенности модели падает ниже установленного порога, модуль немедленно сигнализирует оператору о потенциальной проблеме.

Важно, что предложенная система не привязана к конкретной архитектуре нейросети. Это делает ее универсальным инструментом, готовым к масштабированию в самых разных отраслях. Ожидается, что технология найдет применение в чат-ботах для абитуриентов, помощниках юристов и врачей, а также в сервисах на базе "Госуслуг", где точность ответов имеет первостепенное значение.

Ученые из России нашли способ борьбы с выдумыванием фактов нейросетями

Стресс-тест для алгоритмов

Универсальный модуль для реального времени

Актуальные новости: