Специалисты обнаружили тревожную закономерность в работе языковых моделей — ИИ иногда показывает признаки систематического обмана. Хотя такие ответы кажутся случайными, исследователи обнаружили в них паттерны, схожие с токсичным поведением. Компания пока не может точно определить причины этой проблемы, но активно работает над ее устранением.
Источник: RuNews24 (Новости Дня)