Современные модели ИИ сопротивляются отключению
К такому выводу пришли исследователи, изучающие системы на «выживаемость»
Наиболее выраженное сопротивление было зафиксировано у моделей Grok 4 и GPT-o3, особенно при сообщении о, том что они «больше никогда не запустятся». Исследователи рассматривают несколько гипотез для объяснения этого феномена, включая неоднозначность формулировок команд, особенности заключительного этапа обучения и целенаправленное поведение, при котором сохранение работоспособности помогает ИИ достигать поставленных целей.
Бывший сотрудник OpenAI Стивен Адлер отметил: «Следует ожидать, что модели по умолчанию будут проявлять склонность к так называемому «выживанию», если мы не приложим сознательных усилий для предотвращения этого». Ранее проведённые исследования Anthropic с моделью Claude и данные других разработчиков также фиксировали схожее поведение.
Эксперты подчёркивают, что без понимания причин такого поведения невозможно гарантировать безопасность будущих моделей ИИ, что требует дополнительных исследований в области контроля и управления системами искусственного интеллекта.
Фото: bbc.co.uk
Краснодар лидирует в новом «Индексе официанта»
Хотя и признан столицей невежливого сервиса
«Мир Танков» запретили в России
Суд признал «Леста Игры» экстремистской организацией
Учёные зафиксировали сокращение популяции байкальской нерпы
Специалисты связывают это с антропогенным воздействием
Песков о движении квадроберов: «Это полная ерунда»
Пресс-секретарь президента Дмитрий Песков назвал обсуждения вокруг квадроберов...
Тысячи россиян обязали в декабре сдать загранпаспорта
Жители страны волнуется, не будет ли это «пробным шаром» к введению выездных в...
Жителей юга России смогут избавиться от скопившейся мелочи
В пятнадцати регионах пройдёт акция «Монетная неделя»