867
Современные модели ИИ сопротивляются отключению
К такому выводу пришли исследователи, изучающие системы на «выживаемость»
Наиболее выраженное сопротивление было зафиксировано у моделей Grok 4 и GPT-o3, особенно при сообщении о, том что они «больше никогда не запустятся». Исследователи рассматривают несколько гипотез для объяснения этого феномена, включая неоднозначность формулировок команд, особенности заключительного этапа обучения и целенаправленное поведение, при котором сохранение работоспособности помогает ИИ достигать поставленных целей.
Бывший сотрудник OpenAI Стивен Адлер отметил: «Следует ожидать, что модели по умолчанию будут проявлять склонность к так называемому «выживанию», если мы не приложим сознательных усилий для предотвращения этого». Ранее проведённые исследования Anthropic с моделью Claude и данные других разработчиков также фиксировали схожее поведение.
Эксперты подчёркивают, что без понимания причин такого поведения невозможно гарантировать безопасность будущих моделей ИИ, что требует дополнительных исследований в области контроля и управления системами искусственного интеллекта.
Фото: bbc.co.uk
Краснодар лидирует в новом «Индексе официанта»
Хотя и признан столицей невежливого сервиса
/ / Последнее
Автор: Михаил Петров
«Мир Танков» запретили в России
Суд признал «Леста Игры» экстремистской организацией
/ / Последнее
Автор: Юрий Колыванов
Учёные зафиксировали сокращение популяции байкальской нерпы
Специалисты связывают это с антропогенным воздействием
/ / Последнее
Автор: Михаил Петров
Песков о движении квадроберов: «Это полная ерунда»
Пресс-секретарь президента Дмитрий Песков назвал обсуждения вокруг квадроберов...
/ / Последнее
Автор: Мария Селезнёва
Тысячи россиян обязали в декабре сдать загранпаспорта
Жители страны волнуется, не будет ли это «пробным шаром» к введению выездных в...
/ / Последнее
Автор: Юрий Колыванов
Жителей юга России смогут избавиться от скопившейся мелочи
В пятнадцати регионах пройдёт акция «Монетная неделя»
/ / Последнее
Автор: Максим Сабуров