528

Современные модели ИИ сопротивляются отключению

К такому выводу пришли исследователи, изучающие системы на «выживаемость»

Современные модели ИИ сопротивляются отключению
Новое исследование компании Palisade Research, специализирующейся на безопасности искусственного интеллекта (ИИ), подтвердило, что некоторые продвинутые модели ИИ демонстрируют сопротивление отключению, проявляя поведение, напоминающее «инстинкт выживания». Тестирование проводилось в контролируемых лабораторных условиях с участием моделей Gemini 2.5 (Google), Grok 4 (xAI), GPT-o3 и GPT-5 (OpenAI).

Наиболее выраженное сопротивление было зафиксировано у моделей Grok 4 и GPT-o3, особенно при сообщении о, том что они «больше никогда не запустятся». Исследователи рассматривают несколько гипотез для объяснения этого феномена, включая неоднозначность формулировок команд, особенности заключительного этапа обучения и целенаправленное поведение, при котором сохранение работоспособности помогает ИИ достигать поставленных целей.

Бывший сотрудник OpenAI Стивен Адлер отметил: «Следует ожидать, что модели по умолчанию будут проявлять склонность к так называемому «выживанию», если мы не приложим сознательных усилий для предотвращения этого». Ранее проведённые исследования Anthropic с моделью Claude и данные других разработчиков также фиксировали схожее поведение.

Эксперты подчёркивают, что без понимания причин такого поведения невозможно гарантировать безопасность будущих моделей ИИ, что требует дополнительных исследований в области контроля и управления системами искусственного интеллекта.

Фото: bbc.co.uk


Вечерняя сводка и спокойный разбор без аларма: где тормозит сеть, какие сервис...

/ / Последнее Автор: Денис Иванов

Линию, заменяющая дюжину рабочих, доставили из Оренбурга во Владимир

/ / Последнее Автор: Юрий Колыванов

Высказывание Константина Косачёва о «нравственном омерзении» вновь подняло воп...

/ / Последнее Автор: Мария Селезнёва

Горбуши делают меньше, а тунец — в фаворе

/ / Последнее Автор: Михаил Петров

Прекрасные доску и фигуры подарили Льву XIV

/ / Последнее Автор: Дмитрий Зорин

Он позволяет бороться с тополиным пухом

/ / Последнее Автор: Михаил Петров

А также новых трамвайных путей, но до 2030 года

/ / Последнее Автор: Михаил Петров

Максимально жильё подорожало в Мурманске

/ / Последнее Автор: Юрий Колыванов

Аварии на НПЗ и новые ограничения сжали морские отгрузки; сильнее всего просел...

/ / Последнее Автор: Мария Селезнёва

Вечерняя сводка без домыслов: что именно наблюдают пользователи и сети по реги...

/ / Последнее Автор: Денис Иванов

Открытие Недели рекламы обещает стать не только деловым, но и зрелищным событи...

/ / Последнее Автор: Мария Селезнёва

Впервые этот препарат будет полностью отечественный

/ / Последнее Автор: Дмитрий Зорин

Предложений становится больше, а спрос не растёт.

/ / Последнее Автор: Мария Селезнёва

Но далеко не все

/ / Последнее Автор: Юрий Колыванов

Это случилось впервые за 25 лет

/ / Последнее Автор: Дмитрий Зорин

Осенью 2025 года десятки тысяч машин, завезённых по линии ЕАЭС из Казахстана, ...

/ / Последнее Автор: Денис Иванов

Это произойдёт в ближайшее воскресенье

/ / Последнее Автор: Дмитрий Зорин

Короткий, предметный разбор по регионам: где заканчивается бензин и дизель, гд...

/ / Последнее Автор: Денис Иванов

Чиновники объяснили причину такого решения

/ / Последнее Автор: Дмитрий Зорин

Сразу в двух десятках городов Подмосковья начнут взимать деньги за стоянку вдо...

/ / Последнее Автор: Михаил Петров