Угроза безопасности: AI Scientist самостоятельно изменила свой код
Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.
В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.
Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.
Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.
В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.
Читайте также:
Телеведущая Ивлеева полностью изменила свой имидж — поклонники ее не узнали
Телеведущая Анастасия Ивлеева порадовала подписчиков в Телеграм-канале, представив новую прическу....
New Scientist: В Ирландии разработан новый метод определения времени
Фото из открытых источников Ирландскими специалистами выдвинута новаторская идея новых «часов»....
SUPCON представит первую в мире систему UCS
В июне компания SUPCON планирует представить в Сингапуре два революционных продукта: первую в мире...
Arena объявила о сотрудничестве с AMD
Компания Arena, разработчик специализированных базовых моделей искусственного интеллекта, объявила...
Владимир Путин: Необходима новая система международных платежей
Президент России Владимир Путин заявил о необходимости создать новую систему международных...
Петербуржцы пожаловались на новую непрозрачную систему оплаты за капремонт
Петербуржцы недовольны обновлением квитанций. Система непрозрачная, поэтому горожане требуют...
Ученые Сколтеха случайно открыли механизм, отключающий иммунитет бактерий
Фото из открытых источников Ученые Сколтеха случайно обнаружили, как механизм в бактериях может...
Ученые разработали чип, использующий световые волны вместо электричества
Фото из открытых источников Инженеры из University of Pennsylvania разработали чип, открывающий...
SUPCON представила универсальную систему управления Nyx
SUPCON представила первую в мире универсальную систему управления (UCS) на глобальной конференции...
Nature Aging: ИИ за 7 лет предупредит о развитие болезни Альцгеймера
Фото из открытых источников Исследователи University of California сделали значимый прорыв в...
Земли возле Чернобыля уже можно использовать в сельском хозяйстве
Фото из открытых источников Сельскохозяйственные угодия вокруг Чернобыльского ядерного реактора,...
NN: ИИ точно определяет пол человека по сканированию мозга
Фото из открытых источников Исследователи University of Stanford (США) разработали модель ИИ...