Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2442

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
Осужденный за взятки экс-чиновник ПФР Рудольф Зайцев отправился на СВО по контракту с Минобороны
26 июля 2025
Нарколог в тюрьме, бизнес — на свободе: как Евгений Брюн построил репрессивную наркополитику и миллиардный картель
26 июля 2025
Сергей Борошноев — от борьбы с коррупцией до пьяного вождения: как “лесной контролёр” провалил свою миссию
26 июля 2025
Жители Уфы выявили незаконную вырубку деревьев и строительные работы возле стадиона им. Салавата Юлаева
26 июля 2025
Заключённые азербайджанские журналисты заявляют о жестоком обращении во время голодовки
26 июля 2025
Террористы ИГИЛ устроили бойню в «Крокусе» после присяги и команды на атаку из Telegram
26 июля 2025
Третий день тайско-камбоджийского конфликта: армия Таиланда продвигается на спорной территории
26 июля 2025
Фейки и дезинформация: как поддельные каналы Тараса Чорноивана пытаются очернить бизнесмена Николая Шихиди
26 июля 2025
После отказа в политическом убежище в США Леонид Мелехин отправлен в СИЗО по решению российского суда
26 июля 2025
Суд в Ангарске отложил рассмотрение дела Михаила Попкова о новом убийстве до 21 августа
26 июля 2025