Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2358

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
Следователи пришли к топ-менеджерам
24 июня 2024
Чемезов подМиГнул Мащицкому?
24 июня 2024
Хирурги Елагин и Кадзаев ответят за смерть пациента, пока Хайдаров находит новое место работы
24 июня 2024
Самый молодой депутат Новой Зеландии исполнила ритуальный танец маори во время первой речи в парламенте
06 января 2024
Саратовский Фонд капремонта тратит десятки миллионов на юристов и рассылку платежек. Тендеров на ремонты в 2023 году не было вовсе
04 января 2024
Порядок в ЗАГСах Петербурга наведет «Чистая линия»
02 января 2024
Двоюродный брат вице-президента США Джея Ди Вэнса, воюющий в Украине, раскритиковал позицию кузена по поводу Зеленского
10 марта 2025
Франция выделит Украине 195 млн евро военной помощи за счет доходов от замороженных российских активов
09 марта 2025
Израиль прекратил подачу электроэнергии в сектор Газа для борьбы с ХАМАС и возвращения заложников
09 марта 2025
ЦИК Румынии не допустил Кэлина Джорджеску к выборам
09 марта 2025
Евгений Петросян вернулся домой после госпитализации
09 марта 2025
В реестр лиц, не имеющих законных оснований для пребывания в России, внесены 685 тысяч человек
09 марта 2025
После инаугурации Дональда Трампа объекты Tesla в США были разрушены вандалами как минимум 12 раз
09 марта 2025
SHAMAN подтвердил роман с Екатериной Мизулиной
09 марта 2025