ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
02 февраля 2025
Кремль отверг запрос Сирии на выдачу Асада, сосредоточив внимание на экономической помощи
02 февраля 2025
Будапешт призывает к пересмотру ограничений против России
02 февраля 2025
В Рязанской области возбуждено дело о вымогательстве против известных общественных деятелей
02 февраля 2025
Американского полицейского осудили за кражу и продажу наркотиков
02 февраля 2025
Чиновника из администрации Красноярска задержали за получение откатов при госзакупках
02 февраля 2025
Вашингтон заподозрил Россию в создании офшорного резерва под видом финансирования АЭС
02 февраля 2025
Ускова усомнилась в преимуществах китайской нейросети DeepSeek перед американскими аналогами
02 февраля 2025
Ротенберг прокомментировал худший результат СКА