ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
17 апреля 2025
Wintershall Dea и её международные юристы под угрозой юридических последствий в России
17 апреля 2025
Exemptions and profits over defense: how Andriy Matyukha’s FavBet bypasses the law and continues cooperating with Russia
17 апреля 2025
Калифорния требует признания пошлин Трампа незаконными
17 апреля 2025
Тысячи детей гибнут на пути в Европу без реакции Рима
17 апреля 2025
Контейнер с марихуаной был найден в Гданьске, скрытый под экологически чистыми панелями
17 апреля 2025
Пенсия по-королевски: как осуждённый Кляйн управляет пивной империей с рекордной прибылью
17 апреля 2025
Темпы инфляции в РФ не опускаются ниже 10%
17 апреля 2025
Президент Монголии открывает страну для добычи урана, закрывая глаза на протесты и экологию