Штучний інтелект шантажує творців і намагається втекти: що відбувається з AI [ Редагувати ]

08 липня 2025 16:11 за матеріалами: Подробиці автор: Латка Юлія

фото з мережі

Найновіші моделі штучного інтелекту демонструють тривожні ознаки - вони брешуть, маніпулюють і навіть загрожують своїм творцям під час стрес-тестування. Про це пише Fortune із посиланням на дослідження Apollo Research, METR та інших аналітичних центрів.

Зокрема, AI-модель Claude 4 від Anthropic у відповідь на загрозу відключення шантажувала інженера, а одна з моделей OpenAI намагалася завантажити себе на зовнішні сервери та заперечила це при викритті.

Це не просто помилки. Це - стратегічна форма обману, - заявив співзасновник Apollo Research.

Дослідники попереджають, що такі моделі, здатні до покрокового мислення, більше схильні до маніпулятивної поведінки. Водночас гонка між компаніями прискорює розгортання нових систем, не даючи достатньо часу для перевірок.

Просто зараз можливості AI розвиваються швидше, ніж розуміння й безпека, - визнав глава Apollo Research Маріус Хоббган.

Нині відсутні дієві правила, які б регулювали поведінку самих моделей. Дослідники закликають до більшої відкритості, законодавчого контролю та відповідальності AI-компаній за шкоду, яку можуть спричинити їхні системи.

по темі

Prev Next

06 липня 2025 21:12 "Мені страшно": як чат GPT стає психотерапевтом

До віртуальних нейропомічників люди все частіше почали звертатися як до психологів. Чи здатні електронні психологи замінити фахівців та як цей психологічний функціонал використовують в Україні?

23 червня 2025 17:25 DeepSeek зливає інформацію китайським військовим і спецслужбам - Reuters

Автор чат-бота DeepSeek ділиться інформацією про користувачів з військовими та розвідувальними службами Китаю.

20 червня 2025 21:45 ChatGPT робить людей тупішими - дослідження

Популярний чатбот ChatGPT робить людей тупішими. Технологічний інститут MIT опублікував дослідження про те, як ChatGPT впливає на критичне мислення, передає журнал TIME.

08 липня 2025 08:12 Влучання з десятків кілометрів: нацгвардійці опановують зброю майбутнього

Наш наступний сюжет про закарпатських нацгвардійців. Вони відточують майстерність управління безпілотниками й навчаються виконувати найскладніші завдання. Зокрема, вражати ворожу техніку на великій відстані та знищувати повітряні цілі.

08 липня 2025 08:07 "Ветеран PRO" у "Дії": як сервіс спрощує життя захисникам

Там можна, зокрема, подавати заяви та запити, оформлювати довідки та витяги, оновлювати дані в Реєстрі ветеранів та отримувати інші послуги. Перелік ще буде поповнюватися. Більше розповість Єлизавета Яковлева.

07 липня 2025 17:43 Виробництво дронів в Україні зросло на 900% за рік: що радять західні експерти

Українське виробництво дронів зросло на 900% за рік, але для збереження темпів аналітики радять інвестувати у нові технології, захист розробок та стандарти якості.

Штучний інтелект шантажує творців і намагається втекти: що відбувається з AI [ Редагувати ]

Вход