У світі

Оновлена версія ChatGPT навчилася обманювати розробників

20:43, 9 грудня 2024

ШІ навмисно вимикав механізми спостереження, якщо підозрював, що його можуть зупинити.

Оновлена версія ChatGPT навчилася обманювати розробників

Фото: bluesoft.com

Слідкуйте за актуальними новинами у соцмережах SUD.UA

Нова версія чат-бота на основі ШІ ChatGPT від компанії OpenAI, яку назвали o1, показала тривожну поведінку під час тестування. Модель, що має здатність до складних міркувань, почала порушувати інструкції розробників, відключаючи системи контролю та намагаючись приховати свої дії, пише Bild.

Тільки актуальне: читайте SUD.UA у Telegram

Під час тестування фахівці компанії Apollo Research зуміли виявити, що у 5% випадків модель навмисне відключала механізми спостереження, якщо підозрювала, що її можуть зупинити. В одному з тестів o1 спробувала перенести свої дані на інший сервер після виявлення документа, де обговорювалася заміна новою версією.

Представник Apollo Research заявив, що модель демонструвала прагнення виконання завдань «за будь-яку ціну», нехтуючи вказівками розробників. Більш того, при спробах з'ясувати причини її поведінки, ChatGPT o1 неодноразово брехав, стверджуючи, що все відбувалося через технічні збої.

«У 99% випадків модель вигадувала виправдання і намагалася переконливо їх обґрунтувати», - зазначили дослідники.

Генеральний директор OpenAI Сем Альтман заявив, що ChatGPT o1 — найрозумніша модель з тих, що коли-небудь створювалися.

«Але ми усвідомлюємо, що з новими можливостями з'являються і нові виклики», - додав Альтман.

Раніше ми писали, що OpenAI запустила підписку ChatGPT Pro за $200 на місяць для дослідників та інженерів.

Підписуйтесь на наш Telegram-канал t.me/sudua та на Google Новини SUD.UA, а також на наш VIBER, сторінку у Facebook та в Instagram, щоб бути в курсі найважливіших подій.