Нові потужні ШІ-моделі частіше галюцинують — дослідження

21:18, 7 травня 2025
Моделі ШІ o3 та o4-mini вигадують факти частіше за попередників.
Нові потужні ШІ-моделі частіше галюцинують — дослідження
Фото: Reuters
Слідкуйте за актуальними новинами у соцмережах SUD.UA

Найновіші мовні моделі штучного інтелекту з функцією міркування, включаючи o3 від OpenAI, демонструють вищий рівень помилок у відповідях, ніж їхні попередники. Про це пише The New York Times з посиланням на дослідження.

Проблема характерна не лише для OpenAI — зі «галюцинаціями» стикаються і інші моделі, зокрема від Google та китайського стартапу DeepSeek. Попри покращення в математичних можливостях, кількість вигаданих або недостовірних фактів зростає.

Так звані «галюцинації» — одна з найсерйозніших проблем у роботі ШІ. Вони виникають, коли модель вигадує інформацію без підтвердження з реальних джерел. За словами Амра Авадалли, CEO компанії Vectara, яка створює ШІ для бізнесу, повністю позбутися цього явища неможливо.

Яскравим прикладом став випадок зі ШІ-ботом техпідтримки інструмента Cursor. Він неправдиво заявив, що програму можна буде використовувати лише на одному пристрої, чим викликав хвилю невдоволення серед користувачів. Згодом з’ясувалося, що подібних змін компанія не вносила — бот вигадав їх самостійно.

Внутрішні тести OpenAI показали, що модель o3 у 33% відповідей про відомих людей надавала вигадані факти — це вдвічі більше, ніж у моделі o1. Модель o4-mini демонструє ще гірші результати — 48% хибних відповідей. Загалом під час загальних запитів рівень «галюцинацій» в o3 сягав 51%, а в o4-mini — аж 79%. Для порівняння, o1 «помилялася» у 44% випадків.

Незалежні дослідження також підтверджують: ШІ з функцією міркування часто вигадує дані. За оцінками Vectara, цей показник може коливатися від 3% до 27% залежно від типу завдання. При цьому за останній рік рівень «галюцинацій» у відповідях моделей знизився лише на 1–2%.

Підписуйтесь на наш Telegram-канал t.me/sudua та на Google Новини SUD.UA, а також на наш VIBER, сторінку у Facebook та в Instagram, щоб бути в курсі найважливіших подій. 

XX з’їзд суддів України – онлайн-трансляція – день перший
Telegram канал Sud.ua
XX з’їзд суддів України – онлайн-трансляція – день перший
Головне про суд
Сьогодні день народження святкують
  • Аліна Павловська
    Аліна Павловська
    суддя Хмельницького міськрайонного суду Хмельницької області
  • Валентин Шроль
    Валентин Шроль
    суддя Київського апеляційного суду
  • Олег Гончарук
    Олег Гончарук
    суддя Господарського суду Чернівецької області
  • Катерина Васильєва
    Катерина Васильєва
    суддя Святошинського районного суду міста Києва
  • Андрій Бутенко
    Андрій Бутенко
    суддя Одеського окружного адміністративного суду