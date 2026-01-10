Дослідження показало, що сучасні системи ШІ виконують лише незначну частину реальних завдань фріланс-проєктів.

Дослідження, проведене Scale AI та Центром безпеки ШІ, чи може ChatGPT повноцінно замінити фахівців у дизайні, програмуванні чи аналітиці, вказує на обмежені можливості сучасних систем. Науковці протестували ChatGPT, Gemini та Claude на сотнях реальних фріланс-проєктів — від 3D-анімації та створення веб-ігор до форматування наукових робіт, повідомляє Washington Post.

Результати виявилися невтішними: найефективніша система впоралася лише з 2,5% завдань. При цьому майже половина проєктів була виконана з низькою якістю, а третина залишилася незавершеною. ШІ часто створював пошкоджені файли або ігнорував ключові вимоги замовника, а при ретельному аналізі навіть «правдоподібні» результати виявляли критичні недоліки.

У тестах із дизайну інтер’єру ШІ створив план поверху, що виглядав реалістично, але був технічно неправильним і не містив необхідної деталізації. Аналітика даних також викликала проблеми: під час створення панелі візуалізації даних про щастя ШІ накладав текст на графіки, плутав кольори та пропускав цілі країни. У розробці ігор ШІ створив функціональну гру, проте повністю ігнорував задану тему — замість пивоваріння отримали абстрактний продукт.

Джейсон Хаузенлой, один із авторів дослідження, пояснює низькі показники двома основними обмеженнями: відсутністю довгострокової пам’яті та проблемами з візуальним розумінням. Сучасні чат-боти не вчаться на помилках у межах тривалих проєктів і не враховують фідбек замовника. При спробі створити 3D-моделі ШІ працює через код, а не через візуальний інтерфейс, що призводить до нестабільності зображення в кадрах.

Попри це, прогрес помітний. Нова модель Gemini 3 Pro у листопаді 2025 року виконала 1,3% завдань, тоді як попередня версія справлялася лише з 0,8%.

Тенденція до автономії ШІ триває: компанії вже відчувають, що один працівник із доступом до чат-бота може робити більше, ніж раніше. Проте повна заміна фахівця поки що залишається науковою фантастикою. Для економії це вигідно: створення гри людиною коштувало $1485, а запуск Claude Sonnet — менше $30. Однак різниця в якості поки що залишає людську працю незамінною.

