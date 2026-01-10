Исследование показало, что современные системы ИИ выполняют лишь незначительную часть реальных задач фриланс-проектов.

Фото: 1plus1

Следите за актуальными новостями в соцсетях SUD.UA

Исследование, проведенное Scale AI и Центром безопасности ИИ, может ли ChatGPT полноценно заменить специалистов в дизайне, программировании или аналитике, указывает на ограниченные возможности современных систем. Ученые протестировали ChatGPT, Gemini и Claude на сотнях реальных фриланс-проектов — от 3D-анимации и создания веб-игр до форматирования научных работ, сообщает Washington Post.

Результаты оказались неутешительными: самая эффективная система справилась только с 2,5% задач. При этом почти половина проектов была выполнена с низким качеством, а треть осталась незавершенной. ИИ часто создавал поврежденные файлы или игнорировал ключевые требования заказчика, а при тщательном анализе даже «правдоподобные» результаты обнаруживали критические недостатки.

В тестах по дизайну интерьера ИИ создал план этажа, который выглядел реалистично, но был технически неправильным и не содержал необходимой детализации. Аналитика данных также вызвала проблемы: при создании панели визуализации данных о счастье ИИ накладывал текст на графики, путал цвета и пропускал целые страны. В разработке игр ИИ создал функциональную игру, однако полностью игнорировал заданную тему — вместо пивоварения получили абстрактный продукт.

Джейсон Хаузенлой, один из авторов исследования, объясняет низкие показатели двумя основными ограничениями: отсутствием долговременной памяти и проблемами с визуальным пониманием. Современные чат-боты не учатся на ошибках в рамках длительных проектов и не учитывают фидбек заказчика. При попытке создать 3D-модели ИИ работает через код, а не через визуальный интерфейс, что приводит к нестабильности изображения в кадрах.

Несмотря на это, прогресс заметен. Новая модель Gemini 3 Pro в ноябре 2025 года выполнила 1,3% задач, тогда как предыдущая версия справлялась только с 0,8%.

Тенденция к автономии ИИ продолжается: компании уже чувствуют, что один сотрудник с доступом к чат-боту может делать больше, чем раньше. Однако полная замена специалиста пока остается научной фантастикой. Для экономии это выгодно: создание игры человеком стоило $1485, а запуск Claude Sonnet — менее $30. Однако разница в качестве пока оставляет человеческий труд незаменимым.

Подписывайтесь на наш Тelegram-канал t.me/sudua и на Google Новости SUD.UA, а также на наш VIBER, страницу в Facebook и в Instagram, чтобы быть в курсе самых важных событий.