OpenAI анонсувала випуск нового інструменту Operator — агента, здатного виконувати завдання в інтернеті замість користувача. Ця технологія, доступна у США для користувачів з підпискою Pro, наразі перебуває у стадії попереднього тестування. Про це йдеться на офіційному сайті OpenAI.
Operator базується на моделі Computer-Using Agent (CUA), яка об’єднує можливості GPT-4o у розпізнаванні зображень та логічному мисленні. Завдяки цьому інструмент може «бачити» вебсторінки через скриншоти, працювати з клавіатурою та мишею, заповнювати форми, натискати кнопки, прокручувати сторінки, створювати меми та виконувати інші завдання.
Operator здатен автоматизувати широкий спектр рутинних завдань:
Користувачі можуть налаштовувати індивідуальні інструкції для агента або зберігати повторювані запити для швидкого доступу. Якщо Operator стикається зі складними завданнями, наприклад, авторизацією чи введенням платіжних даних, він звертається за допомогою до користувача.
Operator вже тестується у партнерстві з такими компаніями, як DoorDash, Instacart, OpenTable, Priceline та Uber. Інструмент покликаний зробити сервіси більш зручними й ефективними як для користувачів, так і для бізнесу.
У публічному секторі OpenAI співпрацює з міською адміністрацією Стоктона, щоб спростити процес реєстрації в муніципальних програмах.
Поки що Operator має певні обмеження, але розробники планують удосконалювати його функціонал, враховуючи відгуки користувачів. У майбутньому агент стане доступним для підписників Plus, Team і Enterprise, а також буде інтегрований у ChatGPT.
Підписуйтесь на наш Telegram-канал t.me/sudua та на Google Новини SUD.UA, а також на наш VIBER, сторінку у Facebook та в Instagram, щоб бути в курсі найважливіших подій.