OpenAI анонсировала выпуск нового инструмента Operator - агента, способного выполнять задачи в интернете вместо пользователя. Эта технология, доступная в США для пользователей с подпиской Pro, пока находится в стадии предварительного тестирования. Об этом говорится на официальном сайте OpenAI.
Operator базируется на модели Computer-Using Agent (CUA), которая объединяет возможности GPT-4o в распознавании изображений и логическом мышлении. Благодаря этому инструмент может «видеть» веб-страницы через скриншоты, работать с клавиатурой и мышью, заполнять формы, нажимать кнопки, прокручивать страницы, создавать мемы и выполнять другие задачи.
Operator способен автоматизировать широкий спектр рутинных задач:
Пользователи могут настраивать индивидуальные инструкции для агента или сохранять повторяющиеся запросы для быстрого доступа. Если Operator сталкивается со сложными задачами, например, авторизацией или вводом платежных данных, он обращается за помощью к пользователю.
Operator уже тестируется в партнерстве с такими компаниями, как DoorDash, Instacart, OpenTable, Priceline и Uber. Инструмент призван сделать сервисы более удобными и эффективными как для пользователей, так и для бизнеса.
В публичном секторе OpenAI сотрудничает с городской администрацией Стоктона, чтобы упростить процесс регистрации в муниципальных программах.
Пока что Operator имеет определенные ограничения, но разработчики планируют совершенствовать его функционал, учитывая отзывы пользователей. В будущем агент станет доступным для подписчиков Plus, Team и Enterprise, а также будет интегрирован в ChatGPT.
Подписывайтесь на наш Тelegram-канал t.me/sudua и на Google Новости SUD.UA, а также на наш VIBER, страницу в Facebook и в Instagram, чтобы быть в курсе самых важных событий.