OpenAI, 웹 검색이 가능한 Operator AI 에이전트 발표

Lee Hana 이하나 Jan 23, 2025 Jan 23, 2025 1 min read

다단계 작업을 자율적으로 수행할 수 있는 OpenAI의 에이전트, Operator가 등장했습니다.

그만큼 ChatGPT 제조업체는 Operator의 미리보기 모드를 도입했습니다. 목요일에 그것이 어떻게 작동하고 무엇을 할 수 있는지 자세히 설명합니다. 운영자는 웹을 탐색하여 취소된 주문에 대한 환불 금액을 계산하고 내부 판매 데이터베이스에서 특정 기준에 따라 고객을 찾는 등의 작업을 수행할 수 있습니다. 식료품을 사고 이메일을 보낼 수도 있습니다.

컴퓨터에서 Operator는 파일 다운로드, PDF 결합, 스프레드시트 분석, 이미지 내보내기 등 다양한 작업을 수행할 수 있습니다.

OpenAI는 2025년을 에이전트 AI의 해로 만들겠다는 약속을 이행하고 있습니다. 지난주 회사는 사용자가 일일 기술 뉴스 요약 전송이나 알림 예약과 같은 향후 프롬프트를 자동화할 수 있는 ChatGPT용 작업을 출시했습니다. 이러한 작업 중 상당수는 Google 알리미 및 캘린더와 같은 기본 도구를 통해 이미 가능하지만 이는 AI 봇이 사용자를 위해 발품 작업을 수행하는 초기 예입니다. Operator의 출시와 보다 복잡한 작업을 자율적으로 수행하는 기능이 결합되어 ChatGPT를 핵심 제품을 활용하는 필수 도구로 만들려는 OpenAI의 비전을 확인할 수 있습니다.

매쉬 가능한 광속

Operator를 뒷받침하는 모델은 GPT-4o의 비전 모드를 결합하여 Operator가 화면과 상호 작용(버튼 클릭, 입력, 스크롤 등).

초기 사용자 프롬프트를 기반으로 요세미티에서 캠핑 여행을 검색하는 OpenAI 운영자.

요세미티에서 피크닉 테이블이 있는 캠프장을 탐색하고 있는 운영자.
크레딧: OpenAI

OpenAI의 Operator를 통한 안전 접근 방식

당연히 Operator와 같은 반자율 AI 에이전트에게는 안전이 큰 관심사입니다. OpenAI는 몇 가지 다른 방식으로 위험을 고려했다고 말합니다. 운영자는 유해하거나 불법적인 작업을 차단하여 오용을 완화하고 도박, 성인 엔터테인먼트 사이트, 마약 또는 총기 소매점과 같은 블랙리스트에 오른 사이트에 액세스할 수 없습니다.

그리고 OpenAI는 사용자가 Operator를 사용할 때 어깨 너머로 지켜보고 있습니다. 발표문에는 “사용 정책 준수를 보장하고 금지된 활동에 대해 경고 또는 차단 기능을 제공하도록 설계된 자동화된 안전 검사기에 의해 사용자 상호 작용이 실시간으로 검토됩니다”라고 나와 있습니다. 아동 안전 및 사기 행위 등 우선 정책 영역에서 금지된 사용을 식별하기 위한 인적 검토 파이프라인입니다.”

운영자는 사람의 감독 없이 비용이 많이 드는 실수를 할 수 있으므로 모델은 “주문을 제출하기 전에, 이메일을 보내기 전에 사용자가 모델의 작업을 다시 확인할 수 있도록” 확인을 요청합니다. 또한 운영자는 현재 “은행 거래와 같은 고위험 작업”으로 제한됩니다.

운영자 가용성

이제 OpenAI의 새로운 프리미엄 계층 구독인 ChatGPT Pro를 보기 시작합니다. 미리보기 모드의 Operator는 미국에서 Pro 사용자로 월 200달러를 지불하는 사용자에게만 제공됩니다. 그러나 시간이 지남에 따라 OpenAI는 Plus, Team 및 Enterprise 사용자로 가용성을 확장할 것으로 예상합니다.

참조