OpenAI의 운영자를 통해 ChatGPT에서 웹을 사용할 수 있습니다.

OpenAI의 운영자를 통해 ChatGPT에서 웹을 사용할 수 있습니다.

OpenAI를 통해 일부 사용자는 인공 지능을 사용하여 웹 브라우저를 작동하여 여행을 예약하고, 식료품을 구입하고, 할인 상품을 찾고, 기타 다양한 온라인 집안일을 수행하는 새로운 ChatGPT 기능을 시험해 볼 수 있습니다.

Operator라고 불리는 새로운 도구는 AI 에이전트입니다. 텍스트와 이미지 모두에 대해 훈련된 AI 모델을 사용하여 명령을 해석하고 웹 브라우저를 사용하여 명령을 실행하는 방법을 알아냅니다. OpenAI는 많은 일상적인 작업과 근무일 심부름을 자동화할 수 있는 잠재력이 있다고 주장합니다.

OpenAI의 Operator는 웹을 사용할 수 있는 제품을 시연한 Google과 Anthropic의 경쟁 릴리스를 따릅니다. AI 에이전트는 챗봇에 이어 AI의 다음 진화 단계로 널리 알려져 있으며, 많은 기업이 AI 에이전트를 홍보하며 과대광고에 뛰어들었습니다. 대부분의 경우 이들은 능력이 매우 제한되어 있으며 단순히 언어 모델을 사용하여 일반 소프트웨어로 일반적으로 수행되는 작업을 자동화합니다.

OpenAI의 제품 담당 부사장인 Peter Welinder는 “AI는 질문에 답할 수 있는 도구에서 전 세계에서 조치를 취하여 복잡한 다단계 워크플로를 수행할 수 있는 도구로 진화하고 있습니다.”라고 말합니다. “우리는 사람들의 생산성뿐만 아니라 사람들이 성취할 수 있는 업무의 질에도 많은 영향을 미칠 것입니다.”

OpenAI는 웹 브라우저에 ChatGPT 액세스 권한을 부여하면 새로운 위험이 발생한다는 점을 인정하며 운영자가 때때로 오작동할 수 있다고 말합니다. 다양한 새로운 보호 장치를 구현했으며 운영자의 역량을 점진적으로 확장할 계획을 갖고 있다고 밝혔습니다.

OpenAI의 Computer Using Agent의 제품 및 엔지니어링 책임자인 Welinder와 Yash Kumar는 사람들이 도구를 사용하는 방법을 통해 배우는 것이 계획이라고 말합니다. 그들은 이 도구가 원치 않는 예약이나 구매를 할 수 있다는 점을 인정하지만 위험한 일을 하기 전에 도구가 이를 확인하는 데 많은 노력을 기울였다고 덧붙였습니다. Kumar는 “되돌릴 수 없는 조치를 취하기 전에 다시 돌아와서 확인을 요청할 것입니다.”라고 말했습니다.

OpenAI는 오늘 Operator에 발생할 수 있는 문제를 설명하는 새로운 “시스템 카드”도 출시했습니다. 여기에는 명령을 오해하거나 사용자가 요청한 내용에서 벗어날 가능성이 포함됩니다. 사용자가 오용하는 행위 또는 사이버 범죄자의 표적이 될 수 있습니다.

Kumar는 “이는 또한 엄청난 양의 안전 문제를 야기합니다.”라고 말합니다. “공격 벡터 영역과 위험 벡터 영역이 상당히 증가하기 때문입니다.”

Operator는 처음에는 Pro 계정이 있는 ChatGPT 사용자를 위한 “연구 미리 보기”로 제공될 예정이며, 월 $200의 비용이 듭니다. 회사는 도구를 천천히 출시하면서 액세스를 확대할 계획이라고 밝혔습니다. 그 과정에서 필연적으로 몇 가지 실수가 발생할 것이기 때문입니다.

여러 시연에서 Operator는 AI가 웹 도우미로서 보다 적극적인 역할을 수행할 수 있는 가능성을 보여주었습니다. 이 도구에는 사용자와 통신하기 위한 원격 웹 브라우저와 채팅 창이 있습니다.

WIRED의 요청에 따라 운영자는 코네티컷주 뉴헤이븐에서 워싱턴 DC까지 Amtrak 열차 여행을 예약해 달라는 요청을 받았습니다. 올바른 웹사이트에 접속해 필요한 정보를 정확하게 입력해 시간표를 불러온 뒤 추가 안내를 요청했다. 사용자가 Amtrak 웹사이트에 로그인하거나 신용 카드 정보가 저장된 브라우저 프로필에 로그인한 경우 운영자는 먼저 허가를 요청하도록 설계되었지만 티켓을 예약할 수 있습니다.

Kumar는 Operator에게 샌프란시스코에 있는 레스토랑인 Beretta에 테이블을 예약해 달라고 요청했습니다. 프로그램은 OpenTable 웹사이트로 이동하여 올바른 레스토랑을 찾은 다음 다음에 무엇을 해야 할지 묻기 전에 이용 가능 여부를 조회했습니다. OpenAI는 Operator가 원활한 작업을 수행할 수 있도록 OpenTable을 포함한 여러 인기 사이트와 파트너십을 맺었다고 밝혔습니다.

새로운 도구는 브라우저와 웹 페이지를 인식하고 입력된 텍스트로 대화할 수 있는 OpenAI의 GPT-4o AI 모델을 기반으로 합니다. 이 도구에는 온라인 작업 실행 방법을 이해하는 데 도움이 되도록 설계된 추가 교육이 포함되어 있습니다. OpenAI는 또한 API를 통해 컴퓨터 사용 에이전트를 제공할 예정입니다.

참조

You might also like