OpenAIs Operator: Nå kan AI bruke nettleseren for deg

Med OpenAIs nye Operator kan du be AI-en om å booke bord på restaurant eller bestille konsertbilletter, via nettleseren.

OpenAIs Operator kan bruke nettleseren for eksempel for å booke et bord på restaurant for deg. 📸: The AI Advantage (YouTube)
OpenAIs Operator kan bruke nettleseren for eksempel for å booke et bord på restaurant for deg. 📸: The AI Advantage (YouTube) Vis mer

OpenAI, selskapet bak ChatGPT, har lansert en ny "AI-agent" kalt Operator som ved hjelp av sin egen innebygde nettleser kan surfe på nettet og interagere med nettsidene ved å taste inn informasjon, klikke og scrolle.

Det skriver blant andre The Register og MIT Technology Review.

Dette skal være OpenAIs første AI-agent. Det betyr en AI-assistent som går lenger enn å bare svare på det du lurer på i et chatvindu, men som også kan utføre ulike handlinger. Som i dette tilfellet å bruke en nettleser.

Du bruker den ved å skrive inn hva du vil ha gjort, og så vil Operator gjøre oppgaven for deg i nettleseren. Du kan når som helst ta kontroll over nettleseren selv.

Ikke først

Hvis du synes du har hørt om noe lignende før, så er det fordi OpenAI – litt overraskende – er litt sent ute.

Allerede i oktober i fjor lanserte Anthropic sin Computer Use-agent, og i desember lanserte Google sitt Project Mariner. Begge to kan bruke nettleseren, og forstå hva som skjer på skjermen og bruke det til å utføre oppgaver for deg.

Ifølge MIT Technology Review hevder imidlertid OpenAI at Operator skal være bedre enn konkurrentene.

– Operator kan brukes til å håndtere et bredt spekter av repetitive oppgaver i nettleseren, som å fylle ut skjemaer, bestille dagligvarer og til og med lage memes, skriver OpenAI i lanseringsbloggposten.

Her kan du se en video av hvordan det fungerer:

Selskapet hevder løsningen kan hjelpe brukerne med å spare tid på hverdagslige oppgaver, og samtidig være nyttig for bedrifter.

Må ha 200-dollar-aboet

Operator drives av en ny AI-modell fra OpenAI kalt Computer-Using Agent (CUA). Denne bruker GPT-4o-modellens evne til å "se", og er lært opp til å interagere med grafiske brukergrensesnitt som først og fremst er laget for mennesker.

Operator er tilgjengelig i en forhåndsvisningsversjon som ifølge OpenAI fortsatt har en del begrensninger.

Den kanskje største begrensningen for oss her i Norge, er at Operator foreløpig bare kan brukes i USA – og du må ha det dyreste ChatGPT Pro-abonnementet som koster hele 200 dollar (2200 kroner) i måneden. Men dette er bare foreløpig, planen er å gjøre den tilgjengelig for alle betalte abonnementer senere.

Mens den første videoen lenger opp i saken er OpenAIs egen "reklamete" presentasjon av Operator, får du en mer uavhengig "test" av Operator her: