OpenAI lansirao agenta koji preuzima zadatke umjesto korisnika
Foto: AP Photo/Michael Dwyer

OpenAI lansirao agenta koji preuzima zadatke umjesto korisnika

prije 6 h
Tags:
Podijeli vijest

OpenAI je predstavio novu funkcionalnost u ChatGPT-ju pod nazivom agent mode, koja omogućava chatbotu da obavlja konkretne zadatke umjesto korisnika, kao što su upravljanje kalendarom, generisanje prezentacija, analiziranje konkurenata i izvođenje kodova. Ovaj alat sada može samostalno “misliti i djelovati”, koristeći vlastito virtualno računalo i pristup API-ima.

“Rekao bih svojoj obitelji da je ovo najsuvremenija i eksperimentalna tehnologija – prilika da isprobate budućnost, ali nije još spremna za zadatke koji uključuju osjetljive podatke”, izjavio je direktor OpenAI-a Sam Altman.

Novi agent je trenutno dostupan korisnicima s Pro, Plus i Team pretplatama, a pokreće se putem izbornika alata. U demonstraciji je prikazano kako agent pomaže pri planiranju vjenčanja – od izbora odjeće do rezervacije hotela. Također, može:

  • analizirati konkurenciju i kreirati prijedloge u obliku prezentacija

  • povezati se s Gmailom i GitHubom radi izvlačenja projektnih informacija

  • isplanirati obrok i automatski kupiti sastojke online

Unatoč naprednim mogućnostima, agent funkcioniše uz brojna ograničenja. Ne može slati e-mailove bez direktne potvrde korisnika, a automatski odbija visokorizične radnje poput bankovnih transakcija. OpenAI je onemogućio memorijsku funkciju kako bi spriječio zloupotrebe i tzv. prompt injection napade.

Na testu Humanity’s Last Exam agent je ostvario 41,6 posto, što je dvostruko više u odnosu na prethodne modele, dok je na FrontierMath testu postigao 27,4 posto kada koristi napredne alate.

Konkurencija također ne miruje: Google radi na agentu koji rezerviše restorane i kupuje karte, dok Apple razvija novu, sposobniju verziju Siri, iako je njihov projekt trenutno zaustavljen.