OpenAI lansirao agenta koji preuzima zadatke umjesto korisnika
Podijeli vijest
OpenAI je predstavio novu funkcionalnost u ChatGPT-ju pod nazivom agent mode, koja omogućava chatbotu da obavlja konkretne zadatke umjesto korisnika, kao što su upravljanje kalendarom, generisanje prezentacija, analiziranje konkurenata i izvođenje kodova. Ovaj alat sada može samostalno “misliti i djelovati”, koristeći vlastito virtualno računalo i pristup API-ima.
“Rekao bih svojoj obitelji da je ovo najsuvremenija i eksperimentalna tehnologija – prilika da isprobate budućnost, ali nije još spremna za zadatke koji uključuju osjetljive podatke”, izjavio je direktor OpenAI-a Sam Altman.
Novi agent je trenutno dostupan korisnicima s Pro, Plus i Team pretplatama, a pokreće se putem izbornika alata. U demonstraciji je prikazano kako agent pomaže pri planiranju vjenčanja – od izbora odjeće do rezervacije hotela. Također, može:
analizirati konkurenciju i kreirati prijedloge u obliku prezentacija
povezati se s Gmailom i GitHubom radi izvlačenja projektnih informacija
isplanirati obrok i automatski kupiti sastojke online
Unatoč naprednim mogućnostima, agent funkcioniše uz brojna ograničenja. Ne može slati e-mailove bez direktne potvrde korisnika, a automatski odbija visokorizične radnje poput bankovnih transakcija. OpenAI je onemogućio memorijsku funkciju kako bi spriječio zloupotrebe i tzv. prompt injection napade.
Na testu Humanity’s Last Exam agent je ostvario 41,6 posto, što je dvostruko više u odnosu na prethodne modele, dok je na FrontierMath testu postigao 27,4 posto kada koristi napredne alate.
Konkurencija također ne miruje: Google radi na agentu koji rezerviše restorane i kupuje karte, dok Apple razvija novu, sposobniju verziju Siri, iako je njihov projekt trenutno zaustavljen.