Osnovni proračuni problem
AI agenti pokazali slabosti: Matematika im zadaje muke
Podijeli vijest
Neuspjeh u proračunima
Iako tehnološki divovi obećavaju budućnost u kojoj će AI agenti obavljati zadatke umjesto nas, najnovija istraživanja otkrivaju značajne nedostatke u njihovom funkcionisanju. Pokazalo se da ovi sistemi, uprkos svom napretku, imaju ozbiljne probleme s osnovnom logikom i matematičkim proračunima.
Akumulacija grešaka
U današnjem tehnološkom svijetu, AI agenti su u velikoj mjeri popularni. Ovi sistemi, koji bi trebali samostalno upravljati računarima, plaćati račune ili planirati putovanja, pokazuju se ranjivima u ključnim aspektima. Istraživači su otkrili da je njihova ‘Ahilova peta’ upravo matematika.
Analize najsofisticiranijih modela dovele su do zabrinjavajućih rezultata. Problem leži u takozvanoj akumulaciji grešaka. Budući da AI agenti razlažu složene zadatke na niz manjih koraka, svaka manja greška u proračunu na početku dovodi do potpunog kolapsa cijele operacije.
Gubitak fokusa
Kada bi agent dobio zadatak koji zahtijeva više od nekoliko logičkih koraka, šansa za uspjeh bi se drastično smanjila. U praksi, ako im povjerite da vam izračunaju troškove i rezervišu hotel, lako se može desiti da ostanete i bez novca i bez smještaja.
Još jedan problem koji je studija istakla jeste da ovi sistemi često ‘zaborave’ prvobitni cilj. Dok pokušavaju riješiti jedan pod-zadatak, agenti se nerijetko zaglave u besmislenim ponavljanjima ili počnu generisati potpuno nebitne podatke, gubeći nit onoga što je korisnik zapravo tražio.
Katastrofalne performanse
‘Performanse su često bile katastrofalne čim bi se u jednačinu uvela malo kompleksnija logika’, navodi se u izvještaju koji prenosi Futurism.
Ovo istraživanje je svojevrsni ‘hladan tuš’ za kompanije kao što su Microsoft, Google i OpenAI. Dok se oni utrkuju ko će prije izbaciti pametnijeg asistenta, realnost je da ovi sistemi i dalje ne razumiju svijet oko sebe na način na koji to radi ljudski mozak.
Za sada, savjet je jasan: nemojte dozvoliti vještačkoj inteligenciji da vam vodi poslovne knjige ili rješava domaći iz matematike bez detaljne provjere.



