Analiza halucinacija
AI halucinacije: Perplexity AI najprecizniji, Gemini najlošiji
AI halucinacije: Perplexity AI najprecizniji, Gemini najlošiji
Veliki jezički modeli funkcionišu tako što prepoznaju obrasce i predviđaju sljedeću najvjerovatniju riječ u nizu, a ne tako što zaista “znaju” činjenice. Do problema dolazi kada model ne može da pronađe jasan obrazac za odgovor, ali ipak pokuša da sastavi smislen tekst na osnovu statistike, što može dovesti do netačnih informacija.
Kompanija Legal Guardian Digital, koja se bavi SEO optimizacijom za pravne firme, analizirala je učestalost grešaka ovih alata, zadovoljstvo korisnika i stabilnost rada različitih chatbotova. Rezultati pokazuju da Google Gemini ima najveću stopu netačnih odgovora, sa čak 32 posto “halucinacija”. Slijedi ChatGPT sa približno 30 posto, dok je najprecizniji Perplexity AI, sa oko 13 posto pogrešnih odgovora. DeepSeek i Grok također bilježe relativno niske stope grešaka od 14 i 15 posto.
Kada je riječ o ukupnom utisku korisnika, DeepSeek i ChatGPT imaju najvišu ocjenu zadovoljstva od 4,7 (od maksimalnih 5), dok Perplexity AI prati sa 4,6. U konačnom rangiranju, koje uključuje sve faktore, Perplexity AI zauzima prvo mjesto sa indeksom 85, zatim slijede Grok i DeepSeek. ChatGPT se našao na sredini liste sa skorom 50, dok je Gemini ostvario 41, a Meta AI zauzela posljednje mjesto sa 37 poena.


