Analiza halucinacija

AI halucinacije: Perplexity AI najprecizniji, Gemini najlošiji

prije 2 mjeseca

Veliki jezički modeli funkcionišu tako što prepoznaju obrasce i predviđaju sljedeću najvjerovatniju riječ u nizu, a ne tako što zaista “znaju” činjenice. Do problema dolazi kada model ne može da pronađe jasan obrazac za odgovor, ali ipak pokuša da sastavi smislen tekst na osnovu statistike, što može dovesti do netačnih informacija.

Kompanija Legal Guardian Digital, koja se bavi SEO optimizacijom za pravne firme, analizirala je učestalost grešaka ovih alata, zadovoljstvo korisnika i stabilnost rada različitih chatbotova. Rezultati pokazuju da Google Gemini ima najveću stopu netačnih odgovora, sa čak 32 posto “halucinacija”. Slijedi ChatGPT sa približno 30 posto, dok je najprecizniji Perplexity AI, sa oko 13 posto pogrešnih odgovora. DeepSeek i Grok također bilježe relativno niske stope grešaka od 14 i 15 posto.

Kada je riječ o ukupnom utisku korisnika, DeepSeek i ChatGPT imaju najvišu ocjenu zadovoljstva od 4,7 (od maksimalnih 5), dok Perplexity AI prati sa 4,6. U konačnom rangiranju, koje uključuje sve faktore, Perplexity AI zauzima prvo mjesto sa indeksom 85, zatim slijede Grok i DeepSeek. ChatGPT se našao na sredini liste sa skorom 50, dok je Gemini ostvario 41, a Meta AI zauzela posljednje mjesto sa 37 poena.

Izvor: https://legalguardian.io/

Analiza halucinacija

AI halucinacije: Perplexity AI najprecizniji, Gemini najlošiji

AI halucinacije: Perplexity AI najprecizniji, Gemini najlošiji

Tagovi

Video

Zaboravite pauze za kafu, humanoidni roboti upravo su odradili 8-satnu smjenu na nivou čovjeka! (VIDEO)

Možda Vas interesuje

Ljetni red vožnje u Lukavcu: Uvodi se i linija 9-ka prema Tuzli

Trumpova UFC priredba u Bijeloj kući: Sudija odbio zahtjev za blokadu

Noris dominirao na drugom treningu u Barseloni

Budite uvijek u toku! 🚀