Google testira AI-generisane audio sažetke u pretragama
Podijeli vijest
Google eksperimentiše sa novom funkcijom unutar svojih rezultata pretrage, nazvanom “Audio Overview“. Ova opcija generiše audio sažetke pretraživanih tema, koje narativno predstavljaju dva AI-generisana “podcast voditelja” s izuzetno realističnim, ali ne sasvim ljudskim glasovima.
Kako funkcionira Audio Overview
Trenutno je Audio Overview eksperimentalna funkcija dostupna putem Search Labs-a, što znači da je morate ručno aktivirati. Trenutno je dostupna samo u Sjedinjenim Američkim Državama i generiše sažetke isključivo na engleskom jeziku.
Nakon aktivacije u Search Labs-u, neki Google pretraživanja će uključivati “Audio Overview” okvir, obično smješten ispod standardnog “AI Overview” i sekcije “People also ask”. Korisnik jednostavno pritisne dugme za generisanje audio sažetka i sačeka da se proces završi.
Generisani audio isječak kreira se u realnom vremenu, što znači da se može razlikovati ako se stranica osvježi i sažetak ponovo generiše. Sažeci koje su testirani trajali su od 3 do 5 minuta, a svi su sadržavali isti par AI glasova koji su razgovarali o pretraživanoj temi u stilu podcasta.
Kvalitet i izazovi AI glasova
Glasovi su značajno realističniji od očekivanog “robotskog” Siri zvuka. Prisutne su promjene u tonu, konverzacijski izbori riječi i naizgled prirodan jezik. Ipak, nisu u potpunosti realistični; dva glasa zvuče kao podcast voditelji bez pravog odnosa, koji čitaju s telepromptera. Dovoljno su uvjerljivi da bi neki ljudi u početku mogli biti prevareni.
Google prikazuje izvore, odnosno rezultate pretrage, koje je koristio za generisanje audio sažetka, omogućavajući korisnicima da provjere informacije. Međutim, s obzirom na to koliko realistično zvuče AI glasovi, postoji rizik da bi ih neki korisnici mogli smatrati stvarnim ljudima i prihvatiti ono što kažu kao činjenicu, što je problem koji postoji i kod tekstualnih AI sažetaka.
Postoje i određene greške koje odaju da se ne radi o ljudima. Na primjer, u jednom od sažetaka, jedan AI glas postavi pitanje, a zatim odmah sam odgovori, što zvuči prilično nezgrapno. Oba glasa povremeno koriste emocionalni jezik, poput usklika “Wow!” na neku zanimljivost, ali to zvuči ukočeno i daleko od prirodne ljudske reakcije. AI glasovi također povremeno pogrešno izgovaraju riječi, poput “musk” umjesto “must”.