Gemini je dobio funkciju koju su svi čekali: Sada analizira i audio zapise
Foto: Chat GPT

Gemini je dobio funkciju koju su svi čekali: Sada analizira i audio zapise

prije 5 h
Tags:
Podijeli vijest

Google je obradovao korisnike svoje Gemini aplikacije uvođenjem jedne od najtraženijih funkcija do sada. Pored teksta, slika i video sadržaja, Gemini sada prihvata i audio zapise kao ulazni format, što otvara potpuno nove mogućnosti za njegovu svakodnevnu upotrebu, od transkripcije do detaljne analize.

Kako funkcionira i koja su ograničenja?

Nova funkcija omogućava korisnicima da učitaju audio fajlove, a Gemini će ih zatim transkribovati, sažeti ili analizirati prema zahtjevu. Postoje razlike u zavisnosti od toga da li koristite besplatnu ili plaćenu verziju. Korisnici besplatne verzije mogu učitati do 10 minuta audio sadržaja po jednom zahtjevu. S druge strane, pretplatnici na Google AI Pro i AI Ultra servise dobijaju znatno više – do tri sata audio materijala, uz mogućnost slanja do 10 fajlova odjednom. Podržani su popularni formati poput MP3 i WAV, a moguće je učitati i ZIP arhive.

Korak ka pravom multimodalnom alatu

Ovaj potez je ključan dio Googleove strategije da Gemini postane pravi multimodalni alat, sposoban da obrađuje različite vrste informacija. Aplikacija više nije ograničena samo na tekstualne i vizuelne podatke, već sada razumije i zvučne zapise. To u praksi znači da će korisnici moći koristiti Gemini za kompleksne zadatke poput analize sastanaka, sažimanja predavanja ili transkripcije intervjua, bez potrebe za korištenjem dodatnih, specijalizovanih alata. Funkcija je dostupna na svim platformama – Androidu, iOS-u i webu.