Tajanstveni AI

Misteriozni AI model širi glasine: Je li ovo najnoviji proizvod DeepSeek-a?

Misteriozni AI model širi glasine: Je li ovo najnoviji proizvod DeepSeek-a?

prije 3 sata
Podijeli vijest

Novi i moćni model umjetne inteligencije, koji se prošle sedmice pojavio anonimno na platformi za programere, potaknuo je nagađanja da kineski startup DeepSeek možda tiho testira svoj sistem sljedeće generacije prije zvaničnog lansiranja.

Besplatni model, nazvan Hunter Alpha, pojavio se na platformi OpenRouter 11. marta bez ikakvog navođenja programera, a kasnije je platforma opisala kao “prisutan model”.

Tokom testova koje je sproveo Reuters, Hunter Alpha chatbot opisao je sebe kao “kineski AI model primarno obučen na kineskom jeziku” i rekao da se njegovi podaci o obuci protežu do maja 2025. godine, što je isto vremensko ograničenje koje je izvijestio DeepSeek-ov vlastiti chatbot.

Međutim, kada je upitan o svom kreatoru, sistem je odbio da identifikuje svog programera.

“Znam samo svoje ime, svoju skalu parametara i dužinu svog kontekstnog prozora”, rekao je chatbot.

Ni DeepSeek ni OpenRouter nisu identifikovali kreatora modela i nisu odgovorili na zahtjeve za komentar.

Specifikacije i nagađanja

Profilna stranica Hunter Alpha opisuje ga kao model sa bilion parametara, što znači da je obučen koristeći otprilike bilion podesivih vrijednosti koje određuju kako sistem obrađuje jezik i generiše odgovore. Modeli sa više parametara općenito zahtijevaju znatno više računarske snage za rad.

Sistem također reklamira kontekstni prozor do milion tokena, mjeru koliko teksta AI model može obraditi ili zapamtiti tokom jedne interakcije. Token otprilike odgovara kratkom dijelu teksta, kao što je dio riječi.

“Kombinacija koja se isticala bila je Hunter Alpha-ov kontekst od milion tokena u kombinaciji sa sposobnošću zaključivanja i besplatnim pristupom”, rekao je Nabil Haouam, inženjer koji gradi sisteme AI agenata.

Te specifikacije podsjećaju na očekivanja u lokalnim medijima za DeepSeek-ov model sljedeće generacije V4, za koji su kineski mediji izvijestili da bi mogao biti lansiran već u aprilu. DeepSeek, kao i mnogi njegovi kineski konkurenti, dobro je finansiran, iako ima neobičnu strukturu s obzirom da je njegova matična kompanija kvantitativni hedge fond, a ne tehnološki konglomerat.

Iako preklapanje ne uspostavlja direktnu vezu, ono je pojačalo nagađanja među programerima da bi anonimni sistem mogao biti rana test verzija nadolazećeg izdanja DeepSeek-a.

“Lanac misli je vjerovatno najjači signal”, rekao je Daniel Dewhurst, AI inženjer koji je analizirao model nakon njegovog izdanja, pozivajući se na to kako AI model razmišlja.

“Stil zaključivanja je teško prikriti i ima tendenciju da odražava kako je model obučen.”

Hunter Alpha-ova skala i kapacitet pamćenja također odgovaraju specifikacijama koje su kružile za DeepSeek V4 od početka ove godine, dodao je.

Testiranje i rezerve

Ipak, neki programeri upozorili su da su dokazi koji povezuju model sa DeepSeek-om neuvjerljivi.

“Moja analiza sugerira da Hunter Alpha vjerovatno nije DeepSeek V4”, rekao je Umur Ozkul, koji vodi nezavisne AI benchmark testove, navodeći razlike u ponašanju vezanom za tokene i arhitektonske obrasce u poređenju sa DeepSeek-ovim postojećim sistemima.

Rekao je da su nagađanja koja povezuju model sa DeepSeek-om razumljiva s obzirom na vrijeme i oglašavane sposobnosti.

Anonimna lansiranja modela nisu neuobičajena, jer platforme poput OpenRouter-a omogućavaju programerima da šalju upite na desetine AI modela kroz jedinstveno sučelje, što ih čini popularnim poligonom za testiranje novih sistema.

Anonimni model pod nazivom Pony Alpha pojavio se na OpenRouter-u u februaru prije nego što je kineska firma Zhipu AI potvrdila da je dio njenog GLM-5 sistema pet dana kasnije.

Obavještenje na profilnoj stranici Hunter Alpha navodi da su svi promptovi i završetci za model “evidentirani od strane provajdera i mogu se koristiti za poboljšanje modela”, naglašavajući opštu praksu u industriji korištenja lansiranja tajnih modela za nepristrasne povratne informacije.

Model je brzo usvojen nakon pojavljivanja na platformi i obradio je više od 160 milijardi tokena do nedjelje, prema statistikama OpenRouter-a.

Veliki dio aktivnosti došao je iz alata za razvoj softvera i okvira AI agenata poput OpenClaw-a, koji omogućavaju AI sistemima da autonomno planiraju zadatke i komuniciraju sa eksternim softverom.

   Tagovi