DeepSeek unaprijedio R1 model i pojačava konkurenciju SAD-u
Podijeli vijest
Kineski start-up za umjetnu inteligenciju DeepSeek objavio je prvu nadogradnju svog popularnog R1 modela u ranim jutarnjim satima četvrtka, čime je pojačao takmičenje s američkim rivalima poput OpenAI-ja.
Preko platforme za developere Hugging Face, DeepSeek je saopćio da je verzija R1-0528 manja nadogradnja koja je značajno unaprijedila sposobnost rezonovanja i izvođenja zaključaka, posebno u složenim zadacima. Ova poboljšanja približila su performanse modela onima OpenAI-jeve o3 serije i Googleovog Gemini 2.5 Pro.
Prvobitno lansiranje R1 modela u januaru postalo je globalni hit, izazvalo pad dionica tehnoloških kompanija van Kine i dovelo u pitanje stav da razvoj AI-a zahtijeva ogromnu računalnu moć i ulaganja. Od tada su kineski giganti poput Alibabe i Tencenta predstavili modele koji tvrde da nadmašuju DeepSeek.
Za razliku od detaljne prezentacije R1 u januaru praćene akademskim radom, ova nadogradnja donijela je malo tehničkih detalja. Kasnije je DeepSeek na platformi X kratko naveo da je izvedba modela poboljšana, dok je duži post na WeChatu istaknuo smanjenje lažnih ili netočnih odgovora (“halucinacija”) za oko 45-50% u zadacima poput preformulisanja i sažimanja.
Također, model sada može kreativno pisati eseje, romane i druge žanrove te ima bolje sposobnosti u generisanju front-end koda i simulaciji uloga.
“Model je pokazao izvanredne rezultate u raznim testiranjima, uključujući matematiku, programiranje i opštu logiku,” navodi DeepSeek.
Njihov uspjeh je narušio uvjerenje da američke izvozne kontrole koče napredak kineske AI industrije, jer su predstavili modele koji su jednaki ili bolji od vodećih američkih modela, ali uz znatno niže troškove.
DeepSeek je također objavio da je verzija njihove nadogradnje korištena za poboljšanje Alibaba modela Qwen 3 8B Base putem procesa nazvanog destilacija, čime je postignut rast performansi od preko 10% u odnosu na originalni model.
“Vjerujemo da će lanac razmišljanja iz DeepSeek-R1-0528 imati značajnu ulogu kako u akademskom istraživanju modela rezonovanja, tako i u industrijskom razvoju malih modela,” poručili su iz kompanije.
U izvještaju Bloomberg je objavio da je DeepSeek završio tzv. “manju probnu nadogradnju” i da korisnici mogu početi s testiranjem.
Zbog konkurencije DeepSeek-u, Google je uveo jeftinije pristupne nivoe za svoj Gemini, dok je OpenAI snizio cijene i lansirao o3 Mini model koji koristi manje računalne snage.
DeepSeek se i dalje očekuje da uskoro predstavi R2, nasljednika R1. Reuters je u martu izvijestio da je izlazak R2 bio planiran za maj, dok je DeepSeek u martu također objavio nadogradnju svog velikog jezičkog modela V3.