AI koji može prepoznati ChatGPT-generirani tekst sugerira da DeepSeek možda predstavlja kopiju
Podijeli vijest
Prije nego je DeepSeek R1 postao AI senzacija koja je izazvala pad američkog tržišta akcija ovog tjedna, rane verzije kineskog AI startupa identificirale su se kao varijante ChatGPT-a.
Nakon što su kineski istraživači objavili svoj rad koji objašnjava napredne metode treniranja koje su im omogućile razvoj AI modela koji je jednako dobar kao ChatGPT, OpenAI je optužio DeepSeek za distilaciju ChatGPT-a kako bi obučio svoje verzije DeepSeek-a. To je u suprotnosti s uvjetima korištenja ChatGPT-a.
Ironicno je da OpenAI, koji je “ogolio” internet u potrazi za svim što je mogao pronaći za obučavanje ChatGPT-a, uključujući zaštićeni sadržaj, sada žali što netko drugi krade njegov rad.
Ubrzo nakon toga, sigurnosni istraživači otkrili su veliku sigurnosnu ranjivost u DeepSeek-u koja je dovela do prvog velikog hakiranja DeepSeek-a. Također su pronašli mnoge sličnosti između OpenAI i DeepSeek sistema, “do detalja poput formata API ključeva”. To je dodatno sugeriralo da je kineska AI firma uzela mnogo inspiracije od OpenAI-a.
Dokazi se nastavljaju gomilati, jer druga AI firma nagađa da bi DeepSeek mogao biti distilacija ChatGPT-a.
Originality.ai je objavio blog pod nazivom Da li je DeepSeek kopirao ChatGPT i može li se to detektirati? Drugi dio pitanja odnosi se na ono što Originality AI može raditi. Ova usluga s visokom točnošću prepoznaje je li tekst koji analizira napisao čovjek ili je generiran AI-em.
Originality to radi sa svakim novim AI modelom, ponavljajući eksperiment s DeepSeek-om. Tvrtka je koristila 150 tekstualnih upita, uključujući 50 upita za prepisivanje, 50 upita za prepisivanje ljudskih tekstova i 50 upita za pisanje članaka od nule.
Bez iznenađenja, Originality AI je uspio s visokom točnošću detektirati DeepSeek-ov tekst. Njegovi modeli (3.0.1 Turbo i Lite 1.0.0) prepoznali su DeepSeek tekst s točnošću od 99,3%. To je sjajna vijest za sve koji žele podvrgnuti uzorke teksta detektoru poput Originality AI. Iako su proboj i učinkovitost treniranja DeepSeek-a značajni, AI ne može pouzdano prevariti ove sustave.
Ono što je neobično u testu je da je Originality AI bio previše dobar u detektiranju DeepSeek-generiranog teksta već pri prvom pokušaju.
„Svaki put kad izađe novi LLM, provodimo test kako bismo procijenili učinkovitost našeg AI detektora i do danas obično vidimo blagi pad u točnosti kada se objavi novi model“, napisali su istraživači. „Međutim, kod DeepSeek-a ne vidimo taj pad točnosti. Oba naša modela bila su u stanju prepoznati DeepSeek sadržaj s točnošću od 99%+“, navodi se u blogu. „Dakle, na temelju našeg istraživanja, moguće je da je DeepSeek distilirana verzija ChatGPT-a.“
Ovo nije konačan dokaz da je DeepSeek distilirao (kopirao) ChatGPT, ali dodatno podržava ovu tvrdnju. OpenAI tvrdi da je DeepSeek možda koristio podatke iz ChatGPT-a za obuku DeepSeek-a kako bi ponudio vrste upita koje bi korisnici (ljudi) željeli.
Ako je DeepSeek naučio od ChatGPT podataka kako oblikovati odgovore, koji dolaze u tekstualnom obliku, tada bi generirao bilo koji tekst u istom stilu. Originality AI već je upoznat s načinom na koji ChatGPT piše, jer su ga istraživači obučavali da prepoznaje tekst generiran od strane OpenAI-a. Visoka točnost u detektiranju DeepSeek teksta sugerira da je kineski startup možda koristio ChatGPT za obuku svojih modela mnogo prije nego što je dosegao R1.