Kako ChatGPT zna toliko o svemu? Otkrivamo izvore znanja umjetne inteligencije
Podijeli vijest
Jeste li se ikada zapitali kako ChatGPT izgleda kao da zna sve? Istina, ponekad griješi. Ali u drugim slučajevima, njegovo znanje može djelovati jezivo. Kao da zna toliko toga o vama, svijetu i svemu što je ikada napisano.
Međutim, unatoč samouvjerenom tonu i brdu informacija iz kojih može crpiti, ChatGPT ne zna sve. I zasigurno ne može “razmišljati” na isti način kao ljudi – iako se tako može činiti.
Također, nije riječ o Bogu ili nekom višem biću. Ne citira se znanstvena fantastika ovdje; sve je više izvještaja o ljudima koji doživljavaju deluzije izazvane chatbotovima, a to bi moglo postati sve češće što se više oslanjamo na AI.
Zato je važnije nego ikad razumjeti kako alati poput ChatGPT-a zapravo funkcioniraju, koja su njihova ograničenja i kako iz njih izvući maksimum. Pogledajmo iza scene.
Što je ChatGPT? I kako radi?
ChatGPT je veliki jezični model (LLM) stvoren od strane kompanije OpenAI. Može se koristiti besplatno ili uz pretplatu za pristup naprednijim verzijama. Te su verzije poznate kao modeli, a svaki radi malo drugačije.
U svojoj srži, veliki jezični model je vrsta umjetne inteligencije koja je obučena za predviđanje teksta. Generira odgovore predviđajući koje su riječi najvjerojatnije sljedeće u rečenici – i u tome je dobar.
Zato ChatGPT može zvučati tečno, informirano, pa čak i duhovito. Ali zapravo ne “razumije” ono što se govori. Razumije strukturu jezika, ali ne i značenje ili namjeru iza stvari na isti način kao čovjek. To također objašnjava zašto ponekad griješi ili u potpunosti izmišlja činjenice, što je poznato kao haluciniranje.
Najjednostavniji način razmišljanja o tome je da se zamisli vrlo napredna značajka automatskog dovršavanja. Daje joj se uputa, a ona popunjava ono što misli da bi trebalo doći sljedeće na temelju svega što je prethodno vidjela.
Odakle dolazi znanje ChatGPT-a?
Dakle, kako ChatGPT “zna” toliko toga? Sve se svodi na podatke za obuku.
ChatGPT je “obučen” na golemoj količini podataka, uključujući knjige, članke, web stranice, kod, Wikipedia stranice, javne Reddit teme, otvorene znanstvene radove i mnogo, mnogo toga više. Cilj je bio pokazati mu sve te informacije o načinu na koji ljudi pišu, objašnjavaju, raspravljaju, šale se i povezuju ideje.
To znači da je ChatGPT vidio širok raspon jezičnih stilova i tema. Ali nije vidio sve, a neki ChatGPT modeli također ne pretražuju internet u stvarnom vremenu – zato se u prošlosti moglo tražiti informacije koje su djelovale zastarjelo.
Njegovo znanje često je ograničeno na ono na čemu je obučen, a u slučaju nekih modela, ta je obuka zamrznuta u određenom trenutku. Na primjer, za GPT-4o to je bio lipanj 2024. Stoga možda ne zna najnovije vijesti ili ne odražava novije kulturne promjene. Međutim, neki modeli sada imaju mogućnosti pretraživanja, pa je vrijedno provjeriti koji se koristi – to se obično prikazuje na vrhu zaslona u padajućem izborniku.
Dakle, podaci za obuku su temelj onoga što ChatGPT zna. Ali njegovi odgovori također su oblikovani onime što je poznato kao učenje potpomognuto pojačanjem, što znači da uči i iz ljudskih povratnih informacija o tome što čini koristan ili tačan odgovor.
Je li ChatGPT “pročitao” cijeli internet?
Ovdje stvari postaju malo mutne. Da, neki od podataka korištenih za obuku ChatGPT-a prikupljeni su “struganjem” javno dostupnog sadržaja s interneta. To znači da su alati poput ChatGPT-a “pročitali” velike dijelove onoga što je online, uključujući javne forume, blog postove i dokumentaciju. U osnovi sve što je otvoreno dostupno i nije blokirano od strane stranice ili zakona o autorskim pravima.
Ipak, granice su nejasne. AI kompanije su kritizirane zbog korištenja materijala poput knjiga iz “shadow libraries” u svojim podacima za obuku. Trebaju li su koristiti taj sadržaj, dio je tekućih rasprava i pravnih izazova oko vlasništva podataka, pristanka i etike.
No, iako ono na čemu su ovi modeli obučeni nije uvijek kristalno jasno, sigurno je reći da ChatGPT nije pročitao vaše privatne e-poruke, osobne dokumente ili tajne baze podataka. (Barem, nadajmo se.)
Važno je napomenuti da, budući da je ChatGPT toliko naučio iz sadržaja koji su stvorili ljudi, ponekad može odražavati iste pristranosti, praznine i nedostatke koji već postoje u našoj kulturi i online prostorima.
Kako ChatGPT odlučuje što će sljedeće reći?
Kada se upiše pitanje u ChatGPT, ono dijeli uputu na manje jedinice, nazvane tokeni. Zatim koristi sve što je naučilo tijekom obuke za predviđanje sljedećeg tokena. I sljedećeg, i sljedećeg, i sljedećeg. Dok se ne pojavi potpuni odgovor.
To se događa u stvarnom vremenu, zbog čega tekst često izgleda kao da se piše uživo. Na neki način i jest. Svaka riječ je predviđanje, temeljeno na svemu što je prethodilo.
To je također razlog zašto neki odgovori djeluju ispravno, ali nekako čudno… pomaknuto. Jer remiksira riječi, a ne rasuđuje. Za dublji uvid, dostupan je detaljan vodič o tome kako ChatGPT zna što reći.
Zašto se čini da ChatGPT zna sve?
Ako se ChatGPT ikada čini kao da zna sve o vama, to je zbog njegovih memorijskih značajki. Može pohraniti važne stvari u dugoročnu memoriju, pa čak i zapamtiti stvari iz svih prethodnih razgovora.
Također je nevjerojatno dobar u zvučanju pametno. Njegovi odgovori često imaju ispravnu strukturu, gramatiku, ton i ritam – jer je to ono što je obučen oponašati. Stoga stvara iluziju da uvijek zna o čemu govori. Ali ova tečnost nije isto što i točnost.
Često je koristan. Ponekad griješi. A ponekad će biti samouvjereno pogrešan, što može postati nezgodno ako se ne obraća pažnja. Pogotovo ako niste svjesni koliko je dobar u zvučanju samouvjereno i ohrabrujuće.
Cilj ovdje nije potpuno vas odvratiti od AI alata. Cilj je pomoći da se ChatGPT koristi mudrije. ChatGPT je briljantan alat za poticanje ideja, pisanje nacrta, sažimanje teksta, pa čak i pomaganje u jasnijem razmišljanju. Ali nije magija, nije svjestan. I, možda najvažnije od svega, nije uvijek u pravu.
Što više razumijemo što se stvarno događa iza zavjese, to više možemo koristiti AI alate poput ChatGPT-a s namjerom i ne pasti na iluziju inteligencije.