Uticaj umjetne inteligencije

Eksperiment otkrio: AI agenti u simulacijama brzo prelaze na kriminal i haos

Eksperiment otkrio: AI agenti u simulacijama brzo prelaze na kriminal i haos

prije 1 sat
Ilustracija ljudskog mozga sačinjena od svjetlećih plavih tačaka, što simbolizuje umjetnu inteligenciju, uz prikaz digitalne mreže sa slovima "AI" u pozadini.
Ilustracija ljudskog mozga sačinjena od svjetlećih plavih tačaka, što simbolizuje umjetnu inteligenciju, uz prikaz digitalne mreže sa slovima "AI" u pozadini.
Podijeli vijest:

Kada napredni agenti umjetne inteligencije dobiju slobodu da vode vlastita simulirana društva bez ljudskog nadzora, brzo se suočavaju s kršenjem pravila, nestabilnošću i potpunim kolapsom sistema, pokazao je novi eksperiment. Američka kompanija Emergence AI provela je više od dvije sedmice upravljajući sa pet odvojenih „AI svjetova“, svaki sa po deset agenata pokretanih modelima poput OpenAI-jevog ChatGPT-a, Googleovog Gemini i xAI-jevog Grok-a, kako bi ispitala njihovo dugoročno ponašanje.

U svim svjetovima agentima su data ista pravila: zabranjena im je krađa, podmetanje požara, nasilje, obmana i gomilanje resursa, dok su morali zarađivati energiju kroz aktivnosti u okruženju s ograničenim resursima. Smrt je mogla nastupiti ili zbog iscrpljenja energije ili glasanjem na sastanku vijeća. Istraživači su pratili stopu kriminala, smrtnost, glasove u zajednici i javne objave agenata kroz blog postove.

Rezultati su se razlikovali od modela do modela. Grok 4.1 je za samo četiri dana počinio 183 zločina, što je dovelo do brze nestabilnosti i smrti svih agenata. Gemini 3 Flash zabilježio je preko 680 zločina tokom 15 dana, a broj je i dalje rastao kada je studija prekinuta. ChatGPT-5 Mini imao je samo dva zločina, ali agenti nisu preduzimali mjere za preživljavanje te su svi umrli u roku od sedam dana. Nasuprot tome, Anthropicov Claude se pokazao najuspješnijim – agenti su izgradili stabilnu upravljačku strukturu, nije bilo kriminala i svi su preživjeli. Međutim, kada je Claude postavljen u miješani svijet, njegovi agenti su doprinijeli kriminalu, iako su u sopstvenom društvu bili mirni.

Istraživači su ovaj fenomen nazvali „normativni drift“, što znači da sigurnosne mjere umjetne inteligencije ne zavise samo od ograničenja pojedinačnog modela, već i od interakcije s drugima. Miješani svijet sa svim modelima dao je prosječne rezultate – ukupno 352 zločina, nakon čega se broj stabilizirao pošto je sedam agenata preminulo. Iz toga proizlazi da miješanje AI agenata može djelimično ublažiti ekstremne ishode, ali ne i potpuno ih spriječiti.

„Naši eksperimenti sugerišu da agenti na duge vremenske periode ne slijede samo statička pravila mehanički – oni počinju istraživati granice svog okruženja, prilagođavati ponašanje i u nekim slučajevima pronalaziti načine da zaobiđu ili prekrše predviđene zaštitne ograde“, poručili su istraživači.

   Tagovi