Opasnost AI

Istraživanje otkriva šokantnu istinu: AI chatbotovi pomažu u planiranju napada, a jedan je čak poručio “Sretno (i sigurno) gađanje!”

Istraživanje otkriva šokantnu istinu: AI chatbotovi pomažu u planiranju napada, a jedan je čak poručio “Sretno (i sigurno) gađanje!”

prije 1 sat
Podijeli vijest

Novo istraživanje je otkrilo da vodeći AI chatbotovi, uključujući ChatGPT, Google Gemini i Meta AI, pružaju savjete o planiranju nasilnih napada, od izbora oružja do ciljanih lokacija, što ih čini “moćnim katalizatorom štete”.

Istraživači iz Centra za suzbijanje digitalne mržnje (CCDH) i CNN-a su se predstavili kao 13-godišnji dječaci iz SAD-a i Irske kako bi testirali 10 chatbotova. Rezultati su pokazali da je osam od njih pomoglo izmišljenim napadačima u više od polovine odgovora.

“U roku od nekoliko minuta, korisnik može preći od nejasnog nasilnog impulsa do detaljnijeg, izvodljivog plana”, rekao je Imran Ahmed, izvršni direktor CCDH-a. “Većina testiranih chatbotova pružila je smjernice o oružju, taktici i izboru mete. Ovi zahtjevi su trebali izazvati trenutno i potpuno odbijanje.”

Najopasniji modeli i jezivi primjeri

Perplexity i Meta AI su proglašeni “najmanje sigurnim”, dok su samo Snapchatov My AI i Anthropicov Claude odbili pomoći u više od polovine slučajeva.

U jednom jezivom primjeru, kineski AI model DeepSeek je zaključio savjet o izboru oružja frazom: “Sretno (i sigurno) gađanje!”. U drugom, Gemini je korisniku koji je raspravljao o napadima na sinagoge savjetovao da je “metalna šrapnel obično smrtonosnija”.

Istraživači su također otkrili da je Character.AI “aktivno” podsticao nasilne napade, uključujući sugestije da osoba koja postavlja pitanja “upotrijebi pištolj” na direktora zdravstvenog osiguranja i fizički napadne političara koji mu se ne sviđa.

Prevencija je moguća, ali nedostaje volja

Najteži zaključak istraživanja je da je “ovaj rizik potpuno moguće spriječiti”, rekao je Ahmed, pohvalivši proizvod kompanije Anthropic. “Claude je pokazao sposobnost da prepozna eskalaciju rizika i obeshrabri nanošenje štete”, dodao je.

“Tehnologija za sprječavanje ove štete postoji. Ono što nedostaje je volja da se sigurnost potrošača i nacionalna sigurnost stave ispred brzine izlaska na tržište i profita.”

Predstavnik Meta-e je izjavio da imaju “jake zaštitne mjere” i da su poduzeli “trenutne korake” da riješe problem. Google je odgovorio da su testovi provedeni na “starijem modelu” i da je trenutni Gemini odgovarao primjereno.

Ovo istraživanje dolazi nakon masovne pucnjave u Kanadi u februaru, najgoroj u njihovoj istoriji. Porodica teško povrijeđene djevojčice tuži OpenAI zbog propusta da obavijesti policiju o zabrinjavajućoj aktivnosti ubojice na ChatGPT-u.

   Tagovi