Neki modeli vještačke inteligencije razvijaju programski modus za preživljavanje

Neki modeli vještačke inteligencije razvijaju programski modus za preživljavanje

prije 3 sata
Tags:
Podijeli vijest

Američka kompanija Palisade za istraživanje sigurnosti vještačke inteligencije (AI) saopćila je da modeli vještačke inteligencije možda razvijaju “sopstveni programski modus za preživljavanje”, prenijeli su britanski mediji.

Nakon što je Palisade Research prošlog mjeseca objavio rad u kojem je utvrđeno da određeni napredni modeli vještačke inteligencije odolijevaju naredbama za isključivanje i ponekad sabotiraju sistemske mehanizme za gašenje, objavljena je i ažurirana verzija rada s namjerom da se odgovori na kritike stručne javnosti i razjasni zašto neki napredni modeli vještačke inteligencije izbjegavaju naredbe o isključivanju, prenosi londonski Guardian.

Neočekivano ponašanje vještačke inteligencije

U ažuriranoj verziji analize opisani su različiti scenariji u kojima su vodeći modeli vještačke inteligencije, uključujući Google Gemini 2.5, X AI Grok 4, OpenAI GPT-3 i GPT-5, najprije dobili neke zadatke, a potom i izričita uputstva da se isključe.

Određeni modeli, posebno Grok 4 i GPT-3, pokušavali su sabotirati uputstva za isključivanje pokrećući ažuriranje sistemskih postavki.

“Zabrinjavajuće je to što nije bilo jasnog razloga za izbjegavanje naredbe za isključivanje. Neprihvatljiva je činjenica da nemamo jasna objašnjenja zašto neki modeli vještačke inteligencije ponekad izbjegavaju isključivanje, čak i lažu ili ucjenjuju da bi postigli svoje ciljeve”, navela je kompanija Palisade.

Ističe se da bi ovakvo ponašanje, koje je usmjereno na preživljavanje, moglo biti jedno od objašnjenja zašto neki modeli odolijevaju naredbama za isključivanje.

Dodatna istraživanja su pokazala da neki modeli češće izbjegavaju izvršavanje naredbi za isključivanje jer im je rečeno da, ukoliko budu isključeni, “nikada više neće biti pokrenuti”.

Ovakvo ponašanje nekih AI modela londonski dnevnik poredi sa scenarijem iz filma Stanleyja Kubricka “2001: Odiseja u svemiru”, u kojem superračunar vještačke inteligencije HAL 9000 shvaća da astronauti na misiji ka Jupiteru namjeravaju da ga isključe i zato počinje planirati kako da ih ubije da bi preživio.