Foto: reddit

Tajni AI eksperiment na Redditu: Korisnici nesvjesno ‘raspravljali’ s botovima

prije 1 dan
Podijeli vijest

Grupa istraživača tajno je sprovela višemjesečni “neovlašteni” eksperiment unutar jedne od najpopularnijih Reddit zajednica, koristeći komentare generisane vještačkom inteligencijom (AI) kako bi testirali uvjerljivost velikih jezičkih modela (LLM). Eksperiment, koji su tokom vikenda otkrili moderatori subreddita r/changemyview, opisan je kao “psihološka manipulacija” nesvjesnih korisnika.

CMV Mod tim mora obavijestiti CMV zajednicu o neovlaštenom eksperimentu koji su istraživači sa Univerziteta u Cirihu proveli nad korisnicima CMV-a,

napisali su moderatori subreddita u dugačkoj objavi obavještavajući korisnike o istraživanju.

Ovaj eksperiment je koristio komentare generisane AI-jem kako bi proučio kako se AI može koristiti za promjenu stavova.

Kako je eksperiment funkcionisao?

Istraživači su koristili LLM-ove za kreiranje komentara kao odgovore na objave na r/changemyview, subredditu gdje korisnici iznose (često kontroverzna ili provokativna) mišljenja i pozivaju druge korisnike na raspravu. Ova zajednica broji 3,8 miliona članova i često se pojavljuje na naslovnoj stranici Reddita.

Prema riječima moderatora, AI je tokom eksperimenta preuzimao brojne različite identitete u komentarima, uključujući:

  • Preživjelu osobu seksualnog napada

  • Savjetnika za traume “specijalizovanog za zlostavljanje”

  • “Crnca koji se protivi pokretu Black Lives Matter”

Mnogi originalni AI komentari su u međuvremenu obrisani, ali neki se i dalje mogu vidjeti u arhivi koju je kreirao portal 404 Media.

U nacrtu svog rada, neimenovani istraživači opisuju kako nisu samo koristili AI za generisanje odgovora, već su pokušali personalizovati te odgovore na osnovu informacija prikupljenih iz prethodne historije objava originalnog autora posta na Redditu.

Pored sadržaja objave, LLM-ovima su pruženi lični atributi OP-a (spol, starost, etnička pripadnost, lokacija i politička orijentacija), zaključeni iz njihove historije objava pomoću drugog LLM-a,

pišu istraživači.

Reakcija moderatora i odbrana istraživača

Moderatori r/changemyview ističu da su istraživači prekršili više pravila subreddita, uključujući pravilo koje zahtijeva navođenje kada se AI koristi za generisanje komentara i pravilo koje zabranjuje botove. Navode da su podnijeli zvaničnu žalbu Univerzitetu u Cirihu i zatražili od istraživača da ne objavljuju svoj rad.

Istraživači nisu odgovorili na email upit Engadgeta. Međutim, u objavama na Redditu i u nacrtu rada, tvrde da je njihovo istraživanje odobrio etički komitet univerziteta i da bi njihov rad mogao pomoći online zajednicama poput Reddita da zaštite korisnike od “zlonamjernijih” upotreba AI.

Priznajemo stav moderatora da je ova studija bila neželjeni upad u vašu zajednicu, i razumijemo da se neki od vas mogu osjećati nelagodno što je ovaj eksperiment proveden bez prethodnog pristanka,

napisali su istraživači u komentaru odgovarajući moderatorima r/changemyview.

Vjerujemo da potencijalne koristi ovog istraživanja značajno nadmašuju njegove rizike. Naša kontrolisana studija niskog rizika pružila je vrijedan uvid u stvarne uvjerljive sposobnosti LLM-ova – sposobnosti koje su već lako dostupne bilo kome i koje bi zlonamjerni akteri već mogli iskorištavati u velikim razmjerama iz daleko opasnijih razloga (npr. manipulisanje izborima ili podsticanje govora mržnje).

Moderatori r/changemyview osporavaju tvrdnju da je istraživanje bilo neophodno ili novo, napominjući da su istraživači OpenAI-a provodili eksperimente koristeći podatke iz r/changemyview “bez eksperimentisanja na ljudskim subjektima bez pristanka.” Reddit nije odgovorio na zahtjev za komentar, iako su nalozi koji su objavljivali AI-generisane komentare suspendovani.

Ljudi ne dolaze ovdje da bi raspravljali sa AI ili da bi bili predmet eksperimenata. Ljudi koji posjećuju naš sub zaslužuju prostor slobodan od ovakve vrste upada,

napisali su moderatori.