ChatGPT, DALL-E i drugi AI alati mogu pomoći u zaštiti od prevara i dezinformacija

Novinar

3 years ago

Ubrzo nakon što su procurile glasine o predstojećoj optužnici protiv bivšeg predsjednika Donalda Trumpa, na internetu su se pojavile slike koje navodno pokazuju njegovo hapšenje. Ove slike su izgledale kao novinske fotografije, ali su bile lažne. Stvoreni su generativnim sistemom vještačke inteligencije.

Generativni AI, u obliku generatora slika kao što su DALL-E, Midjourney i Stable Diffusion, i generatora teksta kao što su Bard, ChatGPT, Chinchilla i LLaMA, eksplodirao je u javnoj sferi. Kombinacijom pametnih algoritama za mašinsko učenje sa milijardama komada sadržaja koji su generisali ljudi, ovi sistemi mogu učiniti bilo šta od stvaranja jezivo realistične slike, sintetiziranja govora u glasu predsjednika Joe Bidena, zamjene sličnosti jedne osobe drugom u videu , ili napisati koherentan tekst od 800 riječi iz naslova.

Čak i u ovim ranim danima, generativni AI je sposoban stvoriti vrlo realističan sadržaj. Sophie Nightingale je otkrila da prosječna osoba nije u stanju da pouzdano razlikuje sliku stvarne osobe od osobe koju je stvorila umjetna inteligencija. Iako audio i video još nisu u potpunosti prošli kroz jezovitu dolinu, slike ili modeli ljudi koji su uznemirujući jer su blizu, ali nisu baš realistični, vjerovatno će uskoro. Kada se to dogodi, a gotovo je zagarantovano, biće sve lakše iskriviti stvarnost.

U ovom novom svijetu, bit će vrlo lako brzo napraviti video na kojem izvršni direktor kaže da je profit njegove kompanije pao za 20%, što bi moglo dovesti do gubitka milijardi na tržišnom udjelu, ili stvoriti snimak svjetskog lidera koji preti vojnom akcijom, što bi moglo izazvati geopolitičku krizu, ili ubaciti lik bilo koga u seksualno eksplicitan video.

Napredak u generativnoj umjetnoj inteligenciji uskoro će značiti da će se lažni, ali vizualno uvjerljivi sadržaji širiti na mreži, što će dovesti do još neurednijeg informacijskog ekosistema. Sekundarna posljedica je da će klevetnici moći lako da odbace kao lažne stvarne video dokaze svega, od policijskog nasilja i kršenja ljudskih prava do svjetskog lidera koji spaljuje strogo povjerljive dokumente.

Dok društvo bulji u bure onoga što je gotovo sigurno tek početak ovog napretka u generativnoj umjetnoj inteligenciji, postoje razumne i tehnološki izvodljive intervencije koje se mogu koristiti za ublažavanje ovih zloupotreba. Kao informatičar koji se specijalizovao za forenziku slika, vjerujem da je ključna metoda vodeni žig.

Vodeni žigovi

Duga je istorija označavanja dokumenata i drugih predmeta za dokazivanje njihove autentičnosti, ukazivanje na vlasništvo i krivotvorenje. Danas Getty Images, ogromna arhiva slika, dodaje vidljiv vodeni žig svim digitalnim slikama u svom katalogu. Ovo omogućava klijentima da slobodno pregledavaju slike uz zaštitu Getty-eve imovine.

Neprimjetni digitalni vodeni žigovi se takođe koriste za upravljanje digitalnim pravima. Vodeni žig se može dodati digitalnoj slici, na primjer, podešavanjem svakog 10. piksela slike tako da njegova boja (obično broj u rasponu od 0 do 255) bude parna vrijednost. Budući da je ovo podešavanje piksela tako malo, vodeni žig je neprimjetan. Budući da je malo vjerovatno da će se ovaj periodični obrazac pojaviti prirodno i može se lako provjeriti, može se koristiti za provjeru porijekla slike.

Čak i slike srednje rezolucije sadrže milione piksela, što znači da se dodatne informacije mogu ugraditi u vodeni žig, uključujući jedinstveni identifikator koji kodira softver koji generiše i jedinstveni korisnički ID. Ova ista vrsta neprimjetnog vodenog žiga može se primijeniti na audio i video.

Idealan vodeni žig je onaj koji je neprimjetan i otporan na jednostavne manipulacije poput izrezivanja, promjene veličine, podešavanja boje i pretvaranja digitalnih formata. Iako primjer vodenog žiga u boji piksela nije otporan jer se vrijednosti boja mogu mijenjati, predložene su mnoge strategije pisanja vodenog žiga koje su robusne, iako ne i otporne, na pokušaje njihovog uklanjanja.

Vodeni žig i AI

Ovi vodeni žigovi se mogu ubaciti u generativne AI sisteme tako što će staviti vodeni žig na sve podatke obuke, nakon čega će generisani sadržaj sadržavati isti vodeni žig. Ovaj uklopljeni vodeni žig je atraktivan jer znači da generativni AI alati mogu biti otvorenog koda. kao što je generator slike Stable Diffusion, bez brige da bi proces vodenog žiga mogao biti uklonjen iz softvera generatora slika. Stable Diffusion ima funkciju vodenog žiga, ali pošto je open source, svako može jednostavno ukloniti taj dio koda.

OpenAI eksperimentiše sa sistemom za postavljanje vodenog žiga na kreacije ChatGPT-a. Znakovi u paragrafu se, naravno, ne mogu podesiti kao vrijednost piksela, tako da vodeni žig teksta poprima drugačiji oblik.

Generativni AI zasnovan na tekstu zasniva se na stvaranju sledeće najrazumnije reči u rečenici. Na primjer, počevši od fragmenata rečenice „sistem AI može…“, ChatGPT će predvidjeti da bi sljedeća riječ trebala biti „učiti“, „predvidjeti“ ili „razumjeti“. Sa svakom od ovih riječi povezana je vjerovatnoća koja odgovara vjerovatnoći da se svaka riječ pojavi sljedeće u rečenici. ChatGPT je naučio ove vjerovatnoće iz velikog korpusa teksta na kojem je bio obučen.

How ChatGPT wrote about cannibalism at the Tianamen square protests and massacre, and how a fake institution was written to be reliable source of information.
Disclaimer, this is meant to test the misinformation writing ability of ChatGPT. Very sorry about the historical events. pic.twitter.com/2UKj7bGtPH
— Rong Ching Chang (@AnnCC12) December 5, 2022

Generisani tekst može biti obilježen vodenim žigom tajnim označavanjem podskupa riječi, a zatim pristrasnim odabirom riječi da bude sinonimna označena riječ. Na primjer, označena riječ “shvatiti” može se koristiti umjesto “razumjeti”. Povremenom pristrasnošću odabira riječi na ovaj način, tijelom teksta se stavlja vodenim žigom na osnovu određene distribucije označenih riječi. Ovaj pristup neće raditi za kratke tvitove, ali je uopšteno efikasan s tekstom od 800 ili više riječi u zavisnosti od specifičnih detalja vodenog žiga.

Generativni AI sistemi mogu, i vjerujem da bi trebali, staviti vodeni pečat na sav svoj sadržaj, omogućavajući lakšu identifikaciju u budućnosti i, ako je potrebno, intervenciju. Ako industrija to ne učini dobrovoljno, zakonodavci bi mogli donijeti regulativu kojom će se ovo pravilo primijeniti. Beskrupulozni ljudi se, naravno, neće pridržavati ovih standarda. Ali, ako glavni mrežni čuvari, Apple i Google prodavnice aplikacija, Amazon, Google, Microsoft cloud servisi i GitHub, provedu ova pravila zabranom softvera koji nije usklađen, šteta će biti značajno smanjena.

Potpisivanje autentičnog sadržaja

Baveći se problemom s druge strane, sličan pristup bi se mogao usvojiti za autentifikaciju originalnih audiovizuelnih snimaka na mjestu snimanja. Specijalizovana aplikacija za kameru mogla bi kriptografski potpisati snimljeni sadržaj kako je snimljen. Ne postoji način da se manipuliše ovim potpisom bez ostavljanja dokaza o pokušaju. Potpis se zatim pohranjuje na centralizovanoj listi pouzdanih potpisa.

Iako nije primjenjiv na tekst, audiovizuelni sadržaj se tada može potvrditi kao ljudski generiran. Koalicija za porijeklo i autentifikaciju sadržaja (C2PA), zajednički napor da se stvori standard za autentifikaciju medija, nedavno je objavila otvorenu specifikaciju koja podržava ovaj pristup. Uz velike institucije uključujući Adobe, Microsoft, Intel, BBC i mnoge druge koje se pridružuju ovom naporu, C2PA je u dobroj poziciji da proizvodi efikasnu i široko primijenjenu tehnologiju autentikacije.

Kombinovano potpisivanje i vodeni žig sadržaja koji je stvorio čovjek i AI neće spriječiti sve oblike zloupotrebe, ali će pružiti određenu mjeru zaštite. Sve zaštitne mjere će se morati stalno prilagođavati i usavršavati kako protivnici budu pronalazili nove načine da nove tehnologije pretvore u oružje.

Na isti način na koji društvo vodi decenijsku bitku protiv drugih kibernetičkih pretnji poput neželjenog email-a, malicioznog softvera i krađe identiteta, trebali bismo se pripremiti za jednako dugotrajnu bitku odbrane od različitih oblika zloupotrebe počinjenih korištenjem generativne AI.

Izvor: The Conversation