Nakon što je predstavio Gemini u Chrome-u i najavio mogućnosti AI agenata, Google uvodi nove bezbjednosne zaštite za korisnike svog pregledača.
Da bi agentičke funkcije Chrome-a mogle da se koriste bezbjedno, tehnološki gigant uvodi slojevite odbrane koje hakerima otežavaju i poskupljuju pokušaje da nanesu štetu korisnicima.
Zaštite su usmjerene na glavnu prijetnju agentičkim pregledačima, a to su indirektni prompt injection napadi, koji mogu dovesti do curenja podataka i drugih neželjenih radnji koje agent izvršava.
Prema Google-u, hakeri mogu isporučiti indirektne promptove preko malicioznih sajtova, iframe elemenata sa sadržajem trećih strana ili korisnički generisanog sadržaja, poput recenzija.
Da bi se izborio sa ovim prijetnjama, Google uvodi poseban AI model zasnovan na Gemini-ju, nazvan User Alignment Critic.
Izolovan od neprovjerenog sadržaja, njegov zadatak je da provjerava radnje koje agent planira da izvrši, fokusirajući se na to da li su te radnje usklađene sa ciljem koji je korisnik naveo, kako bi se spriječilo preuzimanje cilja i eksfiltracija podataka.
„Ako je radnja neusklađena, Alignment Critic će je blokirati. Ova komponenta je projektovana tako da vidi samo metapodatke o predloženoj radnji, a ne nefiltrirani, nepouzdani web sadržaj, čime se osigurava da ne može biti kompromitovana direktno sa interneta“, objašnjava Google.
Internet gigant takođe proširuje postojeće Site Isolation i same-origin politike u Chrome-u uvođenjem Agent Origin Sets mehanizma, kako bi se adresirale situacije u kojima bi kompromitovani agent mogao pokušati da zaobiđe kontrole.
„Naš dizajn arhitektonski ograničava agenta da pristupa samo podacima sa origin-a koji su relevantni za zadatak, ili podacima koje je korisnik odlučio da podijeli sa agentom. Ovo sprječava kompromitovanog agenta da djeluje proizvoljno nad nepovezanim origin-ima“, navodi Google.
Funkcija za određivanje pristupa, izolovana od nepouzdanog sadržaja, utvrđuje koje su adrese relevantne za zadatak i dijeli ih na origin-e samo za čitanje, čiji sadržaj Gemini može da procesuira, i one koji omogućavaju čitanje i pisanje, nad kojima agent može da preduzima radnje.
Ovo ograničava izloženost modela podacima koji prelaze različite sajtove, a svaka nova adresa na koju planer želi da pređe provjerava se za relevantnost prije navigacije.
Da bi korisnici imali pregled i kontrolu nad novim agentičkim sposobnostima, agent kreira dnevnik rada, a determinističke provjere i provjere uz podršku modela zahtijevaju potvrdu korisnika prije izvršavanja značajnijih radnji.
„Ovo služi kao zaštitna ograda i protiv grešaka modela i protiv malicioznog unosa, tako što korisnika uključuje u ključnim trenucima“, navodi Google.
Agent traži potvrdu prije posjete osjetljivim sajtovima, poput bankarskih i medicinskih portala, prije prijavljivanja putem Google Password Manager-a, kao i prije dovršavanja kupovine, plaćanja ili slanja poruka.
Kao dopuna Safe Browsing i anti-scam mehanizama u Chrome-u, agent provjerava svaku stranicu na prisustvo indirektnih prompt injection pokušaja.
„Ovaj klasifikator radi paralelno sa planerskim modelom i spriječava izvršavanje radnji koje se zasnivaju na sadržaju za koji je utvrđeno da pokušava da utiče na model da uradi nešto što nije u skladu sa ciljem korisnika“, objašnjava Google.
Google navodi da ove odbrane testira korišćenjem automatizovanih red-teaming sistema koji generišu maliciozne izolovane sajtove, sa prioritetom na zaštiti od korisnički generisanog i reklamnog sadržaja, kao i napada koji mogu dovesti do curenja akreditiva i neželjenih finansijskih transakcija.
Izvor: SecurityWeek

