En nyligen inträffad incident har väckt oro kring hur data hanteras av GenAI-verktyg. Är det dags att se till att dina data inte hamnar i deras LLM:er? Dan Raywood tittar på alternativen.

En vis person sa en gång att det du lägger ut på internet stannar på internet. Mer specifikt skulle det ha syftat på sociala medier, särskilt Facebook.

Under det här decenniet handlar utmaningen mindre om att avslöja innehåll på sociala medier och mer om vad man har lagt in i generativ AI och stora språkmodeller (LLM), som sedan lagrar, bearbetar och lagrar den informationen för att ge bättre detaljer i förfrågningar och sökresultat.

Allt förtroende för GenAI:s säkerhet skakades dock under sommaren när tusentals av Grok-chattranskriptioner exponerades, vilket belyser hur snabbt privata AI-konversationer kan bli offentliga. För individer kan detta vara pinsamt. För företag är riskerna mycket högre, och kunddata, immateriella rättigheter eller juridiska strategier exponeras, med konsekvenser som sträcker sig från anseendeskador till böter.

Från chatbot till sökmotor

Enligt medierapporterVarje gång en chatt delades med Grok-boten genererades en unik URL som gjordes tillgänglig för sökmotorer. De flesta användare var inte medvetna om att dessa länkar indexerades automatiskt, vilket innebar att vem som helst kunde hitta dem online.

Damian Chung, informationssäkerhetsansvarig på Netskope, berättar för IO att han tror att i det här fallet var det bara chatthistoriken som exponerades, men att det var "ganska oroande eftersom man inte tror att när man delar dessa AI-interaktioner så skulle de kunna offentliggöras".

Han anser dock att den här händelsen åtminstone ökar medvetenheten om den här typen av risk, eftersom ”vi inte tittar på vilka säkerhetskontroller som finns kring dessa LLM:er, så man bör inte bara blint låta någon information komma in i dem.”

För företag är lärdomen tydlig: när data lämnar din miljö förlorar du kontrollen över den. Även till synes ofarliga uppladdningar kan dyka upp igen på sätt du aldrig avsett.

Skugg-AI och risken för läckage

Grok, en produkt från Elon Musks xAI-företag och vanligen använd på X, är nu en av hundratals tillgängliga GenAI-tjänster. Om man kan läcka konversationer som deltagaren trodde var privata, eller åtminstone hemliga, vad har andra då som skulle kunna läckas eller avslöjas?

Chung säger att vi är tidigt i utvecklingen av GenAI, och det är bra att vara medveten om riskerna, men inte heller att skrämma användare från att använda det.

Matt Beard, chef för cybersäkerhet och AI-innovation på AllPoints Fibre Networks, uttrycker det rakt ut: ”Oavsett om det gäller känsliga eller allmänna uppgifter är hoten verkligen verkliga i det avseendet, från oavsiktligt avslöjande av kundinformation till läckage av interna strategidokument, konsekvenserna kan variera från anseendeskador till böter.”

Denna risk förstärks av skugg-AI. Anställda som vänder sig till icke-godkända verktyg för produktivitetsökningar kan exponera konfidentiellt material utan att inse det. När information väl har indexerats online kan den finnas kvar långt efter att den ursprungliga konversationen har raderats.

Politik, inte förbud

En metod är att helt blockera åtkomst till AI-verktyg, men säkerhetschefer varnar för att detta är ineffektivt. Som Chung konstaterar: ”Om man gör det kommer användaren att hitta ett annat sätt att använda det. Genom att blockera det får vi inte nödvändigtvis samma säkerhetsnivå som vi tror att vi får.”

Experter föreslår istället att man möjliggör användning av AI enligt tydliga regler och skyddsåtgärder. Beard säger att balansen ligger i att ”bygga ett ramverk för tekniska och beteendemässiga kontroller” för att skydda organisationsdata. Det handlar om att ”visa personalen fördelarna med att använda dessa verktyg på ett säkert sätt och se till att de har företagsacceptabla system tillgängliga, för i slutändan kommer de att leta efter en lösning annars.”

Angelo Rysbrack, specialist på digitalt försvar på Pronidus Cybersecurity, håller med om att de senaste intrången belyser den största risken för företag: hur anställda interagerar med dessa AI-verktyg. Att ladda upp känslig eller till och med till synes ofarlig data kan snabbt leda till exponering. När informationen lämnar din miljö förlorar du kontrollen över den.

Praktiska lösningar

Vad kan då organisationer realistiskt göra för att minska risken för exponering? De ISMS som de pratade med var överens om att svaret ligger i att bygga strukturerade, lager-på-lager-försvar.

Rysbrack noterar att de flesta organisationer redan har acceptabla användnings- eller IT-policyer, och att de är den naturliga utgångspunkten. ”Om grunden finns, bygg vidare på den” snarare än att börja från början. Han varnar dock för att policyer på papper inte räcker, och att anställda måste göras medvetna om reglerna från början och regelbundet påminnas om sitt ansvar.

Beard betonar behovet av att fokusera på att möjliggöra säker användning under definierade skyddsräcken: ”Vi måste anamma AI för de effektivitetsvinster den ger oss, men det betyder inte blint införande. Det innebär att bygga ett ramverk av tekniska och beteendemässiga kontroller för att skydda våra data och våra anställda.”

För Rysbrack måste dessa kontroller innefatta praktiska skyddsåtgärder: ”använd innehållsfiltrering, appskyddspolicyer och dataförlustskydd för att hindra känslig information från att lämna organisationen.” I vissa fall kan det vara lämpligt att ”blockera riskfyllda appar, men där det är möjligt ge personalen säkra alternativ.”

Beard betonar vikten av att skilja mellan sanktionerade och icke-sanktionerade AI-verktyg och att sätta tydliga förväntningar på anställda: ”Framför allt bör acceptabla användningspolicyer tydligt förbjuda att information som överstiger klassificeringen 'Offentlig' delas med icke-sanktionerade tjänster.”

Den här typen av åtgärder kan ytterligare stärkas genom att förankra dem i erkända ramverk som ISO 27001 för informationssäkerhet och ISO 42001 för AI-styrning. Detta bidrar till att säkerställa att policyer, övervakning och riskhantering inte bara är konsekventa utan också granskningsbara och försvarbara mot myndighetsgranskning.

Sammantaget skapar denna kombination av ramverk, tekniska skyddsåtgärder och kontinuerlig användarmedvetenhet en kultur där medarbetarna förstår både fördelarna med AI-verktyg och gränserna för säker användning.

Agera nu, vänta inte

Beard är tydlig med att tiden för tvekan är förbi, och att organisationer inte bör vänta på ett dataintrång utan agera nu. ”Skapa tydliga, separata policyer för AI-användning och -utveckling; se till att de övervakas transparent och utbilda era medarbetare. Framför allt, behandla AI som en förmåga som måste utnyttjas och inte fruktas.”

Chung håller med om att det inte är realistiskt att blockera varje ny AI-applikation. Med hundratals redan tillgängliga och nya som dyker upp hela tiden föreslår han att organisationer överväger lättare åtgärder, till exempel ett "coachningsmeddelande" innan en GenAI-webbplats besöks, för att påminna anställda om att noga tänka på vad de delar.

Rysbrack betonar att utmaningen är att hitta en balans i att skydda data utan att hämma innovation. De bästa resultaten uppnås genom att kombinera tydliga regler, användarmedvetenhet, utbildning och tekniska skyddsåtgärder. ”På så sätt känner medarbetarna till gränserna, har rätt verktyg och organisationen undviker att bli nästa rubrik.”

Den verkliga lärdomen från Grok

Grok-läckan är inte första gången AI-genererade konversationer blir sökbara online, och det kommer inte att bli det sista. För företag är den verkliga lärdomen att förtroende för GenAI aldrig bör förutsättas.

Genom att införa policyer, tekniska skyddsåtgärder och medvetenhet bland personalen nu kan organisationer utnyttja produktiviteten hos AI samtidigt som de skyddar sina mest värdefulla data. Att vänta på nästa dataintrång är inte ett alternativ.