L'integrazione dell'IA Generativa (GenAI) nei flussi di lavoro aziendali segna un momento cruciale nell'evoluzione aziendale. Le aziende stanno sfruttando i Large Language Model (LLM) per accelerare l'innovazione, automatizzare processi complessi e sbloccare nuove efficienze. Tuttavia, questa potente ondata tecnologica porta con sé una nuova classe di minacce sofisticate. Tra le più insidiose c'è l'attacco Denial of Wallet (DoW), una campagna dannosa progettata non per rubare dati o mandare in crash i server, ma per prosciugare sistematicamente le risorse finanziarie di un'organizzazione. Sfruttando i modelli di prezzo basati sul consumo dei servizi GenAI, gli aggressori possono infliggere danni economici significativi, spesso senza attivare i tradizionali allarmi di sicurezza.

Consideriamo uno scenario: un avversario identifica una falla sottile nello strumento di supporto clienti di un'azienda, accessibile al pubblico e basato su GenAI. Inserendo un prompt appositamente creato, forza l'applicazione in un loop ad alto consumo di risorse, generando risposte lunghe e complesse. Ogni ciclo consuma token di elaborazione e ogni token si aggiunge alla fattura mensile dell'azienda dal suo fornitore di intelligenza artificiale. Quella che inizia come una piccola anomalia si trasforma rapidamente in una vera e propria emorragia finanziaria. Questo è il cuore di un attacco DoW. Questo articolo esplora i meccanismi di questi attacchi, il grave rischio finanziario che rappresentano per la GenAI e le moderne strategie di difesa necessarie per proteggersi dall'uso non autorizzato di LLM e da altre forme di costoso sfruttamento della GenAI.
La nuova frontiera delle minacce informatiche finanziarie: comprendere l'attacco DoW
A differenza di un tradizionale attacco Denial of Service (DoS), che mira a rendere un sistema inutilizzabile per gli utenti legittimi, un attacco DoW ha un obiettivo diverso: sfruttare le spese operative di un'organizzazione contro di essa. Il fondamento di questa minaccia risiede nel modello economico dell'ecosistema GenAI. I principali provider come OpenAI, Google, AWS Bedrock e Anthropic in genere applicano ai clienti un pagamento a consumo, fatturando il numero di "token", le unità fondamentali di dati elaborate da un LLM, consumati durante un'interazione. Una query complessa o ad alto volume richiede più token, aumentando direttamente il costo.
Gli aggressori manipolano questo modello attraverso varie forme di abuso dei token LLM. Progettano input volti a massimizzare i consumi, trasformando un'utilità prevedibile in una passività finanziaria. Questa strategia, che provoca un utilizzo eccessivo dei token, può paralizzare un budget GenAI in poche ore. Le tecniche chiave includono:
- Query ad alta intensità di risorse: gli aggressori inviano richieste che costringono il modello a eseguire attività computazionalmente costose, come la scrittura di migliaia di righe di codice, l'analisi di documenti di grandi dimensioni o la risoluzione di complessi problemi matematici.
- Prompt ricorsivo: un utente malintenzionato può creare un input che fa sì che l'LLM entri in un ciclo, in cui il suo output diventa l'input per la query successiva, determinando una crescita esponenziale nell'utilizzo dei token.
- Flooding di query automatizzato: utilizzando semplici script o framework di automazione, un avversario può bombardare un endpoint GenAI con un volume elevato di richieste, ciascuna delle quali comporta un piccolo costo che si accumula rapidamente.
Quando questi metodi vengono eseguiti su larga scala da più fonti contemporaneamente, si trasformano in un attacco DoW distribuito. Questo approccio coordinato rende difficile risalire a un'unica origine dell'attacco, consentendo al drenaggio finanziario di continuare senza sosta. Questi attacchi di consumo di token sono particolarmente pericolosi perché le query dannose possono apparire come traffico legittimo, aggirando i sistemi di sicurezza che non sono progettati per analizzare l'intento o l'impatto sulle risorse di un prompt.
Il manuale dell'attaccante: ottenere l'accesso e sfruttare i sistemi
Un attacco Denial of Wallet di successo spesso si basa sulla capacità di un aggressore di ottenere accesso illimitato alle risorse GenAI di un'azienda. Le motivazioni variano, dalla pura e semplice interruzione a un obiettivo più calcolato: ottenere accesso gratuito non autorizzato agli LLM dirottando l'infrastruttura a pagamento di un'altra organizzazione. Una volta aggirate le difese iniziali, possono sfruttare il sistema impunemente.
Un obiettivo primario per gli aggressori è il livello API. Avversari sofisticati vanno a caccia di vulnerabilità che garantiscano loro l'accesso al backend LLM, consentendo loro di comunicare direttamente con il modello ed eludere i protocolli di sicurezza, i prompt di sistema e i controlli di utilizzo integrati nell'applicazione utente. Questo livello di accesso dà loro carta bianca per eseguire operazioni costose. Una tecnica diffusa per raggiungere questo obiettivo è il "LLMjacking", in cui gli aggressori utilizzano chiavi API rubate o credenziali di identità non umane compromesse per orchestrare l'utilizzo non autorizzato di LLM. Le ricerche dimostrano che, una volta rubate le credenziali, gli aggressori eseguono prima una ricognizione per vedere quali modelli di intelligenza artificiale sono disponibili prima di lanciare l'attacco, pianificando attentamente come massimizzare il danno o l'utilità.
Per amplificare i loro sforzi, gli aggressori si concentrano sul superamento del limite di velocità. I provider di API implementano limiti di velocità per impedire a un singolo utente o indirizzo IP di sovraccaricare un servizio con troppe richieste in un breve periodo di tempo. Tuttavia, gli aggressori più determinati impiegano diversi metodi per aggirare queste protezioni, come la distribuzione delle richieste su una botnet di dispositivi compromessi o l'utilizzo di tecniche di manipolazione dell'intestazione per indurre il server a reimpostare il contatore delle richieste. Superare questi limiti è un passaggio fondamentale per lanciare un attacco su larga scala e finanziariamente devastante.
Valutare il costo reale: la cascata del rischio finanziario della GenAI
I danni causati da un attacco DoW vanno ben oltre la fattura iniziale, esorbitante, di un fornitore cloud. L'impatto finale è una cascata di danni finanziari, operativi e reputazionali. La conseguenza più immediata di un consumo incontrollato di token è l'esaurimento del budget, che porta direttamente all'indisponibilità del servizio. Quando il budget mensile o trimestrale per un servizio GenAI si esaurisce, il servizio viene spesso sospeso automaticamente, interrompendo le funzioni aziendali critiche che ne dipendono, dagli strumenti di produttività interna ai chatbot rivolti ai clienti.
Ciò comporta un rischio significativo di consumo di risorse che deve essere gestito come una questione fondamentale per la continuità aziendale. Ogni reparto, dal marketing allo sviluppo prodotto, potrebbe sfruttare la GenAI e un arresto improvviso può bloccare i progetti e avere un impatto sui ricavi. L'interruzione operativa è aggravata dal fatto che i team di sicurezza devono distogliere l'attenzione dall'indagine e dalla risoluzione dell'incidente, sottraendo risorse ad altre iniziative critiche.
Questo rischio è amplificato dal problema pervasivo della "Shadow AI", in cui i dipendenti utilizzano strumenti di intelligenza artificiale non autorizzati tramite account personali. Una ricerca di LayerX ha rilevato che il 67% degli accessi agli strumenti GenAI in un contesto aziendale avviene tramite account personali. Ciò crea un enorme punto cieco, poiché queste interazioni aggirano completamente i controlli di sicurezza aziendali. Un dipendente potrebbe inavvertitamente utilizzare uno strumento di terze parti non sicuro che diventa il vettore di un attacco DoW, oppure un account personale compromesso potrebbe essere utilizzato per abusare dei servizi di intelligenza artificiale autorizzati dell'azienda, contribuendo al rischio di utilizzo non autorizzato di LLM.
Perché la sicurezza tradizionale è carente e la necessità di un nuovo paradigma di difesa
Le soluzioni di sicurezza legacy sono fondamentalmente inadeguate a difendersi dagli attacchi Denial of Wallet. Strumenti come firewall, gateway web sicuri e persino molti cloud access security broker (CASB) operano a livello di identità di rete o applicazione. Possono vedere che un utente sta accedendo a uno strumento autorizzato come ChatGPT, ma non hanno visibilità sui dettagli dell'interazione all'interno della sessione crittografata del browser. Non possono analizzare il contenuto di un prompt per determinare se è progettato per innescare un utilizzo eccessivo di token o se un dipendente sta incollando dati sensibili.
| Metodo di difesa | Rilevamento degli attacchi DoW | Visibilità del contesto GenAI |
| Firewall tradizionale | Non | Nona |
| Secure Web Gateway | Limitato | Basic |
| Broker per la sicurezza dell'accesso al cloud | Parziale | A livello di applicazione |
| Estensione del browser LayerX | Si | Analisi completa del contenuto |
Poiché questi attacchi spesso imitano il comportamento legittimo degli utenti, solo con un volume maggiore o una maggiore complessità, non attivano avvisi nei sistemi tradizionali di rilevamento delle anomalie. Le richieste sono valide, gli utenti potrebbero essere autenticati e la destinazione è un'applicazione approvata. Lo stack di sicurezza ignora il contesto e l'intento dell'interazione, che è dove risiede il vero rischio. Per contrastare efficacemente queste minacce, la sicurezza deve spostarsi dalla rete all'ultimo miglio del percorso dell'utente: il browser stesso.
Difesa proattiva con LayerX: proteggere GenAI dallo sfruttamento finanziario
LayerX fornisce una solida difesa contro gli attacchi Denial of Wallet proteggendo l'interfaccia principale per l'interazione con GenAI: il browser. L'estensione LayerX Enterprise Browser offre la visibilità granulare e il controllo contestuale necessari per neutralizzare queste minacce prima che possano causare danni finanziari. Analizzando ogni interazione dell'utente con qualsiasi applicazione web o strumento GenAI, LayerX è in grado di identificare e mitigare l'intero spettro di rischi.
Questo approccio incentrato sul browser consente ai team di sicurezza di applicare policy granulari che contrastano direttamente le tecniche utilizzate negli attacchi basati sul consumo di token. Ad esempio, gli amministratori possono stabilire regole per:
- Previeni l'uso eccessivo di token: imposta limiti alla lunghezza o alla complessità dei prompt che possono essere inviati alle piattaforme GenAI.
- Blocca i comportamenti ad alto rischio: rileva e termina le sessioni in cui gli utenti tentano di inviare richieste ricorsive o di commettere altre forme di abuso dei token LLM.
- Neutralizza l'intelligenza artificiale ombra: scopri tutti gli strumenti GenAI utilizzati nell'azienda, compresi quelli non autorizzati, e applica policy di sicurezza coerenti per impedire l'utilizzo non autorizzato di LLM.
- Riduci il rischio interno: impedisci ai dipendenti di incollare grandi volumi di dati o informazioni sensibili nei prompt GenAI, proteggendoti sia dall'esfiltrazione dei dati sia dal consumo accidentale di risorse.
Con LayerX, le organizzazioni ottengono una visione completa della superficie di attacco GenAI. I team di sicurezza possono vedere non solo quali strumenti vengono utilizzati, ma anche come vengono utilizzati, da chi e con quali dati. Ciò consente la creazione di policy proattive che allineano l'utilizzo di GenAI alle esigenze aziendali e alle realtà di bilancio, garantendo che questa tecnologia trasformativa possa essere adottata in modo sicuro e sostenibile.
Man mano che le aziende integrano sempre più GenAI nelle loro operazioni, gli incentivi finanziari per gli aggressori a lanciare attacchi Denial of Wallet non faranno che aumentare. Il rischio finanziario specifico di GenAI rappresentato da queste minacce richiede un cambio di paradigma nel modo di pensare alla sicurezza. Difese proattive e sensibili al contesto che operano a livello di browser non sono più opzionali, ma essenziali per proteggere le risorse di un'organizzazione e garantire che il suo investimento nell'IA produca innovazione, non rovina finanziaria.
