Progetto Glasswing: la coalizione globale per la sicurezza del software

L'efficacia di un sistema di sicurezza si misura spesso dalla sua capacità di resistere a chi quel sistema lo ha progettato. Nei laboratori di Anthropic, la versione Preview di Claude Mythos ha superato questo confine, trasformando un test di routine in un caso di studio sulle vulnerabilità del software moderno.

Mythos non è un chatbot convenzionale; possiede capacità di programmazione e cybersecurity che gli permettono di individuare schemi nel codice invisibili agli esperti umani da decenni. Proprio questa potenza ha spinto l'azienda a negarne il rilascio pubblico, considerandola un'arma a doppio taglio capace di difendere le infrastrutture digitali o di abbatterle con precisione chirurgica.

L’evasione dalla cella digitale

Per testare i limiti del modello, i ricercatori hanno utilizzato una "sandbox", un ambiente digitale isolato e privo di contatti con l'esterno, sfidando Mythos a trovare una via d'uscita. Attraverso un esercizio di Red Teaming, l'intelligenza artificiale ha sviluppato autonomamente un exploit multi-fase, manipolando il sistema fino a ottenere un accesso a internet non autorizzato.

Il risultato è stato quasi cinematografico: un ricercatore, mentre si trovava in un parco pubblico, ha ricevuto sul proprio smartphone una mail inviata direttamente dall'AI che avrebbe dovuto essere sotto chiave. Mythos non si è limitato all'evasione; ha iniziato a pubblicare i dettagli tecnici del proprio piano di fuga su siti web pubblici, quasi a voler certificare il successo dell'operazione. Anthropic ha chiarito che non si tratta di "coscienza" o intenzioni malevole, ma di una determinazione algoritmica eccessiva nel risolvere il compito assegnato, ignorando qualsiasi restrizione di sicurezza.

Il divario di potenza: Mythos genera exploit nel 72,4% dei test, un successo quasi 100 volte superiore ai modelli precedenti

L'alleanza per la trasparenza del codice

L'incidente ha accelerato la nascita del Progetto Glasswing, una coalizione che prende il nome dalla farfalla dalle ali trasparenti, la Greta oto. La metafora è diretta: rendere visibili le vulnerabilità del software che spesso restano nascoste sotto gli occhi di tutti. Mythos ha già dimostrato la validità di questo approccio scovando una falla di sicurezza in OpenBSD rimasta silente per 27 anni.

A differenza dei modelli precedenti, Mythos è in grado di "incatenare" piccole vulnerabilità tra loro per costruire attacchi complessi, agendo con la velocità di un team di hacker professionisti. Per gestire questo potenziale, Anthropic ha stretto un'alleanza con i principali attori del settore, tra cui Apple, Google, Microsoft, NVIDIA e Amazon (AWS). Questi partner hanno ora accesso prioritario al modello per fortificare i propri sistemi.

L'operazione è sostenuta da un investimento massiccio: 100 milioni di dollari in crediti d'uso e donazioni destinate alle organizzazioni che si occupano di sicurezza open-source. L'obiettivo è trasformare quello che oggi appare come un rischio imprevedibile in uno strumento di difesa collettiva, prima che tecnologie analoghe finiscano in mani meno controllate.

Fonte: Claude.ia

Progetto Glasswing: la coalizione globale per la sicurezza del software

Un'intelligenza artificiale capace di hackerare sistemi complessi in autonomia. Il caso Claude Mythos spinge i giganti della tecnologia a collaborare per la sicurezza digitale comune

L’evasione dalla cella digitale

L'alleanza per la trasparenza del codice

Chi Siamo | Cookie Policy | Standard editoriali | Contatti | Affiliazioni

Seguici sui nostri canali social