Mercoledì Anthropic ha lanciato Claude Mythos Preview, un nuovo modello di intelligenza artificiale per la sicurezza informatica, ma non è ancora accessibile al pubblico.
In un post sul blog, l'azienda ha dichiarato: "I modelli di intelligenza artificiale hanno raggiunto un livello di capacità di programmazione tale da poter superare tutti, tranne gli esseri umani più esperti, nell'individuazione e nello sfruttamento delle vulnerabilità del software".
L'azienda specializzata in intelligenza artificiale ha dichiarato di aver stimato i costi globali della criminalità informatica intorno ai 500 miliardi di dollari all'anno.
Secondo Anthropic , il gruppo di lancio di Mythos Preview comprende Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, NVIDIA e Palo Alto Networks.
Oltre 40 altre organizzazioni che sviluppano o gestiscono software critici hanno ottenuto l'accesso. Anthropic ha dichiarato che fornirà fino a 100 milioni di dollari in crediti d'uso e 4 milioni di dollari in supporto diretto ai gruppi di sicurezza open source.
Nel suo comunicato stampa, Anthropic afferma che Mythos Preview avrebbe individuato migliaia di vulnerabilità di elevata gravità in tutti i principali sistemi operativi e browser web.
Un esempio è una falla di sicurezza di 27 anni in OpenBSD che permetteva a un utente malintenzionato di mandare in crash un computer da remoto semplicemente connettendosi ad esso. Un altro esempio è una falla di sicurezza di 16 anni in FFmpeg, nascosta nel codice, che gli strumenti automatizzati avevano rilevato cinque milioni di volte senza individuarla.
Il modello ha inoltre individuato e concatenato diverse vulnerabilità nel kernel Linux, consentendo a un utente malintenzionato di passare dall'accesso come utente ordinario al pieno controllo di una macchina.
Anthropic ha dichiarato che, per quanto riguarda altri bug, prevede di pubblicare ora gli hash crittografici e di rivelarne di più una volta implementate le correzioni, poiché il modello ha individuato quasi tutte queste vulnerabilità e ha creato autonomamente molti exploit correlati.
Su CyberGym, Mythos Preview ha ottenuto un punteggio dell'83,1% nella riproduzione delle vulnerabilità, rispetto al 66,6% di Claude Opus 4.6. VentureBeat ha riportato separatamente un punteggio del 93,9% su SWE-bench Verified, contro l'80,8% di Opus 4.6.
Anthropic ha poi spiegato che i recenti sistemi di frontiera hanno ridotto i costi, gli sforzi e le competenze necessarie per individuare e sfruttare le falle di sicurezza.
Glasswing offre ai partner un vantaggio iniziale in una lotta cibernetica più rapida
Nell'ambito del progetto Glasswing, i partner utilizzeranno Mythos Preview per attività di difesa sui sistemi interni e sul codice open source.
Anthropic ha dichiarato che il lavoro comprenderà il rilevamento locale delle vulnerabilità, il test black box dei file binari, la sicurezza degli endpoint e i test di penetrazione.
Dopo l'anteprima della ricerca, i partecipanti potranno accedere al modello tramite l'API Claude, Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry al costo di 25 dollari per milione di token di input e 125 dollari per milione di token di output.
L'azienda ha inoltre dichiarato di aver donato 2,5 milioni di dollari ad Alpha-Omega e OpenSSF tramite la Linux Foundation, oltre a 1,5 milioni di dollari alla Apache Software Foundation.
AWS ha dichiarato di analizzare oltre 400 trilioni di flussi di rete al giorno, Microsoft ha affermato che il modello ha mostrato miglioramenti su CTI-REALM, CrowdStrike ha dichiarato che il divario tra l'individuazione di una falla e il suo sfruttamento si è azzerato e Google ha annunciato che renderà il modello disponibile tramite Vertex AI, mentre Palo Alto Networks ha affermato che i difensori hanno bisogno di questi strumenti prima che gli aggressori li ottengano.
Il New York Times ha riportato che, alla fine dello scorso anno, Anthropic ha affermato che hacker cinesi sostenuti dallo stato hanno utilizzato la sua intelligenza artificiale per colpire circa 30 aziende e agenzie governative, con operatori umani che hanno svolto solo il 10-20% del lavoro.
Il rapporto afferma inoltre che gli aggressori stanno già utilizzando l'intelligenza artificiale per redigere email di phishing, scrivere richieste di riscatto, ordinare i dati rubati e accelerare la vendita dei dati compromessi.
La carta di criptovalute senza limiti di spesa. Ottieni il 3% di cashback e pagamenti istantanei da mobile. Richiedi la tua carta Ether.fi.