OpenAI GPT-5 riceve recensioni contrastanti il primo giorno

L'amministratore delegato di OpenAI, Sam Altman, aveva anticipato GPT-5 per mesi. Affermava che si trattasse di un modello avanzato: più intelligente, più veloce e in grado di pensare a "livello di dottorato". L'azienda ha presentato quel lancio come un importante passo avanti per ChatGPT, destinato a portare a miglioramenti dell'intelligenza nella codifica, nel ragionamento e nell'accuratezza.

Ma le prime reazioni dipingono un quadro più confuso . Gli sviluppatori hanno elogiato il modello per la sua capacità di comprendere prompt complessi e di generare codice ben strutturato. Il primo tester, Simon Willison, ha descritto GPT-5 come "competente" e "a volte impressionante", ma non un grande passo avanti rispetto a GPT-4. Altri sono rimasti meno colpiti.

Diversi post sui social media si sono rapidamente trasformati in lamentele su numerosi errori fattuali, scarse competenze matematiche e, in alcuni casi, persino basilari errori di ortografia. Noah Giansiracusa, professore di matematica alla Bentley University, ha definito il comunicato "deludente", osservando che gli aggiornamenti in questione sembravano "più marginali di quanto avrei sperato".

Parte della confusione era dovuta all'architettura del modello. GPT-5 includeva un "autoswitcher" per le varie dimensioni del modello , a seconda del compito da svolgere. Questo riduceva i tempi di elaborazione e impediva di toccare sempre l'intero GPT-5, il che creava molti problemi. Dopo aver risposto in modo errato a una domanda del sistema, l'agente con cui stava lavorando gli chiedeva di "pensare più attentamente" a quante lettere "b" ci fossero in blueberry. Dopo quel feedback, il sistema forniva la risposta corretta alla domanda.

Gli utenti reagiscono e OpenAI risponde

La frustrazione potrebbe riversarsi su Reddit e X entro venerdì. E mentre alcuni utenti detestavano il fatto di non sapere da chi o addirittura da quale modello provenisse il testo, molti pensavano che "l'inferno" fosse solo un'inferenza e che GPT5 avesse sostituito i vecchi preferiti di cui si fidavano. Alcuni hanno affermato che la qualità ne è stata compromessa, che la scrittura non è buona come GPT-4.5 , come avevi concordato, e che alcuni aspetti creativi e tecnici sono stati peggiori.

Questa chiacchierata ha spinto il CEO di OpenAI a partecipare a una sessione "Ask Me Anything" su Reddit per rispondere alle critiche. Ha affermato che un bug nell'autoswitcher ha fatto sì che GPT-5 funzionasse al di sotto del suo pieno potenziale fin dal primo giorno. Ha promesso di essere più trasparente nelle future transizioni di modello: "Da oggi in poi, GPT-5 dovrebbe apparire sempre più intelligente". OpenAI ha anche promesso di ridistribuire modelli precedenti come GPT-40 per coloro che avessero espresso una preferenza, nel tentativo di placare i critici più accaniti.

Il fatto che sia stato necessario agire così rapidamente evidenzia quanto fosse alta la posta in gioco. Oggi, OpenAI è in una corsa sfrenata con concorrenti come Anthropic, Google DeepMind e persino xAI di Elon Musk. Con tutta questa concorrenza, basta un piccolo passo falso e presto il tuo concorrente ti supera.

Si intensifica la competizione nella corsa all'intelligenza artificiale

Nonostante queste differenze, l'accoglienza riservata a GPT-5 fu tiepida, ma ciò non gli impedì di raggiungere il primo posto su LMArena, una classifica basata sugli utenti per i modelli di training. Pur non essendo ciò che oggi considereremmo programmabile, era estremamente veloce ed espressivo, supportando query complesse e di grandi dimensioni. Tuttavia, altri benchmark mostravano un panorama di problemi diverso e più impegnativo. Grok 4 di xAI di Musk ottenne un punteggio così alto in ARC-AGI-2 (un set di test per il ragionamento avanzato) da rappresentare una sfida significativa alla supremazia di OpenAI.

Alcuni analisti del settore ipotizzano che ci vorrà almeno un giorno prima che gli effetti di GPT-5 siano pienamente compresi, analogamente a quanto accaduto in passato con le innovazioni dell'azienda, come GPT-3. GPT-5 e GPT-4 hanno ricevuto forti critiche prima di vedere miglioramenti negli aggiornamenti e in altri casi d'uso. Il modello ha il potenziale per avere successo (o fallire) a seconda di quanto sia utile per il flusso di lavoro quotidiano delle persone, e ChatGPT conta quasi 700 milioni di utenti settimanali in tutto il mondo.

Per usare le parole del professore di Wharton Ethan Mollick: "Il GPT-5 fa cose, a volte sorprendenti, a volte sconcertanti, in modo completamente autonomo. È questo che lo rende così intrigante. È ancora un approccio tecnocratico, un po' inquietante, nel definire "interessanti" cose come questa parte della sfera della salute pubblica".

Non limitarti a leggere le notizie sulle criptovalute. Comprendile. Iscriviti alla nostra newsletter. È gratuita .

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto