Il nuovo modello di intelligenza artificiale di Alibaba, QwQ-32B-Preview, supera o1 di OpenAI in alcuni benchmark

Con l'intensificarsi della concorrenza nel campo dell'intelligenza artificiale, il colosso cinese della vendita al dettaglio Alibaba ha presentato la sua anteprima QwQ-32B che, secondo quanto riferito, supera la serie o1 di OpenAI.

Secondo quanto riferito, l'ultimo modello supera i modelli o1-preview e o1-mini di OpenAI su alcuni benchmark specifici, come i test AIME e MATH, che valutano le prestazioni dei modelli AI in enigmi logici e problemi di matematica.

Alibaba ha creato l'anteprima QwQ-32B per il download.

Secondo il colosso della vendita al dettaglio, il nuovo modello di Alibaba è in grado di affrontare problemi complessi e intricati rispetto ai normali modelli LLM (Large Language) come ChatGPT-4 e Claude 3.5.

Un articolo di Benzinga indica che il QwQ-32B-Preview è uno dei pochi disponibili con una licenza permissiva, che consente agli utenti di scaricarlo e utilizzarlo. Il modello è ora disponibile sulla piattaforma di sviluppo AI Hugging Face.

Tuttavia, Alibaba ha rilasciato alcuni componenti del modello per limitare la replica completa del modello o approfondimenti sul suo funzionamento.

L'ultimo modello di Alibaba vanta 32,5 miliardi di parametri che gli consentono di gestire messaggi fino a 32.000 parole. Grazie alle notevoli capacità del modello e all’accessibilità semi-aperta, il nuovo concorrente di Alibaba pone le basi per un salto di trasformazione nelle tecnologie di ragionamento basato sull’intelligenza artificiale.

Dopo l'annuncio trasparente di Alibaba, che sottolinea la sofisticatezza del suo modello, OpenAI ha tenuto nascosti i conteggi dei suoi parametri.

L’avvento di questo modello arriva in un momento in cui OpenAI sta facendo passi da gigante nel settore dell’intelligenza artificiale. A ottobre, la valutazione di OpenAI è balzata a 157 miliardi di dollari a seguito di un round di finanziamento di successo.

All'inizio di questa settimana, secondo quanto riferito, SoftBank Group SFTBF ha aumentato la propria partecipazione nel produttore di ChatGPT attraverso un'acquisizione di azioni da parte dei dipendenti da 1,5 miliardi di dollari.

Si dice anche che OpenAI stia esplorando lo sviluppo di un proprio browser web per sfidare il browser Google Chrome, sussidiario di Alphabet, dopo le pressioni provenienti dal Dipartimento di Giustizia degli Stati Uniti per cederlo.

Alibaba ammette che anche il modello presenta dei difetti

Sebbene possieda alcuni punti di forza unici, il nuovo modello presenta anche dei limiti. Secondo il gruppo, QwQ-32B-Preview presenta problemi come cambi di lingua imprevisti, che potrebbero potenzialmente confondere gli utenti. Il modello ha prestazioni inferiori anche nei compiti che richiedono un ragionamento basato sul buon senso, cosa comune a molti sistemi di intelligenza artificiale.

Secondo AutoGPT , il modello potrebbe rimanere intrappolato in cicli logici, ritardando le risposte.

Nonostante i suoi difetti, le sue capacità di ragionamento gli consentono di verificare autonomamente i fatti, riducendo quindi gli errori ma aumentando i tempi di risoluzione.

Ragionando attraverso compiti e fasi di pianificazione, il modello di Alibaba evita alcune insidie che colpiscono i tradizionali sistemi di intelligenza artificiale. Ma questo approccio richiede tempo extra che potrebbe limitare l’applicazione in tempo reale.

Secondo Benzinga, le risposte di QwQ-32B-Preview sono in linea con gli standard normativi cinesi , evitando argomenti politicamente sensibili.

Ad esempio, argomenti politicamente sensibili come Taiwan daranno risposte in linea con la posizione del governo cinese.

Inoltre, le segnalazioni su eventi come Piazza Tiananmen non danno luogo a risposte, dimostrando la cauta progettazione del modello.

Anche se questo potrebbe essere l’ideale per il mercato cinese, può anche limitarne l’attrattiva sul mercato globale. Tuttavia, il modello rappresenta un passo significativo nel mondo del ragionamento AI. Sebbene i suoi limiti possano ridurne l'attrattiva globale, i suoi altri componenti come la logica e la natura semi-aperta lo rendono un grande concorrente di OpenAI.

Secondo AutoGPT, QwQ-32B-Preview evidenzia il potenziale e le sfide di questa entusiasmante frontiera in cui i laboratori di intelligenza artificiale di tutto il mondo stanno lavorando per perfezionare la tecnologia di ragionamento.

Da Zero a Web3 Pro: il tuo piano di lancio carriera di 90 giorni