Google rilascia uno strumento AI che crea immagini da altre immagini

Google ha presentato Whisk, un nuovo strumento AI che genera immagini utilizzando altre immagini come suggerimenti. A differenza degli strumenti più vecchi che fanno molto affidamento su descrizioni di testo lunghe e dettagliate, Whisk consente agli utenti di caricare immagini per definire il soggetto, la scena e lo stile che desiderano generare.

Lostrumento supporta inoltre più immagini per ciascuno di questi input, offrendo agli utenti una notevole flessibilità per sperimentare. Se non hai un'immagine con cui iniziare, Google ha un'icona a forma di dado che riempie automaticamente le istruzioni con elementi visivi.

Tuttavia, anche queste immagini segnaposto sembrano essere generate dall’intelligenza artificiale. Gli utenti possono anche aggiungere del testo per ottimizzare l'output, ma la casella di testo è facoltativa. Secondo l'azienda, Whisk produce ancora risultati anche senza di essa.

Lo strumento genera quindi un'immagine e un messaggio di testo corrispondente utilizzato nella sua creazione. Se ti piace il risultato, puoi aggiungerlo ai preferiti o scaricarlo. In caso contrario, puoi perfezionarlo modificando il messaggio di testo sottostante o generando qualcosa di completamente nuovo.

Imagen 3 potenzia l'intelligenza artificiale di Whisk di Google

Google afferma che Whisk è progettato per "una rapida esplorazione visiva, non per modifiche perfette al pixel". Pertanto, sebbene sia flessibile e divertente da usare, non fornirà sempre risultati impeccabili. L'azienda ammette che lo strumento può "mancare l'obiettivo", motivo per cui consente modifiche rapide per una maggiore precisione.

Whisk funziona con l'ultimo modello di generazione di immagini Imagen 3 di Google, che la società ha anche annunciato insieme allo strumento. Imagen 3 consente a Whisk di produrre risultati generati dall'intelligenza artificiale e si dice che la tecnologia sottostante migliori la qualità complessiva degli output.

Oltre a Imagen 3, Google ha introdotto anche Veo 2, il suo modello di generazione video aggiornato. Secondo quanto riferito, Veo 2 ha una migliore conoscenza della cinematografia e risolve problemi comuni come le allucinazioni, ad esempio il classico errore dell'intelligenza artificiale delle dita extra.

Il modello verrà lanciato per la prima volta sulla piattaforma VideoFX di Google, che è ancora in fase di test limitata tramite Google Labs. La società afferma che Veo 2 verrà eventualmente esteso a YouTube Shorts e ad altri prodotti Google nel 2025.

Per ora, l’azienda posiziona Whisk come uno strumento di esplorazione piuttosto che come una soluzione di editing professionale. Resta da vedere se resisterà rispetto a concorrenti come DALL-E di OpenAI.

Ottieni un lavoro Web3 ben pagato in 90 giorni: la tabella di marcia definitiva

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto