L'ultimo modello di intelligenza artificiale di Google consentirà alle persone di generare immagini di forme umane nei prossimi giorni. La società prevede inoltre di incorporare l'ultima versione di Imagen 3, che sostiene sia dotata di aggiornamenti per generare immagini accurate. La funzionalità sarà disponibile nella versione inglese per gli utenti Gemini Advanced
Nell'ultimo post sul blog di Google, un direttore senior responsabile del prodotto Gemini, Dave Citron condivide i dettagli sul bot Gemini AI "migliorato". Citron parla di incorporare Imagen 3 come l'ultimo modello di generazione di immagini di Gemini. Il modello è impostato per produrre immagini di persone con alcune restrizioni.
Alcune delle restrizioni previste riguardano il fatto che le foto non saranno fotorealistiche e non consentiranno la generazione di immagini di volti noti, minori o scene cruente di alcun tipo.
La funzione di generazione di immagini umane elaborerà solo istruzioni in inglese e sarà disponibile per gli utenti abbonati a Gemini Advanced,
L'intelligenza artificiale Gemini di Google è stata criticata a febbraio
I padri fondatori dell'America, i Vichinghi e il Papa secondo l'intelligenza artificiale di Google: pic.twitter.com/lw4aIKLwkp
– End Wokeness (@EndWokeness) 21 febbraio 2024
Già a febbraio il chatbot di Google aveva suscitato scalpore sui social media generando immagini di persone storicamente imprecise. Chiamato anche "l'intelligenza artificiale sveglia", Google ha dovuto affrontare una reazione negativa da parte della critica per non aver testato l'accuratezza del prodotto. Il chatbot ha commesso errori nel descrivere la razza dei soldati tedeschi e dei padri fondatori dell'America.
In risposta alla reazione negativa, anche il cofondatore di Google, Sergey Brin, ha ammesso l'inadeguatezza del processo di test del prodotto . Di conseguenza, lo strumento è stato interrotto fino a poco tempo fa.
In un recente post sul blog , Dave Citron riflette sugli eventi di febbraio. Nella sua dichiarazione, condivide con Gemini la possibilità di errori come qualsiasi strumento di intelligenza artificiale. Ha inoltre affermato che verrà dato seguito al feedback dei primi utenti. Secondo il post, "Naturalmente, come con qualsiasi strumento di intelligenza artificiale generativa, non tutte le immagini create da Gemini saranno perfette, ma continueremo ad ascoltare il feedback dei primi utenti mentre continuiamo a migliorare."
Citron ha anche condiviso nel post sul blog che il principio di progettazione aziendale promuove la libertà creativa durante l'intero processo. Pertanto gli utenti possono apportare modifiche dando istruzioni al chatbot in caso di errori nell'immagine.