Google ha presentato “Nano-banana”, nome in codice del modello Gemini 2.5 Flash Image, sviluppato da DeepMind, che ridefinisce la coerenza e le potenzialità dell’editing fotografico basato su intelligenza artificiale. Disponibile da fine agosto all’interno dell’app Gemini, si prepara a diventare un riferimento per utenti e sviluppatori, puntando su stabilità dei risultati e nuove funzionalità creative.
Un annuncio che segna un passo avanti
Il 27 agosto Sundar Pichai, amministratore delegato di Google, ha diffuso un messaggio per certi versi criptico: tre emoji di banana su X. Quel simbolo è bastato per attirare l’attenzione della comunità tecnologica. Poco dopo, l’azienda ne ha chiarito il significato: “Nano-banana” è il nome interno assegnato a Gemini 2.5 Flash Image, la nuova generazione di strumenti AI dedicati alla modifica delle immagini. Il progetto è frutto del lavoro congiunto di Google DeepMind e dei team Gemini, e rappresenta la naturale evoluzione delle prime funzioni di editing integrate nell’app all’inizio dell’anno.
Non si tratta di un semplice aggiornamento incrementale, ma di un modello che ambisce a risolvere uno dei limiti più discussi dell’editing generativo, ovvero l’imprevedibilità. In passato, ogni modifica poteva alterare elementi non richiesti, costringendo l’utente a ripetere più volte lo stesso processo nella speranza di ottenere il risultato voluto. Con Nano-banana, l’obiettivo dichiarato è introdurre una coerenza visiva finora inedita, garantendo che volti, dettagli e oggetti rimangano riconoscibili anche dopo modifiche multiple e successive.
Caratteristiche principali del modello
Il punto di forza di Gemini 2.5 Flash Image è la gestione del contesto visivo attraverso sessioni multi-turn, cioè la possibilità di applicare più trasformazioni consecutive senza degradare la fedeltà dell’immagine. Un utente può, per esempio, trasformare lo stile di un soggiorno domestico in diversi passaggi, come ad esempio cambiare il colore delle pareti, aggiungere un quadro, inserire nuovi mobili e infine alterare la luce ambientale. A differenza di altri sistemi, il modello mantiene inalterati i dettagli non coinvolti nelle modifiche, evitando distorsioni casuali.
La stessa logica vale per la rielaborazione dei ritratti. Un volto fotografato può essere adattato a diversi stili estetici, dal costume tradizionale a quello immaginario, senza perdere i tratti distintivi della persona. Questa continuità rappresenta un plus valore sia per gli utenti privati che per i professionisti, perché permette di pianificare modifiche progressive con un grado di affidabilità che riduce tempi e tentativi.
Un’altra novità è la fusione creativa di più immagini, utilizzata come base per generarne una nuova. Google ha mostrato un esempio semplice ma emblematico: l’unione di una foto di una donna con quella di un cane, dalla quale il sistema ha prodotto una scena credibile in cui l’animale viene coccolato. Questa funzionalità non si limita a effetti ludici, ma apre scenari per applicazioni pubblicitarie, di design e persino nel campo educativo.
Nano-banana consente inoltre operazioni di design mixing intelligente. L’utente può selezionare motivi o texture da un’immagine e applicarli a un oggetto in un’altra. Petali di fiore che diventano decoro su calzature, o pattern di farfalla trasformati in tessuto per abiti. La precisione con cui il modello esegue queste richieste lo distingue dai concorrenti, ponendolo come strumento versatile tanto per la sperimentazione creativa quanto per la produzione commerciale.
Sicurezza e trasparenza
Come per altri sistemi di generazione visiva di Google, ogni immagine prodotta integra due livelli di tracciabilità: un watermark “AI” visibile nell’angolo e una filigrana SynthID digitale invisibile, che resiste anche a modifiche successive. Questa doppia protezione mira a garantire la riconoscibilità dei contenuti generati artificialmente e a tutelare l’ecosistema informativo contro manipolazioni non dichiarate.
Va sottolineato, tuttavia, che la versione pubblica del modello presenta filtri di sicurezza più rigidi rispetto alla variante utilizzata nei benchmark di valutazione. Alcuni utenti, in particolare all’interno di community come Reddit, hanno segnalato che la creatività risulta parzialmente limitata da queste restrizioni, riducendo la possibilità di generare contenuti meno convenzionali. Si tratta di una scelta deliberata di Google, che privilegia il controllo e l’affidabilità rispetto a una libertà assoluta di generazione.
Accessibilità e costi
Nano-banana è già disponibile per tutti gli utenti all’interno dell’app Gemini, sia nella versione gratuita sia in quella premium. L’obiettivo è ampliare la base d’uso, consentendo anche a chi si avvicina per la prima volta all’AI di sperimentarne le potenzialità senza barriere d’ingresso.
Per sviluppatori e imprese, l’accesso avviene tramite Gemini API, Google AI Studio e Vertex AI. Il modello è offerto a un costo medio di circa 30 dollari per un milione di token generati, corrispondenti a circa 0,039 dollari per immagine, un prezzo che rende l’utilizzo scalabile anche in ambito professionale. La rapidità di elaborazione è assicurata dall’infrastruttura cloud di Google, che permette prestazioni elevate anche su dispositivi meno potenti.
Implicazioni e prospettive
L’introduzione di Nano-banana segna un momento di rilievo nel panorama degli strumenti di editing AI. La coerenza dei risultati rappresenta un vantaggio concreto per professionisti del design, della comunicazione e della formazione, che possono contare su output affidabili in tempi ridotti. Al tempo stesso, la possibilità di utilizzo in ambito consumer contribuisce a rendere più familiare un approccio avanzato all’intelligenza artificiale.
Non mancano però le critiche. Il rafforzamento dei filtri di sicurezza, pur giustificato dalla necessità di garantire un uso responsabile, solleva interrogativi sulla reale libertà creativa concessa agli utenti finali. Inoltre, resta aperto il tema della diffusione di contenuti generati artificialmente e della necessità di educare il pubblico al riconoscimento delle filigrane.
Nel complesso, Nano-banana offre un equilibrio tra innovazione, trasparenza e controllo, coerente con la linea strategica di Google. Per gli utenti più esperti, è uno strumento con margini applicativi concreti; per chi si avvicina ora al settore, è un’introduzione accessibile e intuitiva. La sua diffusione nei prossimi mesi chiarirà fino a che punto l’editing AI potrà affermarsi come tecnologia quotidiana, accanto alle soluzioni tradizionali di grafica e fotografia.