L’Intelligenza Artificiale è un argomento che sta assumendo sempre di più grande popolarità.
Stanno nascendo molti programmi che permettono di generare immagini creative partendo da stringhe testuali, che fino ad ora erano relegati nell’alveo degli addetti ai lavori.
Ma anche in questo ambito qualcosa sta cambiando.
Anche l’Intelligenza Artificiale vuole assurgere a trend-topic.
E anche stavolta, c’è voluta la potenza mediatica o, meglio, social-mediatica di influencers e VIP dell’etere del Web.
Sono i VIP che ne parlano.
Ad esempio, è grazie alla Ferragni che Magic Avatar della finora sconosciuta Lensa AI ha fatto parlare di sé ed è schizzata come prima in classifica negli App Store di Apple e Android, totalizzando 4 milioni di downloads in pochi giorni e facendo spendere 8 milioni di dollari in acquisti in app agli utenti mondiali.
I software basati sull’Intelligenza Artificiale generativa text to image sono diventati pop.
Il Web e i social sono stati inondati da immagini e foto-ritratti dai connotati davvero fantasmagorici, a volte surreali, a volte sciccosi, a volte cool e kawaii, a volte fortemente stilizzati, grazie ad influencers nostrani e non solo.
C'è anche chi sta sperimentando la potenza delle combinatorie dell'Intelligenza Artificiale provando a creare dei video clip che riproducono e reinterpretano i brani cult della musica mondiale.
Ma prima che un tema pop, è giusto dedicare qualche parola a quali sono i software AI generativi text to image che trovano maggiore applicazione e uso tra artisti e professionisti del settore digitale.
Dedicandoci poi a descrivere brevemente quei software che, come Lensa AI, aiutano a generare le vostre foto artistiche.
Partiamo da quelli più per gli addetti ai lavori.
In generale questi software sono definiti: AI text-to-image, proprio perché riescono a generare immagini partendo da un prompt testuale grazie ad un linguaggio complesso e ad algoritmi interpretativi che dialogano con l’Intelligenza Artificiale.
Dream di Wombo, è sicuramente una delle scelte possibili da fare, ed è la prima applicazione generativa basata su AI arrivata sul mercato.
L’App di Dream è scaricabile gratuitamente sul proprio sito web e permette di generare delle immagini in pochi secondi e potendo scegliere un motivo pittorico tra oltre venti modelli.
Una volta dato l’input, il sistema elabora le informazioni restituendo un immagine che può essere scaricata e venduta anche come opera digitale in NFT.
Dream è una soluzione semplice, gratuita, ma non avanzata. Un grande limite riguarda l’aspetto esclusivamente verticale dell’output.
Come altra possibile scelta tra i software AI generative text-to image, va sicuramente annoverato Starryai.
Starrai è molto simile a Dream ed è possibile utilizzarlo andando sulla propria pagina web oppure scaricando l’App dedicata.
È scaricabile gratuitamente, ma è anche possibile acquistare degli elementi aggiuntivi da poter utilizzare per le proprie creazioni artistiche. Infatti, è un software freenium.
Starrai permette di scegliere tra due modalità di creazione: una più astratta (Altair, che usa un modello VQGAN-CLIP) e una più realistica (detta Orion, che usa un modello CLIP-Guided Diffusion).
Dopodiché si può inserire il proprio input testuale nel motore di ricerca di Starrai e scegliere lo stile di riproduzione tra una lista predefinita.
Anche qui si può partire da un’immagine preesistente e scegliere tra alcune dimensioni predefinite per l’output finale. Il servizio è gratuito ma per un numero limitato di creazioni.
Crayon, è un'altra possibile scelta. È un software AI generativo text to image che usa un modello VQGAN e può essere usato gratuitamente accedendo alla sua personale pagina web.
Basta inserire la stringa di testo nella pannello della barra di ricerca del sito web di Crayon e avviare l’elaborazione.
Il risultato che si ottiene consiste in 9 immagini di bassa risoluzione grafica che possono essere scaricate. È consigliabile usare Crayon se si cerca di elaborare intenti di ricerca testuali molto semplici.
Ma le frecce al nostro arco non finiscono qui.
Imagen di Google e Parti, sono due progetti in fase di testing, a cui solo gli addetti ai lavori possono accedere.
L’obiettivo di Imagen è ben sintetizzato sul blog ufficiale del team di sviluppo di Google che ha usato queste parole per descrivere le caratteristiche di questo software AI generativo text to image.
Imagen è:
<< un modello di diffusione da testo a immagine con un grado di fotorealismo senza precedenti e un profondo livello di comprensione del linguaggio. Imagen si basa sulla potenza dei modelli di linguaggio di trasformazione di grandi dimensioni nella comprensione del testo e si basa sulla forza dei modelli di diffusione nella generazione di immagini ad alta fedeltà >>.
Detto in altri termini, Imagen parte da un algoritmo che sfrutta il machine learning integrandolo con l’Intelligenza Artificiale per comprendere un’indicazione scritta e trasformarla in un input al sistema.
Per ottenere questo risultato Imagen attinge ad un database di immagini sconfinato presente nel motore di ricerca e sfruttando la potenza di calcolo delle combinatorie generative dell’Intelligenza Artificiale.
Imagen, è nata come risposta a DALL-E e DALL-E 2, altre due possibili scelte in questo carniere multi-variegato che vi stiamo qui proponendo, a seconda dei vostri gusti artistici e a seconda del vostro livello di competenza e dimestichezza posseduto con questi applicativi AI generativi.
DALL-E nacque come progetto fondato da Elon Musk, poi da lui stesso abbandonato, e il suo nome è frutto del composto tra il nome del famoso ed eclettico artista Salvator Dalì e il robottino Wall-E del film animato della Pixar Studios.
DALL-E era in grado di generare immagini di piccole dimensioni, partendo da prompt testuali.
DALL-E 2 invece riesce ad ottenere come risultato anche immagini di grandi dimensioni.
Inoltre, quest’ultimo riesce a comprendere in maniera molto fedele e sensata la relazione tra oggetti e parole scelte.
Infatti, questo permette di ottenere degli output grafici molto corrispondenti al vero e in tema con ciò che è stato scritto come prompt testuale.
Se ancora non siete sazi di questa carrellata di software AI generativi text to image, c’è anche Midjourney, come possibile scelta.
Rispetto agli altri software basati su Intelligenza Artificiale che vi abbiamo descritto fino a qui, Midjourney è un software dall’accesso molto ristretto.
Infatti, è possibile accedere a Midjourney solo su invito, al momento, perché è in fase di testing.
Bisogna avere un account su Discord perché la generazione degli output avviene tramite un bot.
Una volta che si riesce ad accedere al server di Midjourney è possibile iniziare ad usare il comando di base /imagine, in lingua inglese, per poter generare le proprie combinatorie visuali creative.
Il bot, dopo l’input di ricerca, genera quattro immagini numerate che possono essere migliorate in termini di scala e di risoluzione grafica.
E last but not least, c’è Stable Diffusion che, attraverso la dotazione di crediti, è possibile generare delle immagini.
Sebbene la release di Stable Diffusion sia stata subito resa pubblica, per poterlo utilizzare bisogna pagare un abbonamento.
Ora passiamo ad un’altra categoria di software AI, nella quale rientrano tutte quelle applicazioni AI generative text to image che sono salite alla ribalta ultimamente per la loro possibilità di creare autoritratti molto artistici e fantasmagorici delle nostre foto profilo, sotto forma di Avatar.
In questo ambito di intenti, cominciamo citando Astria.
Astria funziona in questo modo: si comincia con l’inserire un titolo del proprio progetto e, successivamente, un nome che ne definisca la classe (uomo, donna) da abbinare al titolo del progetto.
Successivamente vanno caricate max una ventina di foto del soggetto che vogliamo modificare grazie all’AI.
Terminata l’elaborazione del sistema, partendo dalle foto inserite del soggetto scelto, dalla pagina Tunes possiamo procedere a inserire il prompt testuale, cioè la descrizione sulla base della quale le immagini risultanti vengano modificate.
I risultati possono essere davvero strabilianti.
Altra scelta è Avatar AI, che permette di scegliere tre pacchetti a vario costo.
C’è quello “base” che permette di avere 120 immagini e sono perfette per la dimensione per una foto profilo.
Gli altri due piani di abbonamento sono più costosi ma permettono di stampare le immagini in formato molto più elevato.
Una volta scelta l’opzione adatta al vostro portafoglio, si viene direzionati sulla pagina del carrello.
A questo punto, si può scegliere fino ad un massimo di 15 stili per immagine che saranno quelli che useremo per modificare il nostro soggetto grafico sulla base del prompt testuale.
Infine, si viene guidati nel processo di caricamento delle foto (10 primi piani, 3 di lato, 5 a mezzo busto e 3 a figura intera). Non si possono caricare le foto tutte insieme.
I risultati ottenuti saranno notificati all’utente tramite e-mail.
Infine, Lensa AI.
Lensa AI esiste dal 2018, è prima nell’App-stores, si scarica gratis ma gli avatar si pagano: 3,99 dollari per 50 avatar, 5,99 dollari per 100 e 7,99 dollari per 200.
Le foto caricate dall’utente – almeno 10 – vengono rielaborate e declinate in altre varietà di stili pittorici e grafici.
Le categorie sono numerose.
Per le femmine c’è Anime, Stylish, Light, Cosmic, Fantasy, Kawaii, Pop, Iridescent, Focus e Fairy Princess.
Per i maschi c’è Superhero, Stylish, Mystical, Sci-fi, Astronaut, Anime, Adventure, Cyborg, Cosmic e Rock Star.
Lensa AI funziona come DALL-E e DALL-E 2 e sfrutta lo stesso algoritmo del riconoscimento facciale dell’applicazione Face-App di un normalissimo iPhone di ultima generazione.
I risultati vengono notificati tramite e-mail.
Visita la nostra sezione blog e rimani sempre aggiornato con le nostre news.
Sede operativa e uffici: Via Velia, 14 – 84122 Salerno
Sede Legale: Via Fiorignano, 29 – 84091 Battipaglia (SA) Cod.Fisc./P.Iva 08985291213