X
Entra
Accedi
Ho dimenticato la password
X
Se il tuo indirizzo è presente nel nostro database riceverai una mail con le istruzioni per recuperare la tua password

Chiudi
Reset password
Inserisci il tuo indirizzo email nella casella sottostante e ti invieremo la procedura per resettare la password
Invia
X
Grazie per esserti registrato!

Accedi ora
Registrati
Registrati
Ho dimenticato la password
Fotografia.it

Panasonic sviluppa un nuovo algoritmo AI in grado di gestire la distribuzione multimodale

Francesco Carlini | 7 Gennaio 2024

Gli esperti Panasonic del gruppo di ricerca REAL-AI, che si occupa di intelligenza artificiale, hanno sviluppato un nuovo algoritmo di Deep Learning in grado di distribuire in modo uniforme i soggetti all’interno di categorie e sottocategorie.

“Poiché l’intelligenza artificiale continua ad essere utilizzata in una varietà di contesti e vengono gestite un gran numero di immagini diverse, i limiti dell’approccio volto a “trovare caratteristiche comuni” sono diventati evidenti. In particolare, quando sono presenti sottocategorie con tendenze estetiche diverse all’interno della stessa categoria (distribuzione multimodale), l’intelligenza artificiale spesso ha difficoltà a riconoscere con successo tali oggetti come appartenenti alla stessa categoria, con conseguente diminuzione della precisione del riconoscimento.”

Questo si legge nella nota ufficiale con cui Panasonic comunica il suo procedere nello sviluppo di algoritmi AI sempre più precisi. Oggi le necessità sono diventate due: quella di individuare con precisione oggetti della stessa categoria che possono apparire in modi differenti (per angolo di ripresa o per contesto ad esempio) e quella di escludere che soggetti che sembrano simili appartengano alle stesse categorie.

fotopuntoit_panasonic_ai_case-study_1
Figura 1

“Nella categoria “Uccelli” mostrata in figura 1 ci sono gruppi di immagini dello stesso uccello con input diversi, come “uccelli che volano nel cielo”, “uccelli nella prateria”, “uccelli appollaiati sugli alberi” e “teste di uccelli”. Ognuna di queste immagini contiene informazioni sul soggetto. Se ci concentriamo sulle caratteristiche essenziali, finiamo per buttare via le diverse informazioni che le immagini contengono. Pertanto, abbiamo sviluppato un algoritmo che utilizza attivamente le informazioni sui vari piani dell’immagine per migliorare la capacità dell’intelligenza artificiale di riconoscere immagini con distribuzione multimodale passando da un vettore unidimensionale ad una matrice bidimensionale.”

In sostanza Panasonic sta introducendo un classificatore in grado di riconoscere i soggetti in base al contesto. Ma questo algoritmo è anche in grado di separare quelli molto simili tra loro in categorie differenti: ad esempio “autobus” e “tram”, simili in apparenza, vengono rilevati come soggetti ben distinti.

fotopuntoit_panasonic_ai_case-study_2
Figura 2

“La figura 2 mostra i risultati del riconoscimento del metodo convenzionale DNC (a sinistra) e del metodo proposto (a destra) nel compito di interrogare immagini della stessa categoria. La prima riga è un’attività di query per l’immagine di un autobus, la seconda riga è per un treno e la terza riga è per un tram. Mentre il metodo convenzionale è riuscito a trovare altri veicoli dall’aspetto simile, il metodo proposto è in grado di trovare immagini della stessa categoria con una ricca varietà di aspetti.”

Francesco Carlini
In primis appassionato di fotografia, dal 2008 faccio parte del team di Editrice Progresso, storica casa editrice italiana fondata nel 1894, e gestisco il sito www.fotografia.it. Al lavoro redazionale e giornalistico nel corso degli anni ho affiancato il lavoro di prova dei prodotti e delle misurazioni di laboratorio riguardanti fotocamere, obiettivi e smartphone.
  • Cerca

  •