Gli esperti Panasonic del gruppo di ricerca REAL-AI, che si occupa di intelligenza artificiale, hanno sviluppato un nuovo algoritmo di Deep Learning in grado di distribuire in modo uniforme i soggetti all’interno di categorie e sottocategorie.
“Poiché l’intelligenza artificiale continua ad essere utilizzata in una varietà di contesti e vengono gestite un gran numero di immagini diverse, i limiti dell’approccio volto a “trovare caratteristiche comuni” sono diventati evidenti. In particolare, quando sono presenti sottocategorie con tendenze estetiche diverse all’interno della stessa categoria (distribuzione multimodale), l’intelligenza artificiale spesso ha difficoltà a riconoscere con successo tali oggetti come appartenenti alla stessa categoria, con conseguente diminuzione della precisione del riconoscimento.”
Questo si legge nella nota ufficiale con cui Panasonic comunica il suo procedere nello sviluppo di algoritmi AI sempre più precisi. Oggi le necessità sono diventate due: quella di individuare con precisione oggetti della stessa categoria che possono apparire in modi differenti (per angolo di ripresa o per contesto ad esempio) e quella di escludere che soggetti che sembrano simili appartengano alle stesse categorie.
“Nella categoria “Uccelli” mostrata in figura 1 ci sono gruppi di immagini dello stesso uccello con input diversi, come “uccelli che volano nel cielo”, “uccelli nella prateria”, “uccelli appollaiati sugli alberi” e “teste di uccelli”. Ognuna di queste immagini contiene informazioni sul soggetto. Se ci concentriamo sulle caratteristiche essenziali, finiamo per buttare via le diverse informazioni che le immagini contengono. Pertanto, abbiamo sviluppato un algoritmo che utilizza attivamente le informazioni sui vari piani dell’immagine per migliorare la capacità dell’intelligenza artificiale di riconoscere immagini con distribuzione multimodale passando da un vettore unidimensionale ad una matrice bidimensionale.”
In sostanza Panasonic sta introducendo un classificatore in grado di riconoscere i soggetti in base al contesto. Ma questo algoritmo è anche in grado di separare quelli molto simili tra loro in categorie differenti: ad esempio “autobus” e “tram”, simili in apparenza, vengono rilevati come soggetti ben distinti.
“La figura 2 mostra i risultati del riconoscimento del metodo convenzionale DNC (a sinistra) e del metodo proposto (a destra) nel compito di interrogare immagini della stessa categoria. La prima riga è un’attività di query per l’immagine di un autobus, la seconda riga è per un treno e la terza riga è per un tram. Mentre il metodo convenzionale è riuscito a trovare altri veicoli dall’aspetto simile, il metodo proposto è in grado di trovare immagini della stessa categoria con una ricca varietà di aspetti.”