Classificazione di immagini e video

La crescita del World Wide Web ha reso disponibili grandi quantità di informazione visuale facendo emergere una forte domanda di metodologie efficienti per la gestione, classificazione e il recupero di immagini così da massimizzare i benefici che l’utente può  trarre dallo sfruttamento di questo tipo di dati. I sistemi tradizionali di accesso all’informazione multimediale sono basati su parole chiave, associate manualmente ai video e/o alle immagini, e su sistemi testuali di indicizzazione e recupero. Con l’aumentare del numero delle immagini, l’applicabilità di queste tecniche è divenuta estremamente critica e poco efficiente, spingendo l’interesse della comunità scientifica verso algoritmi e metodologie di classificazione di tipo “content-based”. Queste tecniche effettuano l’accesso alle immagini  sulla base delle caratteristiche di basso livello (colore, luminanza, tessiture, statistiche sull’orientamento dei bordi) e delle misure di similarità.

Lo scenario descritto ha motivato la FUB a proporre un innovativo algoritmo di raggruppamento e classificazione delle immagini che è risultato particolarmente efficiente nella navigazione su vaste collezioni di dati.

Il metodo sviluppato individua e presenta all’utente gruppi di immagini omogenee all’interno del database. L’efficacia di questa operazione è strettamente correlata con una corretta caratterizzazione delle immagini attraverso le “feature” di basso livello. Questo aspetto della procedura di classificazione è stato particolarmente curato, selezionando le zone dell’immagine ad elevato contenuto informativo. Le regioni dell’immagine possono essere analizzate con i descrittori spazio-temporali basati sulle famiglie di funzioni di Laguerre-Gauss e Zernike, che per la loro natura piramidale semplificano le operazioni di creazione dei cluster tramite operazioni di confronto organizzate in alberi. L’ordinamento finale dei cluster da presentare all’utente, come risposta ad una sua query, viene generato con l’algoritmo BFS (Breadth First Search) per la ricerca dei sottografi connessi all’interno della matrice binaria calcolata sogliando la matrice di probabilità associata al processo di fusione dei cluster.