IRMAIntelligent Retrieval in Multimedia Archives


Programma di finanziamento (e relativo sottoprogramma) |
Sviluppo Lazio - Bando POR FESR Lazio 2007-2013 |
Durata | settembre 2010 - settembre 2012 |
Partecipanti | Fondazione Ugo Bordoni (Leader di Progetto) RAI ( TECHE-CRIT) SCAI - EURIX - PRIMESAIL |
IRMA è un progetto realizzato grazie ai finanziamenti alle imprese previsti dal POR FESR Lazio 2007-2013 nell’ambito del settore filiera dell’audiovisivo per favorire la crescita armonica e sostenibile del territorio. Il progetto, coordinato da FUB e RAI, si pone come obiettivo la modernizzazione delle tecniche di restauro, memorizzazione e pubblicazione del patrimonio filmico e documentale disponibile nei fondi di archivio presenti nel territorio della Regione Lazio.
Gli strumenti creati permettono di intervenire, a più livelli, su materiale audiovisivo memorizzato con supporti obsoleti o a rischio (in particolare pellicole e primi formati elettronici), per digitalizzarlo e per organizzarlo ai fini di una sua migliore fruizione.
Al fine di conseguire gli obiettivi del Progetto, le Parti interessate hanno costituito un’ATI (Associazione Temporanea di Imprese), di cui FUB è capofila. Oltre alla conseguente responsabilità di gestione del progetto, FUB ne ha in carico anche il coordinamento tecnico.
Il Progetto IRMA si colloca nell’area del Multimedia Information Retrieval, che coniuga i sistemi di Text Retrieval (TR), Visual Retrieval (VR), Video Retrieval (VDR) e Audio Retrieval (AR). Il lavoro svolto ha incluso attività di ricerca sui seguenti tre temi:
- individuazione automatica di specifici concetti semantici, sulla base delle caratteristiche estratte dall’analisi numerica del contenuto video, nell’ambito della metadatazione automatica
- integrazione degli indici di contenuto e del sistema di metadatazione automatica
- integrazione degli indici con contenuto multimediale e degli indici relativi alle interrogazioni sottomesse al sistema
- integrazione degli indici di contenuto e del sistema di metadatazione automatica
IRMA consiste in una piattaforma che integra metodologie scientifiche innovative e tecnologie informatiche avanzate per la metadatazione automatica, la classificazione semantica, l’indicizzazione e il recupero di dati multimediali. La piattaforma consente l’estrazione e integrazione di vari tipi di informazioni afferenti una base dati video, inclusi i metadati, la trascrizione del parlato, il contenuto video e i log delle ricerche effettuate dagli utenti.
Questa architettura richiede un elevato livello di integrazione tra componenti software, che pone problemi di interoperabilità. IRMA, pertanto, adotta metodologie, protocolli e formati standard. Tale pratica costituisce un punto d’innovazione del progetto per quanto riguarda i seguenti aspetti:
- verifica e messa in opera di componenti/servizi/sottosistemi aderenti a standard internazionali e conseguente benchmarking e valutazione degli standard adottati rispetto alle esigenze applicative concrete del Progetto;
- costruzione di framework basati su metodologie, protocolli e formati standard che rappresentano embrioni di prodotti da collocare sul mercato nazionale e internazionale;
- conservabilità e accessibilità a lungo termine dei contenuti, assicurata dall’adozione di formati di codifica e incapsulamento standard.
I filmati audiovisivi, annotati tramite sistemi di metadatazione automatica e contestualizzazione manuale sono organizzati e aggregati per essere fruibili attraverso un portale di pubblicazione che integra diverse tipologie di ricerca: ricerca anagrafica, di contenuto testuale e di contenuto multimediale. La ricerca testuale è implementata utilizzando sia il paradigma di indicizzazione full text, sia paradigmi di interrogazione basati sull’elaborazione computazionale del linguaggio naturale.
Lo scopo è migliorare le prestazioni del sistema di navigazione dei contenuti e individuare tendenze generali o relative a nicchie di utenti. Quest’analisi si avvale anche del ricco patrimonio di dati presente nei sistemi di consultazione degli archivi RAI (Teche RAI). La distribuzione delle ricerche consente di:
- riconoscere nuovi interessi dell’utente
- rilevare comportamenti usuali o sconosciuti
- identificare tendenze frequenti o nuove nella ricerca di contenuti
- individuare nuovi segmenti di mercato