NewGT
New Generation Tourist

Programma di finanziamento 
(e relativo sottoprogramma)
Avviso pubblico “CO-RESEARCH” emanato dalla Regione Lazio (B.U.R.L. Parte Terza n.37 del 7 ottobre 2011)
Durata ottobre 2012 – settembre 2014
Partecipanti

Interactive Media Spa (Azienda Capofila)

Questo progetto finanziato dalla Regione Lazio nell’ambito dell’Avviso pubblico “CO-RESEARCH”, si è concluso a settembre 2014.

L’obiettivo del progetto è stato lo sviluppo di un’applicazione per il turismo. In particolare è stato sviluppato un Assistente Virtuale basato su tecnologia Avatar, in grado di erogare servizi e funzionalità avanzate attraverso qualunque PC, smartphone o tablet connesso a Internet. L’utente formula richieste all’Avatar tramite chat, e ottiene le risposte sia a livello testuale sia a livello vocale. L’ambito su cui è focalizzato il progetto è̀ la prenotazione alberghiera.

L’interazione con i dati gestiti dall’Avatar è estremamente evoluta, grazie alla presenza di un motore semantico per la gestione delle informazioni, non solo attraverso parole chiave, ma anche attraverso significati, relazioni e modelli matematici per un conseguente accesso più mirato e intelligente.

Le caratteristiche principali dell’interfaccia Avatar possono essere così schematizzate:

  • Avatar configurabile su sistemi on-site o attraverso la Cloud
  • Grafica 3D customizzabile
  • Multicanalità
  • Integrazione tecnologie di sintesi vocale
  • Multilingua
  • Voce via web
  • Dialogo in linguaggio naturale
  • Integrazione motore semantico
  • Interfacciamento standard con basi di dati e applicazioni esistenti
  • Strumenti di analisi, monitoraggio e reportistica
  • Elevato livello di sicurezza per prevenire attacchi intrusivi dall’esterno

Per garantire che il sistema funzioni negli ambiti definiti, è̀ stata posta particolare attenzione all’attività di studio e definizione dei modelli d’interazione, ontologia, regole, logiche di work-flow in ambito turistico/alberghiero per la lingua italiana. A questo scopo sono state organizzate delle sessioni di raccolta di dialoghi sul dominio turistico/alberghiero per consentire la progettazione del sistema.

Alla necessità̀ di raccogliere dati sul comportamento degli utenti con un particolare sistema di dialogo, si sono aggiunti, nella progettazione di NewGT, l’interesse scientifico e la necessità pratica di raccogliere materiale sull’italiano scritto odierno, in continua espansione, soprattutto in situazioni comunicative fino a poco tempo fa appannaggio dell’oralità. Alla già evidenziata differenza tra dialogo uomo-uomo e uomo-macchina, va così ad aggiungersi un’assenza di studi linguistici sull’interazione via chat con agenti conversazionali. Lo sviluppo di un agente conversazionale via chat, come quello del progetto NewGT, pone cosìdi fronte sia alla necessità sia all’interesse di indagare ambiti linguistici ancora poco studiati per quanto riguarda l’italiano: da una parte il dialogo uomo-macchina, dall’altra il “dialogo scritto”.

Per raccogliere dati sull’interazione tra il parlante e il sistema automatico senza avere a disposizione un sistema di dialogo è stata utilizzata la tecnica del Mago di Oz. La metodologia consiste nel far interagire un utente con un sistema automatico “finto”, impersonato dallo sperimentatore (chiamato wizard), senza che il primo ne sia a conoscenza.

Contemporaneamente è stata avviata la definizione degli utenti e dei compiti su cui sviluppare la raccolta dei dialoghi. I soggetti reclutati per l’acquisizione del corpus riflettono la distribuzione statistica degli utenti del sistema in progetto. Le tipologie di soggetti coinvolti per acquisire il corpus sono le seguenti: Giovani; Adulti; Anziani; Disabili (disabili motori e non vedenti).

I soggetti (10 per ogni tipologia) sono stati istruiti all’esecuzione di un compito simile a quello che gli utenti futuri avrebbero dovuto svogere utilizzando il sistema reale, con particolare attenzione a non creare delle “cue” linguistiche che possano suggerire loro certe parole o forme verbali, e quindi costituire un “bias” del corpus.

Una volta raccolti i corpora rappresentativi degli ambiti definiti dal progetto, per poterli utilizzare nella fase di addestramento e in quella di valutazione del sistema, è stato necessario trascriverli e annotarli. Per fare ciò, sono state definite le specifiche per l’annotazione e decisi gli strumenti software da utilizzare. Per tutte le categorie di utenti e le diverse sottocategorie di dominio sono stati definiti degli scenari e quindi dei compiti. In particolare, 10 soggetti per ogni tipologia (per un totale di 40 soggetti) hanno svolto 6 compiti all’interno di 6 scenari.

Quindi, una volta definiti i modelli del linguaggio, sono stati realizzati un prototipo del Dialogue Manager e un prototipo dell’Avatar. Si è quindi proceduto alla validazione dell’intera catena dei moduli costituenti il sistema mediante campagne di test e collaudo nel settore turistico alberghiero e validazione del sistema interattivo in termini di usabilità e accessibilità. A questo proposito, sono state definite e applicate delle misure oggettive delle prestazioni del dialogo ed è statà valutata l’esperienza dell’utente.

Nell’ambito del progetto, la Fondazione ha svolto le seguenti attività:

  • progettazione e acquisizione del corpus per addestrare il sistema;
  • ottimizzazione del motore semantico di sistema nel dominio turistico/alberghiero (aspetti sintattici, testuali, pragmatici e grafici della lingua italiana e della tipologia d’interazione chat);
  • studio e definizione dei modelli d’interazione, ontologia, regole, logiche di work-flow in ambito turistico/alberghiero per la lingua italiana; valutazione delle prestazioni del dialogo;
  • valutazione del prototipo e dell’esperienza dell’utente.