Progetti

Text mining su BDNCP e Gazzetta Ufficiale

Studio sull'incrocio delle informazioni in BDNCP e Gazzetta Ufficiale ai fini del monitoraggio della qualità dei dati e dell'informativa di gara.

Il progetto incrocerà, mediante tecniche avanzate di text mining, i dati presenti nella BDNCP e i bandi pubblicati in Gazzetta Ufficiale ai fini di migliorare la qualità e la trasparenza delle informazioni relative ai contratti pubblici.

Obiettivi

  1. Migliorare la qualità e la completezza della BDNCP, in particolare acquisendo i dati mancanti relativi alle aggiudicazioni dai corrispondenti avvisi della GU.
  2. Migliorare la trasparenza degli appalti monitorandone l’informativa, in particolare il rispetto dell’obbligo di pubblicazione in GU. 

Impatto

Il progetto avrà dei benefici immediati in termini di monitoraggio e vigilanza del mercato e aumenterà la trasparenza, perché da un lato consentirà di acquisire i dati essenziali della fase di aggiudicazione per una parte di quei contratti in BDNCP che ne sono al momento privi, e dall’altro di vigilare sugli obblighi di pubblicazione degli appalti in GU. Inoltre, il progetto può aprire la strada ad un’utilizzazione più estesa delle banche dati testuali correlate al mercato dei contratti pubblici.

Descrizione

Durante il progetto verranno dapprima scaricati tutti i bandi e gli esiti di gara pubblicati in GU realizzando un web crawler, e verranno successivamente estratti e memorizzati i relativi metadati e il testo completo. Poi, utilizzando il CIG ed altre chiavi parziali, si passerà ad incrociare tutti i record BDNCP relativi a contratti con obblighi di pubblicazione in GU con i bandi GU opportunamente indicizzati, e verrà analizzata la congruenza fra i due insiemi. A valle di questo studio, si passerà ad individuare gli esiti GU corrispondenti a record BDNCP con informazioni mancanti sulle aggiudicazioni. Da tali documenti testuali, verranno estratte le informazioni principali relative alle aggiudicazioni (aggiudicatario, importo, data) mediante tecniche avanzate di text mining. L’affidabilità delle indicazioni fornite automaticamente verrà valutata sperimentalmente.

Appartiene a

Competenze