Le specifiche dei dati di convalida

Pubblicato su

La migrazione dei biglietti dell'Ile-de-France sulla biglietteria elettronica, iniziata all'inizio degli anni 2000, è stata estesa a tutti i pacchetti di una settimana o più (che coprono l'80% del traffico):

  • Mappa completa nel 2001,
  • Imagine R Student nel 2002 e Imagine R School nel 2003,
  • migrazione graduale delle carte arancioni dal 2004 al 2009,
  • Pacchetti Trasporto Solidale e Trasporto Gratuito nel 2008,
  • creazione del percorso complementare e diffusione dei nuovi pacchetti Amethyst nel 2013.

Oggi su supporto magnetico rimangono solo i biglietti, i biglietti e i pacchetti a breve termine.
Nel 2007, l'Île-de-France Mobilités (ex STIF) ha scelto di dotarsi di un sistema informativo decisionale per l'utilizzo dei dati di convalida. Un "sistema informativo decisionale" è un sistema che raccoglie grandi volumi di dati di varia natura e poi li organizza secondo regole di modellazione che consentono analisi significative per il supporto alle decisioni. I sistemi informativi BI sono utilizzati, tra l'altro, nei settori della telefonia mobile, delle banche e della vendita al dettaglio.

La caratteristica sorprendente dell'implementazione del sistema informativo sui dati di convalida (SIDV) per l'Île-de-France Mobilités è il volume molto considerevole di flussi di dati da gestire: si registrano, in un giorno di pieno traffico, circa 10 milioni di convalide e circa 2,5 miliardi di convalide in un anno.

Per saperne di più, è possibile scaricare la nota "Téléticketing: la convalida al servizio del processo decisionale" (marzo 2010) che presenta il contesto e le caratteristiche essenziali della SIDV, nonché alcuni esempi di utilizzo dei dati di convalida.
I dati associati ad una validazione e riportati nel SIDV sono:

  • il numero della carta Navigo anonimizzata, la categoria del biglietto, il periodo e le aree di validità del biglietto;
  • la data, l'ora e il luogo della convalida;
  • il tipo di validazione (input – in quale modo, output – da quale modo, corrispondenza – da quale modo a quale modo);
  • identificazione dell'operatore, della linea, del veicolo, della missione;
  • identificazione dell'apparecchiatura.

Le possibilità di sfruttamento statistico sono quindi molto ricche. È utile tenere a mente i seguenti elementi per misurarne correttamente la portata e i limiti.

  • Gli algoritmi di anonimizzazione vengono rinnovati ogni trimestre. I numeri di carta sono sottoposti a un algoritmo di anonimizzazione a livello dei sistemi di informazione dei vettori e successivamente a un secondo algoritmo a livello del sistema informativo dell'Île-de-France Mobilités. Questi algoritmi vengono modificati ogni trimestre. In questo modo è possibile identificare le convalide successive associate alla stessa carta nell'arco di un trimestre solare al massimo; gli algoritmi di anonimizzazione sono irreversibili, è rigorosamente impossibile stabilire il collegamento tra l'identificatore di una carta come appare nel SIDV e il numero originale della carta.
  • Il SIDV "vede" solo le convalide. Alcuni viaggi rimangono invisibili nei rapporti di convalida: viaggi in autobus da parte di persone che non hanno convalidato al momento dell'imbarco sul veicolo, oppure viaggi in treno tra due stazioni "aperte" effettuati da passeggeri che non hanno convalidato alla partenza (si parla di stazioni "aperte" quando è possibile accedere o uscire dai binari senza la necessità di passare attraverso un portale di convalida). In assenza di aggiustamenti, i dati grezzi del SIDV sottostimano quindi i viaggi in autobus o in tram e alcuni viaggi in treno in relazione all'effettiva mobilità degli abbonati.
  • Il SIDV ricostruisce la mobilità delle mappe a partire dai dati di validazione applicando regole di modellizzazione. Durante lo sviluppo del sistema, sono state messe in atto una trentina di regole per aggregare le convalide in viaggi, quindi in viaggi, sulla base di comportamenti medi.

Una delle sfide attuali per l'Île-de-France Mobilités è quella di migliorare l'accuratezza e la precisione dell'analisi della mobilità utilizzando i dati di convalida. Per questo motivo, si stanno compiendo sforzi particolari per lavorare con i vettori al fine di migliorare la qualità dei flussi di dati, ma anche per sviluppare principi di raddrizzamento affidabili e regole di modellazione raffinate che possono essere utilizzate per stimare la mobilità effettiva dall'uso dei dati di convalida.

Uno dei vantaggi molto apprezzabili dell'utilizzo dei dati di validazione rispetto alle tradizionali indagini sulla mobilità, ovvero alle operazioni di conteggio effettuate dai vettori, è quello di offrire una visione dinamica: un'indagine o un conteggio fornisce un quadro fisso della mobilità, l'osservazione dei dati di validazione permette di vedere come varia il traffico in base ai giorni e alle stagioni in base agli effetti del calendario, meteo, ecc.