Le specificità dei dati di convalida

Pubblicato su

La migrazione dei biglietti dell'Ile-de-France tramite teleticketing, iniziata nei primi anni 2000, è stata estesa a tutti i pacchetti con una durata maggiore o uguale a una settimana (che coprono l'80% del traffico):

  • Mappa completa nel 2001,
  • Imagine R Student nel 2002 e Imagine R School nel 2003,
  • migrazione graduale delle carte Orange dal 2004 al 2009,
  • Pacchetti di trasporto solidale e trasporto gratuito nel 2008,
  • creazione del complemento di corso e distribuzione dei nuovi pacchetti Ametista nel 2013.

Oggi, solo biglietti, biglietti e pacchetti a breve termine rimangono su supporti magnetici.
Nel 2007, Île-de-France Mobilités (ex STIF) ha scelto di dotarsi di un sistema informativo decisionale per sfruttare i dati di convalida. Un "sistema informativo decisionale" è un sistema che raccoglie grandi volumi di dati di vario tipo e poi li organizza secondo regole di modellazione che consentono analisi significative per il supporto decisionale. I sistemi decisionali IS sono utilizzati in particolare nei settori della telefonia mobile, delle banche e della vendita al dettaglio.

La caratteristica sorprendente dell'implementazione del sistema informativo dei dati di convalida (SIDV) per Île-de-France Mobilités è il volume molto considerevole di flussi di dati da gestire: ci sono, in un giorno di traffico intenso, circa 10 milioni di convalide e circa 2,5 miliardi di convalide in un anno.

Per ulteriori informazioni, è possibile scaricare la nota "Teleticketing: Validation for Decision" (marzo 2010) che presenta il contesto e le caratteristiche essenziali del SIDV, nonché alcuni esempi di utilizzo dei dati di validazione.
I dati associati a una convalida e riportati nel SIDV sono:

  • il numero anonimo della carta Navigo, la categoria di biglietto di trasporto, il periodo e le zone di validità del biglietto;
  • la data, l'ora e il luogo della convalida;
  • il tipo di convalida (input – in quale modalità, output – di quale modalità, corrispondenza – da quale modalità a quale modalità);
  • identificazione dell'operatore, della linea, del veicolo, della missione;
  • identificazione dell'attrezzatura.

Le possibilità di sfruttamento statistico sono quindi molto ricche. È utile tenere a mente quanto segue per misurarne la portata e i limiti.

  • Gli algoritmi di anonimizzazione vengono rinnovati trimestralmente. I numeri delle carte sono soggetti a un algoritmo di anonimizzazione a livello dei sistemi informativi dei vettori e poi a un secondo a livello del sistema informativo di Île-de-France Mobilités. Questi algoritmi vengono modificati trimestralmente. Pertanto, è possibile identificare le convalide successive associate alla stessa carta al massimo per la durata di un trimestre solare; Gli algoritmi di anonimizzazione sono irreversibili, è assolutamente impossibile collegare l'identificatore di una carta come appare nel SIDV e il numero originale della carta.
  • Il SIDV "vede" solo le convalide. Alcuni viaggi rimangono invisibili nei feedback di convalida: viaggi in autobus da parte di persone che non hanno convalidato quando sono saliti a bordo del veicolo, o viaggi in treno tra due stazioni "aperte" effettuati da passeggeri che non hanno convalidato alla partenza (parliamo di stazioni "aperte" quando è possibile accedere o uscire dai binari senza la necessità di passare attraverso un portale di convalida). In assenza di un aggiustamento, l'utilizzo dei dati grezzi del SIDV sottostima quindi i viaggi in autobus o tram e alcuni viaggi in treno rispetto alla mobilità effettiva dei titolari di abbonamenti.
  • Il SIDV ricostruisce la mobilità delle mappe dai dati di convalida applicando regole di modellazione. Durante lo sviluppo del sistema, sono state messe in atto una trentina di regole per aggregare le convalide nei viaggi, quindi negli spostamenti, in base ai comportamenti medi.

Una delle sfide attuali di Île-de-France Mobilités è quella di ottenere accuratezza e precisione nell'analisi della mobilità sfruttando i dati di convalida. Per questo motivo, si stanno compiendo sforzi particolari per lavorare con i vettori per migliorare la qualità dei flussi di dati, ma anche per sviluppare principi di rettifica affidabili e regole di modellazione raffinate che consentano di stimare la mobilità effettiva dallo sfruttamento dei dati di convalida.

Uno dei vantaggi molto significativi dello sfruttamento dei dati di validazione rispetto alle indagini sulla mobilità convenzionali, o alle operazioni di conteggio effettuate dai vettori, è quello di offrire una visione dinamica: un'indagine o un conteggio danno un quadro fisso della mobilità, l'osservazione dei dati di validazione permette di vedere come il traffico varia a seconda dei giorni e delle stagioni in base agli effetti del calendario, meteo, ecc.