Los detalles de los datos de validación

Publicado el

La migración de billetes de Île-de-France a billetes electrónicos, que comenzó a principios de los años 2000, se ha extendido a todos los paquetes con una duración de una semana o más (que cubren el 80% del tráfico):

  • Mapa completo en 2001,
  • Imagina a R Student en 2002 e Imagine R School en 2003,
  • migración gradual de tarjetas Naranja de 2004 a 2009,
  • Paquetes de Transporte Solidario y Transporte Gratuito en 2008,
  • creación de la Vía Complementaria y despliegue de los nuevos paquetes Amethyst en 2013.

Hoy en día, solo quedan billetes, entradas y paquetes de corta duración en medios magnéticos.
En 2007, Île-de-France Mobilités (anteriormente STIF) decidió equiparse con un sistema de información para la toma de decisiones que utilizara datos de validación. Un "sistema de información para la toma de decisiones" es un sistema que recopila grandes volúmenes de datos de diversos tipos y luego los organiza según reglas de modelado que permiten análisis significativos para el apoyo a la decisión. Los sistemas de información BI se utilizan especialmente en los sectores de telefonía móvil, banca y comercio minorista.

La característica llamativa de la implementación del sistema de información de datos de validación (SIDV) para Île-de-France Mobilités es el volumen muy considerable de flujos de datos a gestionar: en un día de tráfico completo, hay alrededor de 10 millones de validaciones y alrededor de 2.500 millones de validaciones en un año.

Para obtener más información, puedes descargar la nota "Teleticketing: validation at the service of decision-making" (marzo de 2010) que presenta el contexto y las características esenciales de la SIDV, así como algunos ejemplos del uso de datos de validación.
Los datos asociados a una validación y reportados en la SIDV son:

  • el número de la tarjeta Navigo anonimizada, la categoría del billete, el periodo y las áreas de validez del billete;
  • la fecha, hora y lugar de la validación;
  • el tipo de validación (entrada – en qué modo, salida – de qué modo, correspondencia – de qué modo a qué modo);
  • la identificación del operador, la línea, el vehículo, la misión;
  • identificación del equipo.

Por tanto, las posibilidades de explotación estadística son muy amplias. Es útil tener en cuenta los siguientes elementos para medir adecuadamente su alcance y limitaciones.

  • Los algoritmos de anonimización se renuevan cada trimestre. Los números de tarjeta están sujetos a un algoritmo de anonimización a nivel de los sistemas de información de los operadores y luego a un segundo a nivel del sistema de información Île-de-France Mobilités. Estos algoritmos cambian trimestralmente. Así, es posible identificar las validaciones sucesivas asociadas a la misma tarjeta como máximo durante la duración de un trimestre calendario; los algoritmos de anonimización son irreversibles, es estrictamente imposible establecer la relación entre el identificador de una tarjeta tal como aparece en la SIDV y el número original de la tarjeta.
  • La SIDV solo "ve" validaciones. Algunos trayectos permanecen invisibles en los informes de validación: viajes en autobús realizados por personas que no han validado al subir al vehículo, o viajes en tren entre dos estaciones "abiertas" realizados por pasajeros que no han validado al inicio (hablamos de estaciones "abiertas" cuando puedes acceder o salir de los andenes sin necesidad de pasar por un portal de validación). En ausencia de ajustes, los datos en bruto de la SIDV subestiman los viajes en autobús o tranvía y ciertos trayectos en tren en relación con la movilidad real de los abonados.
  • El SIDV reconstruye la movilidad de los mapas a partir de los datos de validación aplicando reglas de modelado. Durante el desarrollo del sistema, se implementaron unas treinta reglas para agregar validaciones en viajes y luego en viajes, basándose en comportamientos medios.

Uno de los retos actuales de Île-de-France Mobilités es ganar precisión y exactitud en el análisis de la movilidad mediante el uso de datos de validación. Por esta razón, se están realizando esfuerzos especiales para trabajar con los portadores en la mejora de la calidad de los flujos de datos, pero también para desarrollar principios fiables de enderezamiento y reglas de modelización refinadas que puedan utilizarse para estimar la movilidad real a partir del uso de datos de validación.

Una de las ventajas más apreciables de utilizar datos de validación en comparación con las encuestas tradicionales de movilidad, o las operaciones de conteo realizadas por los transportistas, es ofrecer una visión dinámica: una encuesta o un recuento ofrece una imagen fija de la movilidad, la observación de los datos de validación permite ver cómo varía el tráfico según los días y las estaciones según los efectos del calendario, el tiempo, etc.