As especificidades dos dados de validação

Publicado em

A migração dos bilhetes Ile-de-France em bilhetes eletrônicos, que começou no início dos anos 2000, foi estendida a todos os pacotes de uma semana ou mais (que cobrem 80% do tráfego):

  • Mapa completo em 2001,
  • Imagine R Student em 2002 e Imagine R School em 2003,
  • migração gradual de cartões Orange de 2004 a 2009,
  • Transportes Solidários e Transportes Gratuitos em 2008,
  • criação do Caminho Complementar e implantação dos novos pacotes Ametista em 2013.

Hoje, apenas ingressos, ingressos e pacotes de curta duração permanecem em mídia magnética.
Em 2007, a Île-de-France Mobilités (anteriormente STIF) optou por se dotar de um sistema de informação de tomada de decisão para utilizar dados de validação. Um "sistema de informação de tomada de decisão" é um sistema que coleta grandes volumes de dados de vários tipos e os organiza de acordo com regras de modelagem que permitem análises significativas para suporte à decisão. Os sistemas de informação de BI são utilizados nos setores de telefonia móvel, bancário e varejo, entre outros.

A característica marcante da implementação do sistema de informação de dados de validação (SIDV) para a Île-de-France Mobilités é o volume muito considerável de fluxos de dados a serem gerenciados: há, em um dia de tráfego total, cerca de 10 milhões de validações e cerca de 2,5 bilhões de validações ao longo de um ano.

Para saber mais, você pode baixar a nota "Téléticketing: validação a serviço da tomada de decisão" (março de 2010) que apresenta o contexto e as características essenciais do SIDV, bem como alguns exemplos do uso de dados de validação.
Os dados associados a uma validação e relatados no SIDV são:

  • o número do cartão Navigo anonimizado, a categoria do bilhete, o período e as áreas de validade do bilhete;
  • a data, hora e local da validação;
  • o tipo de validação (entrada – em que modo, saída – de que modo, correspondência – de que modo para que modo);
  • identificação do operador, da linha, do veículo, da missão;
  • identificação do equipamento.

As possibilidades de exploração estatística são, portanto, muito ricas. É útil ter em mente os seguintes elementos para medir adequadamente seu escopo e limitações.

  • Os algoritmos de anonimização são renovados a cada trimestre. Os números dos cartões estão sujeitos a um algoritmo de anonimização ao nível dos sistemas de informação das transportadoras e, em seguida, a um segundo ao nível do sistema de informação da Île-de-France Mobilités. Esses algoritmos são alterados a cada trimestre. Assim, é possível identificar as sucessivas validações associadas ao mesmo cartão ao longo de um trimestre civil, no máximo; os algoritmos de anonimização são irreversíveis, é estritamente impossível fazer a ligação entre o identificador de um cartão tal como aparece no SIDV e o número original do cartão.
  • O SIDV só "vê" validações. Algumas viagens permanecem invisíveis nos relatórios de validação: viagens de ônibus por pessoas que não validaram ao embarcar no veículo, ou viagens de trem entre duas estações "abertas" feitas por passageiros que não validaram no início (falamos de estações "abertas" quando você pode acessar ou sair das plataformas sem a necessidade de passar por um portal de validação). Na ausência de ajustamento, os dados brutos do SIDV subestimam, portanto, as viagens de autocarro ou elétrico e certas viagens de comboio em relação à mobilidade real dos titulares de bilhetes sazonais.
  • O SIDV reconstrói a mobilidade dos mapas a partir dos dados de validação, aplicando regras de modelagem. Durante o desenvolvimento do sistema, cerca de trinta regras foram implementadas para agregar validações em viagens, depois em viagens, com base em comportamentos médios.

Um dos desafios atuais para a Île-de-France Mobilités é melhorar a exatidão e a precisão da análise de mobilidade usando dados de validação. Por esse motivo, esforços especiais estão sendo feitos para trabalhar com as operadoras na melhoria da qualidade dos fluxos de dados, mas também para desenvolver princípios de endireitamento confiáveis e regras de modelagem refinadas que possam ser usadas para estimar a mobilidade real a partir do uso de dados de validação.

Uma das vantagens muito apreciáveis da utilização de dados de validação em comparação com os inquéritos de mobilidade tradicionais, ou operações de contagem realizadas pelas transportadoras, é oferecer uma visão dinâmica: um inquérito ou uma contagem dá uma imagem fixa da mobilidade, a observação dos dados de validação permite ver como o tráfego varia em função dos dias e estações de acordo com os efeitos do calendário, clima, etc.