Os detalhes dos dados de validação

Publicado em

A migração dos ingressos da Île-de-France para bilhetes eletrônicos, que começou no início dos anos 2000, foi estendida a todos os pacotes com duração de uma semana ou mais (que cobrem 80% do tráfego):

  • Mapa completo em 2001,
  • Imagine R Student em 2002 e Imagine R School em 2003,
  • migração gradual dos cartões Laranja de 2004 a 2009,
  • Pacotes de Transporte Solidario e Transporte Gratuito em 2008,
  • criação do Caminho Complementar e implantação dos novos pacotes Amethyst em 2013.

Hoje, apenas ingressos, ingressos e pacotes de curto prazo permanecem em mídia magnética.
Em 2007, a Île-de-France Mobilités (antiga STIF) optou por se equipar com um sistema de informação para tomada de decisão e utilizar dados de validação. Um "sistema de informação para tomada de decisão" é um sistema que coleta grandes volumes de dados de vários tipos e os organiza de acordo com regras de modelagem, permitindo análises significativas para suporte à decisão. Sistemas de informação de BI são usados especialmente nos setores de telefonia móvel, banco e varejo.

A característica marcante da implementação do sistema de informação de dados de validação (SIDV) para a Île-de-France Mobilités é o volume considerável de fluxos de dados a serem gerenciados: há, em um dia de tráfego cheio, cerca de 10 milhões de validações e cerca de 2,5 bilhões de validações ao longo de um ano.

Para saber mais, você pode baixar a nota "Teleticketing: validação a serviço da tomada de decisões" (março de 2010), que apresenta o contexto e as características essenciais da SIDV, bem como alguns exemplos do uso de dados de validação.
Os dados associados a uma validação e relatados no SIDV são:

  • o número do cartão Navigo anonimizado, a categoria do bilhete, o período e as áreas de validade do bilhete;
  • a data, hora e local da validação;
  • o tipo de validação (entrada – em qual modo, saída – de qual modo, correspondência – de qual modo para qual modo);
  • a identificação do operador, da linha, do veículo, da missão;
  • Identificação do equipamento.

As possibilidades de exploração estatística são, portanto, muito grandes. É útil manter os seguintes elementos em mente para medir adequadamente seu escopo e limitações.

  • Os algoritmos de anonimização são renovados a cada trimestre. Os números dos cartões estão sujeitos a um algoritmo de anonimização no nível dos sistemas de informação das operadoras e depois a um segundo no nível do sistema de informação Île-de-France Mobilités. Esses algoritmos são alterados trimestralmente. Assim, é possível identificar as validações sucessivas associadas ao mesmo cartão no máximo durante a duração de um trimestre civil; os algoritmos de anonimização são irreversíveis, é estritamente impossível estabelecer a ligação entre o identificador de um cartão como aparece no SIDV e o número original do cartão.
  • O SIDV apenas "vê" validações. Algumas viagens permanecem invisíveis nos relatórios de validação: viagens de ônibus feitas por pessoas que não validaram ao embarcar no veículo, ou viagens de trem entre duas estações "abertas" feitas por passageiros que não validaram no início (falamos de estações "abertas" quando você pode acessar ou sair das plataformas sem precisar passar por um portal de validação). Na ausência de ajuste, os dados brutos da SIDV subestimam, portanto, as viagens de ônibus ou bonde e certas viagens de trem em relação à mobilidade real dos portadores de ingressos sazonais.
  • O SIDV reconstrói a mobilidade dos mapas a partir dos dados de validação aplicando regras de modelagem. Durante o desenvolvimento do sistema, cerca de trinta regras foram implementadas para agregar validações em viagens, depois em viagens, com base em comportamentos médios.

Um dos desafios atuais do Île-de-France Mobilités é aumentar a precisão e a exatidão na análise da mobilidade utilizando dados de validação. Por essa razão, esforços especiais estão sendo feitos para trabalhar com os portadores na melhoria da qualidade dos fluxos de dados, mas também para desenvolver princípios confiáveis de endireitamento e regras de modelagem refinadas que possam ser usadas para estimar a mobilidade real a partir do uso de dados de validação.

Uma das vantagens muito apreciáveis de usar dados de validação em comparação com pesquisas tradicionais de mobilidade, ou operações de contagem realizadas por operadoras, é oferecer uma visão dinâmica: uma pesquisa ou contagem fornece uma imagem fixa da mobilidade, a observação dos dados de validação possibilita ver como o tráfego varia de acordo com os dias e estações do ano segundo os efeitos do calendário, clima, etc.