Story Transcript
.
Inferencia y actualización de matrices O-D de movilidad a través de datos de telefonía celular N. Cáceres, J. P. Wideberg, L. M. Romero, J. Vázquez, F. G. Benítez Ingeniería e Infraestructura de los Transportes, Escuela Superior de Ingenieros, Sevilla, España. RESUMEN Los datos de movilidad, organizados en matrices origen-destino, proporcionan una estimación de desplazamientos entre puntos de una red en un periodo de tiempo dado. Una estimación precisa y rápida de estas matrices, para modos de transporte mecanizados, es esencial para la optimización del uso de dicha infraestructura tanto desde la perspectiva de utilización diaria como de inversiones a realizar. En esta ponencia se presenta una técnica para obtener matrices O-D actualizadas mediante datos de localización de teléfonos móviles en vehículos. La metodología para el análisis de la técnica incluye un simulador de tráfico vehicular que reproduce la gestión que una red de telefonía efectúa sobre teléfonos que existen sobre su área de cobertura. Ello permite disponer de una estimación de posición, referida a la zona que les proporciona cobertura, mediante los registros de localización. El tratamiento de esos registros facilita la inferencia de matrices O-D y aforos, respetando la privacidad de los abonados. 1. INTRODUCCIÓN 1.1 Introducción La estimación de matrices O-D supone un largo proceso que puede abarcar incluso años. Asimismo, las metodologías tradicionalmente usadas resultan en ocasiones poco fiables o muy costosas desde el punto de vista económico y/o social. Por ello, surge la necesidad de nuevas técnicas que revolucionen los estudios de movilidad en términos de tiempo, coste y precisión. El uso extendido de la telefonía móvil en la sociedad actual, junto con la propia naturaleza de la gestión de movilidad usada en redes GSM, sugiere la posibilidad de que esos terminales se conviertan en equipos de medida que, sin revelar datos confidenciales ni afectar a su funcionamiento, aporten datos sobre desplazamientos entre zonas de los que se pueda derivar información de tráfico. Este trabajo muestra los resultados obtenidos con un simulador que genera información de tráfico (matrices O-D y aforos) actualizada mediante el tratamiento de datos de localización de teléfonos móviles que cualquier vehículo puede llevar a bordo. 1.2 Estado del arte La idea del empleo de teléfonos móviles para monitorizar el tráfico rodado no es nueva. La aparición de legislaciones que exigieron precisión en la localización de llamadas de emergencias (2002/22/EC) propició una exhaustiva investigación sobre técnicas que mejoraran el posicionamiento proporcionado por los operadores. Como consecuencia, surgieron nuevos servicios relacionados con la posición (LBS), algunos enfocados al sector
.
del Transporte. Sobre este tema han aparecido múltiples trabajos en los últimos años. Smith y Lovell (2001) elaboraron diferentes trabajos sobre el tratamiento de datos de posición anónimos de teléfonos móviles orientados a aplicaciones de transporte. También destacan estudios efectuados por Sohn (2004) sobre estimación de matrices O-D utilizando simulaciones de datos de telefonía móvil. Igualmente, existen proyectos pilotos en los que se estudia esta técnica, algunos utilizan la propia localización usada en las redes GSM cuando un teléfono está encendido (Virtanen, 2002), otros emplean datos asociados a situaciones concretas como “handover” (Linauer, 2003) o llamadas (White, 2002; Ratti et al., 2005), o incluso existen proyectos que desarrollan un software propio de la captura de señalización de teléfonos (Ygnace et al, 2001). 2. DATOS DE LOCALIZACIÓN EN TELEFONÍA CELULAR 2.1 Introducción a la Gestión de localización y movilidad en redes GSM El esquema seguido por los sistemas de telefonía móvil para organizar la cobertura se basa en definir áreas de localización (LA) y éstas a su vez dividirlas en celdas, típicamente con forma hexagonal. Un área de localización es una zona geográfica cubierta por un conjunto de estaciones base pertenecientes a un mismo grupo y se identifica por el LAI (Location Area Identity). La celda es la zona en la que una estación base proporciona servicios. Para identificar una celda dentro de un LA se usa el valor CI (Cell Identity). El radio de las celdas varía según pertenezca a entornos urbanos o rurales. En ciudades, su radio oscila entre 100 m y 1 km. En entornos rurales depende de la densidad de las antenas, aunque suele oscilar entre 5 y 20 km. Con dichos valores, una red GSM mantiene continuamente localizados a sus usuarios para proporcionarles los servicios lo más rápido posible con el menor coste de señalización. Para ello, se llevan a cabo una serie de procesos que actualizan las bases de datos del sistema. Su frecuencia de ejecución depende del estado del teléfono. Cuando el teléfono está simplemente encendido, basta que la red conozca el LA donde se encuentra para alertarle en caso de una llamada entrante, por lo que el teléfono puede moverse por las distintas celdas del área sin necesidad de actualizar su posición. En este caso, los eventos que lanzan los procesos para actualizar la posición son: (1) cuando el terminal móvil se enciende, (2) cada vez que finaliza un temporizador para notificar su presencia en la red (se obliga a realizar un registro aunque se encuentre en el mismo LA) y (3) cada vez que cambia de LA. Sin embargo, cuando se tiene una conexión activa con la red (i.e.: una llamada), la actualización de posición es continua. La red precisa conocer el área de localización junto con la celda exacta donde se halle el teléfono y mantener actualizados esos datos mientras dure la conexión para garantizar su éxito. 2.2 Nuevo Método de Estimación Según lo anterior, la red GSM maneja una estimación de posición de un terminal cuando está
.
encendido dentro de su cobertura. Si esto se traslada al dominio de teléfonos a bordo de vehículos en movimiento, un terminal que tenga establecida una conexión con la red (llamada) proporciona datos bastante continuos del recorrido, en términos de celda y LA por los que está circulando. Incluso si el terminal no está en uso, sino simplemente encendido, también ofrece datos fiables del recorrido, puesto que continuamente se conoce el LA en el que se encuentra en cada instante. En este caso, aunque son menos precisos y frecuentes, también permiten construir trayectorias. Combinando esos datos de celdas y áreas de localización, en las cuales cada teléfono móvil se ha ido registrando, es posible construir viajes a través de los cuales se podrán inferir los datos de movilidad origen-destino. Es preciso indicar que el interés de la técnica reside en el propio viaje, sin importar quién lo realizó. Por ello, los datos de identidad de teléfonos que se manejen estarán cifrados, bien mediante un algoritmo de encriptación o con un identificador ficticio. 3. HERRAMIENTAS DE SIMULACIÓN Y ESTIMACIÓN 3.1 Prueba piloto Esta investigación ha demostrado la eficacia en la inferencia de datos de tráfico a través de información disponible de telefonía celular. Para ello se ha desarrollado una herramienta simuladora de tráfico que, al tiempo que modela la situación de tráfico rodado por el escenario de estudio, genera unos datos de localización de teléfonos similares a como se consiguen en las redes GSM. Con los registros de localización “ficticios”, se da paso a la estimación de información de tráfico. El proceso de estimación se fundamenta en el análisis de esos registros para controlar el paso por las distintas celdas que cubren el tramo estudiado, actuando los teléfonos como equipos de medida anónimos e indirectos. Los datos extraídos proporcionan la información necesaria para inferir matrices O-D o determinar flujos de tráfico. Además, este simulador posee una doble funcionalidad. Por un lado, genera los registros de localización oportunos y, paralelamente, almacena los datos de la situación de tráfico simulada a fin de evaluar la precisión de estimación de esta técnica (Cáceres et al., 2005). 3.2 Escenario para la prueba piloto 3.2.1 Tramo de carretera El tramo elegido para la evaluación del proceso es la sección Huelva - Sevilla de la Autopista A-49. Una vez definido el tramo, se precisa conocer la distribución de celdas y LA así como su ubicación en dicho tramo. Esto se consigue definir realizando un estudio previo en el que se use un teléfono móvil con “localizador”, el cual permite conocer la celda por la que se transita. Un viaje sonda permitió capturar estos datos, anotando los identificadores de celda (LAI y CI), así como la posición (punto kilométrico) en la que se iniciaba la cobertura en cada celda.
.
Fig. 1 – Cobertura de celdas y áreas de localización en tramo Sevilla-Huelva A-49 Junto a ello, y para disponer de un orden de magnitud a la hora de generar los vehículos con el simulador, se hace uso de los datos reales de volumen de paso de vehículos por puntos aforo ubicados en el tramo estudiado (M. FOM., 2002). Puesto que se conocen los datos de IMD asociados a los puntos de aforo, así como su situación geográfica, se ubica un punto origen/destino entre cada par de aforos consecutivos. Con dichos puntos, se establecen los posibles trayectos origen-destino que pueden realizar los vehículos simulados, de manera que la IMD asociada a cada trayecto cumpla las condiciones de paso por aforos. 3.2.2 Parámetros GSM gestionados Es importante resaltar que esta técnica no necesita conocer la identidad real del abonado, simplemente requiere algún parámetro que permita distinguir cada teléfono de cara a la realización de cálculos de seguimiento. Para una aplicación desarrollada en un entorno real, basta con que el operador facilite un identificador cifrado o ficticio para poder realizar el seguimiento, sin necesidad revelar información real del abonado. No obstante, como la prueba piloto se desarrolla con un simulador que genera teléfonos, para la tarea de seguimiento de teléfonos se utiliza el valor de IMSI generado. Junto con ese valor, se emplean otros identificadores GSM denominados LAI y CI que aportan la información de posición necesaria. 3.3 Simulador Para modelar el desplazamiento de una muestra de vehículos por un tramo de la red nacional de transporte se utiliza esta herramienta de simulación, desarrollada con el lenguaje multiplataforma JAVA. El simulador se encarga de generar vehículos junto con teléfonos a bordo asociados a sus ocupantes, atendiendo a criterios estadísticos. A su vez, para cada teléfono, modela los atributos asociados a llamadas o sms y, lo más importante, gestiona la movilidad por la red GSM. La simulación emplea una serie de entidades que interactúan entre sí a lo largo del proceso para, finalmente, conseguir los datos de localización de los teléfonos móviles transportados en vehículos que se desplacen por el escenario en un periodo de tiempo. La simulación divide el periodo de tiempo analizado en instantes de muestreo en los que efectúa la creación y análisis de entidades. Cada vehículo analizado tiene asignados un origen y destino (trayecto) y un número de teléfonos móviles a bordo. En su desplazamiento, se examina si lleva teléfono a bordo así como si pertenece al operador de interés. En caso afirmativo, se consulta la estación base que da cobertura a la posición en la que se encuentra el vehículo en dicho instante. Tomando los valores LAI y CI asociados a esa estación base, se conocerán los identificadores apropiados para el caso de que haya que proceder a la
.
“actualización de posición”. Cada vez que se produzca algún evento que lance la actualización se inserta información en una base de datos, simulando el registro de localización que realiza un operador de telefonía celular. La Tabla 1 muestra unos ejemplos de esos registros. Instante de tiempo Identificador teléfono LAI CI 2006-02-10 07:18:00 214011000113032 2140155102 48751 2006-02-10 07:47:00 214011000094499 2140156021 49833 2006-02-10 08:20:00 214011000097404 2140155901 49301 Tabla 1 – Ejemplos de “Registros de Localización” generados con el simulador 3.4 Estimador de datos de tráfico Esta etapa necesita como datos fuente los registros de localización de teléfonos efectuados en las estaciones base que cubren el escenario, en este caso generados con un simulador. 3.4.1 Modelo de estimación de datos de tráfico La herramienta para la estimación está desarrollada con el lenguaje multiplataforma JAVA. El proceso se basa en el hecho de que la red obliga al teléfono a efectuar un registro cada vez que entra en un nuevo área, permitiendo conocer siempre el LA en el que se encuentra (Figura 2).
Fig. 2 – Actualización de Posición debido al evento de entrada en un nuevo LA Con ello, surge un nuevo concepto para estimar volúmenes de paso buscando los instantes en los que se producen los registros debido a cambios de LA, monitorizando el paso entre áreas como si de aforos se tratara. Igualmente, también es posible inferir matrices O-D entendiéndolas como viajes entre LAs. En este caso, se busca el registro inicial y final que ha efectuado cada teléfono sobre el escenario piloto. De modo que, si se realizaron en áreas distintas, se detecta un viaje para ese par de áreas O-D cuyo instante de salida fue aquél en el que se efectúo el primer registro y el de llegada, aquél en el que se efectúo el último. 3.4.2 Factor de corrección Es importante resaltar que esta técnica detecta datos asociados a teléfonos móviles encendidos de un operador concreto, siendo de interés los datos referentes a vehículos. Por ello, se dispone de un factor de corrección que relaciona vehículos con esos datos asociados a teléfonos encendidos de un operador. Ese factor de corrección viene definido por: 1 Tfnos ON Op = Tfnos ON Op ⋅ Vehículos ⇒ Fcorrección = (1) vehículo Tfnos ON Op vehículo
.
Ese valor de teléfonos encendidos del operador analizado por vehículo se determina, según se aprecia en la expresión (2), a partir de parámetros estadísticos tanto de telefonía móvil (procedentes de estudios anuales publicados por la CMT) como de tráfico vehicular.
Tfnos ON Op donde
vehículo
= Cuota mercado
Op
⋅
( Tfnos
ON conductor
+ Tfnos ON
resto ocupantes
) , (2)
Tfnos ON |conductor = TasaON|conductor · Tasa_penetración|conductor , Tfnos ON |resto ocupantes = (media ocupación|veíículo -1) · Tasa_penetración|resto ocupantes.
4. RESULTADOS 4.1 Introducción El simulador compone una situación ficticia de tráfico que genera los registros de localización de teléfonos. A partir de ellos, se efectúa los cálculos para la inferencia del volumen de paso por “fronteras entre áreas LA” y la matriz O-D de “viajes entre LAs”. En este apartado se comparan esos datos estimados, tras aplicar el factor de corrección, con los de la situación real simulada. La Figura 3 muestra la ubicación sobre el escenario de esas áreas LA y fronteras.
Fig. 3 – Ubicación de Áreas de Localización y sus Fronteras sobre el escenario 4.2 Análisis de resultados Para el caso del cálculo de flujos de teléfonos por cada frontera, la evaluación se realiza detectando el instante de entrada en un nuevo área procedente de otra, pudiendo distinguir el sentido de paso. Esos valores son transformados en datos de vehículos mediante el factor de corrección. La siguiente figura muestra los reducidos niveles de error obtenidos al comparar los datos estimados de flujo (volumen) de vehículos derivados de los registros de localización con los de la situación real simulada, revelando la eficacia de predicción de la nueva técnica. 20%
Frontera 1 Frontera 2 Frontera 3 Evolución media error
15% 10% 5% 0% 3:00
6:00
8:00
9:00 10:00 12:00 15:00 18:00 21:00 23:59
Fig. 4 – Error relativo de estimación del volumen (flujo) de vehículos en cada frontera En el caso de matrices de viajes, éstas se construyen mediante un análisis de los registros que
.
00:00-23:59
00:00-18:00
00:00-15:00
00:00-12:00
00:00-9:00
(a)
Error [%]
00:00 - 23:59
25 20 15 10 5 0 00:00-6:00
Error [%]
ha efectuado cada teléfono en las áreas de localización del tramo. Llevando un control de las áreas inicial y final en las que cada teléfono se registró, se detecta el viaje entre LAs realizado por el vehículo que lo transportaba. Las siguientes figuras muestran los resultados conseguidos con esta técnica, analizando el error relativo entre los viajes estimados mediante registros de localización y los de los viajes de la situación real simulada, para cada par de áreas LA.
5 4 3 2 1 0
LA 1 LA 2 LA 3 LA 4 LA 1 LA 2 LA 3 LA 4
(b)
Fig. 5 – (a) Error relativo medio de estimación de matrices O-D según rango horario, (b) Error relativo de estimación desglosado en viajes en el intervalo definido de 1 día Tanto para matrices O-D como para flujos, se aprecia la tendencia de los errores de estimación a reducirse a medida que el intervalo de observación aumenta. Esto se debe fundamentalmente al factor de corrección que transforma datos de teléfonos a datos de vehículos. Dicho factor se calcula mediante valores medios estadísticos evaluados sobre un día. Por ello, el ajuste mejora a medida que el intervalo de observación sobre el que se estiman los datos se aproxima a ese rango. No obstante, existen otros factores que también contribuyen al error y que no dependen del intervalo de tiempo analizado. Estos tienen su origen en la propia naturaleza de las redes GSM y son inevitables. Por ejemplo, un teléfono apagado durante todo el viaje proporciona información errónea debido a que ese viaje no es detectado o, si se enciende a lo largo del viaje, se detecta un viaje que no es el real. Pese a ello, se observa que el ajuste de corrección es casi perfecto, consiguiendo niveles de error bastante reducidos. Lógicamente, esto tiene su origen en el factor empleado, el cual se obtiene con los mismos valores promedios con los que se definen las distribuciones estadísticas que modelan los vehículos y teléfonos del simulador. Obviamente, el cálculo del factor de corrección no será tan trivial cuando se manejen datos reales, dando lugar a un estudio más complejo. Sin embargo, el objetivo es dar a conocer las posibilidades que ofrece la telefonía en el cálculo de datos de tráfico “cuasi” en tiempo real, quedando demostrado que la técnica constituye un método viable para la obtención esos datos. 5. CONCLUSIONES El uso de teléfonos en vehículos como equipos de medida que, sin revelar datos confidenciales ni afectar a su funcionamiento, permita inferir datos de tráfico presenta múltiples ventajas respecto a los métodos tradicionales. Principalmente, el tratamiento de esos datos supone manejar una muestra muy extensa de la población. Junto a ello, destaca su bajo coste de implantación debido a que sirven los terminales que utilizan hoy en día la mayoría de usuarios
.
con el simple hecho de que estén encendidos. Incluso, en contraste con las redes de sensores fijos, los teléfonos móviles proporcionan información respecto a comportamiento del tráfico sobre zonas donde exista cobertura GSM, sin necesidad de un despliegue adicional de infraestructura. Por todo ello, así como por tratarse de un proceso automático y rápido, esta técnica basada en datos anónimos de telefonía celular supone una auténtica revolución en los estudios de movilidad, pudiendo dar respuesta inmediata a los problemas derivados de ella. AGRADECIMIENTOS Esta investigación ha sido financiada por el Ministerio de Fomento a través de las Ayudas a la Realización de Proyectos I+D en el Área de Transportes FOM/486/2003. REFERENCIAS CÁCERES, N. et al. (2005). Herramienta para la Inferencia y Actualización de Matrices O-D de Movilidad a través de datos de Telefonía Celular. Ingeniería e Infraestructura de los Transportes. Escuela Superior de Ingenieros, Sevilla. ISBN: 84-88783-77-9. LINAUER, M. y LEIHS, D. (2003). Generating floating car data using GSM-Network. Proceedings of the 10th World Congress and Exhibition on Intelligent Transport Systems and Services (ITSS03), 16-20 November 2003. Madrid. M. FOM., Ministerio de Fomento, Mapa de Tráfico 2002. RATTI, C. et al. (2005). Mobile Landscapes: using location data from cell-phones for urban analysis. Environment and Planning B – Planning and Design (submitted). SMITH, B.L. y LOVELL, D.J. (2001). Transportation management applications of anonymous mobile call sampling. Proceedings of the 11th Annual Meeting and Exposition of ITS America, June 2001. Miami. SOHN, K. Dynamic Estimation of Origin-Destination flows Using Cell Phones as Probes. SDI 2004-R-04. Department of Urban Transportation. Seoul Development Institute. Korea. 2004. VIRTANEN, J. Mobile phones as probes in travel time monitoring. FINNRA, Helsinki, 2002. WHITE, J. y WELLS, I. (2002). Extracting Origin Destination Information from Mobile Phone Data. 11th Int. Conf. on Road Transport Information and Control, 19-21March 2002. London. YGNACE, J-L. et al. Travel Time/Speed estimates on the French Rhone Corridor Network Using Cellular Phones as Probes. Final Report SERTI V Program. INRETS-LESCOT 0201. Lyon, France. December, 2001.