Vehicle classification in distributed sensor networks
Hola compañeros y gente que regularmente visita mi blog, esta entrada corresponde a la tarea número 8 de la materia de "Redes de telecomunicaciones". La actividad consiste en elaborar un resumen y dar mis conclusiones de una publicación referente a las "redes sensoras", la publicación que yo elegí se titula: Vehicle classification in distributed sensor networks, los autores de la publicación son Marco F. Duarte y Yu Hen Hu (2003).
Introducción
La aparición de dispositivos pequeños y de bajo consumo que integran micro-sensores y actuación con capacidades de comunicación de procesamiento a bordo y wireless, estimula un gran interés en las redes de sensores inalámbricos distribuidos (WDSN). Un WDSN es frecuentemente usado para realizar tareas tales como la detección, clasificación, la localización y el seguimiento de uno o más objetivos dentro del campo del sensor. Los sensores son típicamente baterías y un ancho de banda de comunicación inalámbrica limitada. Por lo tanto, se necesitan algoritmos de procesamiento de señales de colaboración eficientes que consumen menos energía para el cálculo y la comunicación para estas aplicaciones.La clasificación por tipo de vehículo es una tarea importante de procesamiento de señal que ha encontrado aplicaciones militares y civiles en general, como los sistemas de transporte inteligentes. Típicamente, los sensores acústicos o sísmicos se utilizan para tal fin. Sin embargo, los resultados anteriores se han centrado en la clasificación en base a señales obtenidas en un único o pocos sensores y procesados de una manera centralizada. Por lo tanto estos resultados existentes son sólo parcialmente útiles para una aplicación WDSN.
En este trabajo, consideramos la aplicación de dicha tarea en un entorno WDSN. Cada sensor en el WDSN estará equipado con un micrófono o un geófono. Tras la detección de la presencia de un vehículo en las cercanías del sensor, el procesador a bordo va a extraer vectores de características sobre la base de la acústica o señal sísmica detectada por los sensores. En una red de sensores inalámbricos, el ancho de banda de la comunicación es muy limitada. Por lo tanto, en lugar de enviar el vector de características, un clasificador de patrones local en cada nodo sensor primero realizará decisiones locales sobre qué tipo de vehículo se basa en su propio vector de características.
La probabilidad de clasificación correcta también puede ser estimada. La toma de decisiones locales, junto con la probabilidad estimada de ser una decisión correcta, se puede codificar y se transmite de manera eficiente a través del canal inalámbrico a un centro local de fusión, listo para la decisión de fusión. Por lo tanto, desde un punto de vista de procesamiento de señales, el problema de clasificación de vehículos WDSN consta de dos partes: la clasificación local y fusión de decisiones globales.
El propósito de este trabajo es describir el desarrollo de la clasificación de datos de vehículos en una red de sensores inalámbricos distribuidos y el rendimiento de referencia cuando se aplica un conjunto de métodos existentes de clasificación de patrones.
Características de una red de sensores inalámbricos distribuidos
En una red de sensores inalámbricos distribuidos, los nodos individuales se despliegan al azar sobre un campo determinado sensor. Cada nodo sensor estará equipado con un procesador a bordo, un transceptor de comunicación inalámbrica, varios tipos de sensores, dispositivos de toma de muestras digitales, y la batería. A menudo, los nodos de sensores dentro de una región geográfica se agruparán para formar un grupo local de modo que una cierta jerarquía de mando y control sobre todo el campo de sensor puede ser establecida. Cada clúster local elegirá a uno o más nodos de sensores como la cabeza, donde se realizará la fusión de decisión espacial de los sensores dentro de un grupo.
Una vez que se realiza una detección positiva, el algoritmo de clasificación de patrones se pondrá en marcha para clasificar la firma acústica de entrada en una de las clases predefinidas. Hasta ahora, todas estas tareas se llevan a cabo en el microprocesador a bordo de cada nodo individual del sensor. Por lo tanto, la cuestión clave en este caso es reducir la complejidad de cálculo y los requisitos de almacenamiento a bordo y por lo tanto conservar la reserva de energía. Esta restricción de la energía implica que no todos los algoritmos de clasificación serán adecuados para la aplicación en un nodo sensor WDSN. Por lo tanto, se debe buscar una compensación del rendimiento y la energía. Las decisiones locales pueden ser codificadas de manera eficiente y transmitidas desde el nodo sensor individual al cluster local principal para la fusión de decisión. Dado que no todos los nodos de sensores dentro de un WDSN detectarán la presencia de un vehículo en movimiento dentro del campo del sensor, no todos los nodos del sensor producirán un resultado de clasificación local. Por otra parte, debido a un error de comunicación inalámbrica y la posible congestión de la red, no todas las decisiones locales se pueden reportar de nuevo a la cluster local principal en el momento de la fusión decisión. Como tal, la decisión de fusión debe realizarse con conocimiento imperfecto de las decisiones locales.
Los nodos distribuidos en una región geográfica generalmente están particionados de acuerdo a las células de espacio de tiempo como se ilustra en la siguiente imagen:
Cada célula tiene un nodo gestor que es responsable de la coordinación del enrutamiento y algoritmos de CSP dentro de esa célula.
Los datos en tiempo real del muestreo se obtuvieron a partir de los sensores en diferentes modalidades de percepción de las distintas situaciones que involucran vehículos de objetivo móvil. Las modalidades de detección podría ser acústica, sísmica, infrarrojo pasivo, por nombrar algunas.
Han sido propuestos una amplia variedad de algoritmos para los fines de clasificación, que tienen cada uno sus propias ventajas y desventajas. El objetivo principal en el caso de redes de sensores distribuidos es el desarrollo de algoritmos de baja complejidad que clasifican estas características extraídas con el fin de hacer un uso eficiente del limitado poder y la capacidad de ancho de banda de los nodos. Diferentes algoritmos podrían ser utilizados en conjunción para proporcionar heterogeneidad algorítmica.
Descripción del experimento
El conjunto de datos que se están discutiendo en este documento se obtuvo en el tercer experimento situacional SensIT (SITEX02), organizado por el programa DARPA / IXOS SensIT (Tecnología de Información de Sensores). En este experimento, 75 nodos WINS NG 2,0 fueron desplegados en el Cuerpo Aéreo de Marina del Centro de Combate Terrestre en Twenty-nine Palms, CA, Estados Unidos. Durante un período de dos semanas, se han llevado a cabo varios experimentos. Un mapa de todo el campo se representa en la siguiente imagen:
(Sistema del sensor de campo)
Que consiste en una carrera de este a oeste y una carretera norte-sur y una zona de intersección. Los datos recogidos para este conjunto de datos se registraron en una subregión rectangular. Estos datos describen las carreras, que tipo de vehículo se mueve de dónde a dónde, etc, las carreras de pruebas se llevaron a cabo por la conducción de diferentes tipos de vehículos en todo el campo de pruebas, donde se despliegan los nodos después de la disposición mostrada en la imagen anterior. El sensor de campo es un área de aproximadamente 900 x 300 m2 en MCAGCC. Los sensores, indicados por puntos de diferentes colores en la imagen anterior, se colocan a lo largo del lado de la carretera. Los rangos de separación de sensores adyacentes son de 20m a 40m
Los nodos WINS NG 2,0 (que se muestra en la primera imagen), proporcionan un sistema en el que los usuarios SensIT pueden construir y probar sus algoritmos de sensores distribuidos. Cada nodo sensor está equipado con tres tipos de modalidades de percepción: acústico (micrófono), sísmicos (geófonos) e infrarrojos (sensor IR polarizado).
Extracción de eventos
Los nodos utilizados en el experimento registran los datos para diferentes sensores, o modalidades, los datos se registran para la modalidades acústicas, sísmicas e infrarrojas a una velocidad de 4960 Hz. Para los diferentes tipos de vehículos, el vehículo era conducido por las tres carreteras que se muestran en imagen anterior; cada carretera recibió un número de ejecución diferente. El camino de Oeste a Norte fue el número 1, el camino de Norte a Este fue el número 2, y el camino de Este a Oeste fue el número 3. Las carreras posteriores fueron nombrados incrementalmente.
Después se registró la serie, que era necesaria para extraer el acontecimiento real de la serie de ejecución. Aunque la carrera puede ser de varios minutos de duración, la serie de eventos será mucho más corta, ya que sólo se extiende por el corto período de tiempo cuando el objetivo está cerca del nodo. Durante las tareas de procesamiento de señal de colaboración, el algoritmo de detección determina si el vehículo está presente o no en la región con el fin de realizar la clasificación en la serie de tiempo. El algoritmo de detección CFAR da salida a una decisión cada 0.75 segundos; basado en el nivel de energía de la señal acústica, como se muestra en la siguiente imagen:
(Algoritmo de tasa de falsas alarmas: los tiempos marcados con altos valores de energía fueron marcados como detecciones)
Para la extracción de conjunto de datos, se utilizó un clasificador k-Nearest Neighbor para etiquetar cada 0.75 segundos los segmentos de datos de cada nodo separado como una detección o no detección.
Dos características se utilizan para esta clasificación: la distancia entre el vehículo y el nodo y la energía de la señal acústica para el tiempo dado. Las pistas AAV3 y DW3 se utilizaron para el entrenamiento, y los eventos en estas pistas fueron identificados de forma manual, es decir, esuchando directamente las series de tiempo. De este clasificador se obtiene el etiquetado de eventos para cada uno de los nodos para cada ejecución. Utilizamos la agrupación para reducir el número de eventos por corrida si es posible (ver la siguiente imagen):
(Detección de etiquetado para corridas de entrenamiento. Los 2 ejes representan las 2 dimensiones de la característica; las marcas oscuras representan las detecciones y las marcas claras representan las no detecciones)
El resultado de este procedimiento es la extracción de las series de tiempo de los largos de la varible que contendrá la información acústica sísmica y PIR del tiempo que rodea el punto de enfoque del vehículo más cercano al nodo (ver la siguiente imagen):
(Etiqueta de detección de muestras y resultado de la detección de CFAR, la línea azul representa la energía, la línea negra representa la etiqueta de detección derivado del clasificador kNN, y la línea roja representa el resultado de la detección de CFAR)
Extracción de características
Las series de tiempo de evento se utilizan para extraer características multidimensionales para su clasificación. La modalidad de infrarrojos no se utiliza en esta etapa, ya que la longitud de la señal observada es muy corta y no uniforme a través de eventos. Para este conjunto de datos, el featuresare extraída basado en el espectro de frecuencia de la acústica y
señales sísmicas del evento. La transformada rápida de Fourier (FFT) de estas señales se calcula para cada 512 puntos de muestra (cada 10.32 ms para la frecuencia de muestreo actual), que produce 512 puntos de la transformada rápida de Fourier con la resolución de 9.6875 Hz.
Para la modalidad acústica se optó por los primero 100 puntos, que contiene información de frecuencia de hasta 968.75 Hz.
Clasificación local
En esta sección, se ofrecerá algún tipo de evaluación de referencia del conjunto de datos usando tres algoritmos de clasificación comunes. Vale la pena señalar que, en situaciones de la vida real, el mayor factor de error de inducción para el caso de detección de la vigilancia de vehículos es la presencia de factores de ruido de alta energía, como la eólica y las transmisiones de radio. Con el fin de evitar la clasificación errónea de estas falsas detecciones en una clase de vehículo válido, se ha implementado una clase de ruido con las características extraídas de las series de tiempo que muestran la ocurrencia de uno de estos eventos de ruido de alta energía. Por lo tanto, para los experimentos, hemos creado un escenario de clasificación de tres categorías, lo probamos con el algoritmo k-Nearest neighbor, Maximum likelihood y el algoritmo Support Vector Machine.
Región de fusión
Además de la localización y el seguimiento del objetivo, también es necesario clasificar el tipo de vehículo dentro de los resultados reportados de la clasificación de objetivo de destino de los nodos sensores. Tenga en cuenta que en la arquitectura del sistema actual, la localización objetivo puede ser realizada antes de la clasificación en toda la región de destino.
Por lo tanto, si la posición de destino es relativamente exacta, es posible utilizar la localización estimada del objetivo y el sensor de coordenadas conocidas, para calcular la distancia al sensor objetivo. Entonces, se puede estimar la probabilidad derivada empíricamente de clasificación correcta en un nodo sensor en particular sobre la base de la información de la distancia.
(Clasificación promedio y resultados de la tasa de aceptación de diferentes
métodos de fusión de la región de clasificación)
métodos de fusión de la región de clasificación)
Bibliografía
- Vehicle classification in distributed sensor networks. Marco F. Duarte, Yu Hen Hu. (2003). [Documento en línea. <http://www-ece.rice.edu/~duarte/images/JPDC.pdf>. [Consulta: 24-05-13]
Cualquie duda o aclaración pueden dejarla en la caja de comentarios.
Saludos a todos!