300 likes | 489 Vues
Comunicaciones Selectivas en Redes de Sensores. Jesús Cid Sueiro. Diciembre 2011. Contexto. Actividad previa en redes de sensores, Dos proyectos financiados de ámbito nacional, y varios regionales:
E N D
ComunicacionesSelectivas en Redes de Sensores Jesús Cid Sueiro Diciembre 2011
Contexto • Actividad previa en redes de sensores, • Dos proyectos financiados de ámbito nacional, y varios regionales: • Modelos de Aprendizaje e Inferencia Distribuida para Redes Ad-Hoc (Subproyecto 2) (TEC2005-06766-C03-02/TCM) 2005-2008. • IP: Jesús Cid Sueiro. • Nuevos Algoritmos de Procesado y Transmisión Selectivas en Redes de Sensores: Aplicación a Clasificación y Seguimiento de Blancos. (TEC2008-01348/TEC). 2009-2011. • IP: Francisco J. González Serrano • Investigadores participantes: • UC3M: 2 profesores doctores + 2 estudiantes de doctorado • URJC: (3 D) • UniLeon (1 D) • EPFL, Switzerland (1D), • Aahrus Univ., Denmark (1),
Red de Sensores • WSN (Romer, 2004) • Red • No fragmentada • Multisalto • Ad-hoc • De gran escala • De Sensores • Homogéneos • Inmóviles (tras el despliegue) • Pequeños • De recursos limitados • De baja complejidad • Desplegados aleatoriamente
ER+ET Batería xk ER Importancia acumulada Antecedentes • Escenario: • Nodos con baterías finitas y no recargables. • Mensajes graduados con un valor de importancia • Significancia (Wood, 2002), prioridad (Muraleedharam, 2006), relevancia (Wischoof, 2003), utilidad (Athanassoulis, 2007), QoI… • Análisis de decisiones transmitir / no transmitir A B xk xk xk dk=1 dk=0 ¿Cuál es la mejor decisión?
Modelo de Teoría de la Decisión (Arroyo-Valles,2006): • Dos alternativas: “Tx” o “no Tx” • Dos hipótesis: el nodo vecino reenviará o no reenviará el mensaje. • Costes: • de no transmir c0 = ER • de transmitir un mensaje no reenviado: c10 = ER+ET • de transmitir un mensaje reenviado: c11=ER+ET – a x La estrategia de mínimo coste medio es:
Otros problemas relacionados… • The secretary problem (Flood, 1949) (Gardner, 1960) • The “house selling” problem • “Stopping rules” en análisis secuencial • Knapsack problems y, en general, problemas de programación dinámica y asignación de recursos • Procesos de Decisión de Markov (MPD, Markov Decision Processes) • Ahorro de energía por agregación de datos vs retardo de transmisión (transmitir o retardar) (Ye, 2009) • Compromiso entre el ahorro de los estados de baja energía y la eficiencia del sensor (Kianpisheh, 2009) • Optiización de una función que combina consumo de energía, caudal y retardo (Munirand, 2009).
Un modelo del problema basado en MDP • Vector de estado: (ek, xk) (Energía, importancia) en el “instante” k. • Acciones: Tx (dk=1), No Tx (dk=0) (y el mensaje se descarta) • Dinámica de estados: • Costes (modelo simplificado): • ET, de transmitir • ER, de recibir (igual al de captura de datos del sensor) • EI, del estado de reposo (idle) • PI, probabilidad de reposo. • La energía se reduce en • ET+ER, si dk=1, • ER, si dk=0,
Un modelo del problema basado en MDP • Índice de éxito: qk, binario {0,1} • Tres casos: • Éxito global: qk=1 el mensaje enviado llega a destino. • Éxito local: qk=1 el mensaje enviado es reenviado • Éxito orden 0: qk=1 el mensaje es enviado. • Recompensas: • Si Tx: rk = xkqk • Si No Tx: rk = 0 • Objetivo: • Maximizar la importancia total esperada
Resolución. • Teorema 1: La estrategia óptima es siendo Qk(e,xk) la probabilidad de éxito al enviar xk y • Problemas: recursión hacia delante, ecuaciones multifuncionales irresolubles, determinación de Qk…
Modelo estacionario: • Estacionariedad: • Estadísticos de consumos e importancias independientes de k. • Probabilidad de reenvío independiente de k. • Teorema 2: La estrategia óptima es siendo • Problemas: recursión hacia adelante, ecuación funcional irresoluble, determinación de Q.
Evolución del umbral • Para ilustrar la función de umbral, consideremos el siguiente modelo simplificando: • Éxito de orden 0 ( qk=1 Q=1). • Distribución de importancias conocida. • Umbral óptimo, en función de la energía, cuando sólo queda energía para una transmisión. • (ET=1, Distrib U(0,2))
Evolución del umbral. • Umbral óptimo, en función de la energía, para diferentes distribuciones de importancia. Uniforme Exponencial Pareto
Umbrales asintóticos • El cálculo del umbral óptimo es computacionalmente prohibitivo. • Sin embargo, para e grande, el umbral es asintóticamente constante. • Teorema 3: El umbral asintótico es solución (única) de la ecuación [¡y puede estimarse recursivamente!] • El umbral asintótico permite prescindir de e, y suprime una componente de no estacionaridad en los nodos …
Diseño experimental • Nodos homogéneos, • Idéntica carga inicial, radio de cobertura, patrón de consumo. • ET=4, ER=1, EI=0 • Nodo de destino con energía ilimitada. • Los nodos funcionan hasta que se agotan sus baterías. • La red muere cuando muere su último nodo. • Generación secuenciada y aleatoria de mensajes. • Enrutamiento por reenvío voraz (greedy forwarding) (Karp, 2000). • Redes de sensores: • NS: No selectivos • AT: Adaptive Transmitter (Sensores Selectivos de orden 0) • LF: Local Forwarder (Índice de éxito local) • GF: Global Forwarder (Índice de éxito global).
Nodos con información completa • Información completa: los nodos conocen (a coste cero) el umbral usado por sus vecinos. • Caso 1: Red en cadena de 30 nodos igualmente espaciados: • Nodos 1-28: U(0,1). Nodo 29: U(0,2) • LF, que sólo precisa información local, tiene prestaciones casi idénticas a los nodos GF.
Nodos AT • Caso 2: Red de doble rama. • Tráfico en cada rama: • Rama superior U(0,1) • Rama inferior U(1,2) • Nodo 21 mezcla. • La propagación hacia atrás de los umbrales inhibe el envío de mensajes irrelevantes. Nodos LF
Caso 3: Agotamiento de baterías • Escenario: • m1=1.6, m2=2.6, m3=0.95 • Nodo 2, batería baja. • Cuando muere el nodo 2, el nodo 1 reajusta el umbral.
Nodos con información incompleta • Información incompleta: los nodos desconocen los umbrales de los vecinos: • Aprendizaje: • LF-EST: Los nodos estiman la probabilidad de reenvío mediante un modelo de regresión logística. • Realimentación: • LF-VAR: Los nodos comunican el umbral a sus vecinos cada vez que varía significativamente. • LF-BEAC: Los nodos comunican el umbral periódicamente mediante balizas (beacons)
Nodos con información incompleta • Caso 4: Red de 140 nodos distribuido sobre un área rectangular. • La fase de estimación o realimentación tiene un efecto moderado en las prestaciones.
Conclusiones • El reenvío selectivo mejora las prestaciones de los transmisores selectivos que no tienen en cuenta el comportamiento de los vecinos. • El uso de información local (sensores LF) es equiparable al uso de información global (senores GF) (o mejor, si se tienen en cuenta los costes).
Hipótesis en este y otros modelos • Cada sensor … • (H1) puede cuantificar la importancia, x, de cada mensaje • +(H1b) La suma de importancias es una buena medida de las prestaciones de un sensor. • (H2) puede medir el nivel de su batería. • +(H2b) Las baterías no son recargables • (H3) conoce el consumo energético de sus estados: detectar (ES), recibir, (ER), transmitir (ET), reposo (EI). • +(H3b) Los estados son observables • +(H3c) Estos consumos son constantes e independientes de x • (H4) puede verificar el reenvío de sus mensajes • (H5) sólo tiene dos opciones: Tx o no Tx • (H6) estacionaridad, ergodicidad e independencia
Líneas de investigación • 1. Implementación de algoritmos sobre sensores reales • 2. Diseño de nuevos algoritmos de comunicaciones selectivas • 2.1. Algoritmos para observaciones dependientes • 2.2. Algoritmos para sensores no binarios • 2.3. Algoritmos para sensores recargables • 2.4. Algoritmos para sensores cooperativos • 2.5. Algoritmos para entornos no estacionarios • 2.6. Análisis teórico de sensores basados en MDP • 2.7. Otros dilemas entre información y consumo • 3. Aplicaciones: • 3.1. Seguimiento de blancos • 3.2. Clasificación y detección distribuida. • 3.3. Estimación Distribuida
1. Implementación. • Trabajo preliminar (enviado a RealWSN’2010). • Red de nodos TmoteSky conectados a un PC • Consumos de energía estimados a partir del tiempo que el nodo permanece en cada estado. • Dificultades: • Identificar estados • Imputar costes • Dependencia de parámetros MAC, red, tráfico …
2.3. Algoritmos para sensores recargables • Nuestro modelo en (Arroyo-Valles, 2009) no es aplicable a nodos recargables. • Soluciones: • Cambiar el criterio de diseño y discretizar el espacio de estados (Lei, 2009). Difícilmente adaptativo. • Otras opciones: • Ponderación exponencial a las importancias • Modelos de aprendizaje por refuerzo.
2.3. Algoritmos para sensores cooperativos • El análisis conjunto de los MDP de todos los nodos se complica • (Lei, 2009) (Arroyo-Valles, 2009) basan el diseño en un nodo aislado. • Sin embargo, la optimización global puede mejorar significativamente las prestaciones: • Al evaluar costes, los nodos tendrán en cuenta sus costes de Tx y todos los de Rx-Tx subsiguientes. • Potencialmente, las redes grandes con nodos cooperativos pueden ser mucho más eficientes incluso cuando los costes de Tx son bajos.
3.1 Seguimiento de blancos • Escenario: • 8 × 8 sensores distribuidos uniformemente sobre un área cuadrada 250 × 250 m2. • Blanco aislado móvil (Gustafsson, 2002) • Sensores acústicos
Seguimiento de blancos • Seguimiento: • Filtro de partículas (Liu, 2003) • Esquema IDSQ (Information-Driven Sensor Querying) (Chu, 2002) • Las medidas se envían a un nodo líder (en un rango R o 2R) • El lider encamina las medidas al destino. • Estrategias selectiva: • Importancia igual a la amplitud de la medida del sensor.
Seguimiento de blancos • Caso 1: Agregación de datos.
Seguimiento de blancos • Caso 2: Fusión de datos.
3.2. Detección y clasificación distribuida. • Objetivos: • Corto plazo: • En modelos de redes de censores con cotas sobre el consumo energético (Appadwedula, 2005) (Lázaro, 2008), integrar MDPs que determinen automáticamente las cotas. • Largo plazo: • Aprendizaje sensible a costes (Cost Sensitive Learning) sobre redes de sensores: • Problema: combinar costes energéticos y costes asociados a los errores (posiblemente dependientes de la observación) en un escenario de aprendizaje distribuido.