1 / 64

Estudio de Descriptores de Fourier Bidimensionales en figuras binarias

Estudio de Descriptores de Fourier Bidimensionales en figuras binarias. Elaborado por: Jiménez Méndez, Alberto Luna Román, Alejandro Nieto Carretero, Elvira. Escuela Técnica Superior de Ingeniería en Informática. Estudio de Descriptores de Fourier en rectas y componentes conexas.

emmet
Télécharger la présentation

Estudio de Descriptores de Fourier Bidimensionales en figuras binarias

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estudio de Descriptoresde Fourier Bidimensionales en figuras binarias Elaborado por: Jiménez Méndez, Alberto Luna Román, Alejandro Nieto Carretero, Elvira Escuela Técnica Superior de Ingeniería en Informática

  2. Estudio de Descriptores de Fourier en rectas y componentes conexas 1. Introducción 2. Transformada de Fourier 3. Transformada de Fourier Bidimensional: Propiedades 4. Descriptores de Fourier 5. Compresión aplicando TF Bidimensional 6. Conclusiones obtenidas en el estudio 7. Aplicaciones 8. Ampliación del estudio: Reconocimiento de objetos 3D 9. Bibliografía

  3. 1. Introducción Nuestro estudio sobre los Descriptores de Fourier Bidimensionales se ha basado en un análisis empírico de imágenes binarias simples en su geometría: rectas, componentes conexas, círculos, etc. Estudiamos imágenes de tamaño 8x8 puntos principalmente, aunque por razones de simplicidad o visualización también veremos imágenes de 4x4 ó 64x64 puntos.

  4. 1. Introducción Al tratarse de un estudio experimental sin bases previas sobre las que trabajar, no sabemos a priori los resultados que podremos obtener o siquiera si obtendremos algún resultado.

  5. 1. Introducción La teoría de las transformada de Fourier ha jugado, y juega, un papel fundamental en el procesamiento de imágenes por su descripción alternativa de una imagen. Es muy importante tener en cuenta la enorme aplicación de las transformaciones de imágenes en campos como la restauración, codificación, mejora, segmentación, etc. La correspondencia entre imagen original y su transformada es biunívoca. La transformada de Fourier es generalmente un array (imagen) de números complejos. Para obtener una información visual es necesario representar la magnitud y la fase de cada uno de los puntos.

  6. 2. Transformada de FourierTransformada de Fourier Unidimensional Sea f (x) una función continua de variable real. La transformada de Fourier de f (x), que notaremos F(u) se define mediante La Transformada de Fourier Unidimensional se aplica sobre el contorno de una imagen punto por punto.

  7. 2. Transformada de FourierTransformada de Fourier Unidimensional Dado F(u), f (x) puede obtenerse por la transformada de Fourier inversa

  8. 1. 2. f (x) debe tener sólo un número finito de discontinuidades y un número finito de máximos y mínimos en cualquier rectángulo finito, 3. f (x) no puede tener discontinuidades infinitas. 2. Transformada de FourierTransformada de Fourier Unidimensional Las condiciones suficientes que debe cumplir f para que exista la Transformada de Fourier son:

  9. 2. Transformada de FourierTransformada de Fourier Bidimensional La transformada de Fourier para una señal bidimensional NxM se define La transformada de Fourier Bidimensional se aplica a todos y cada uno de los puntos de la señal.

  10. 2. Transformada de FourierTransformada de Fourier Bidimensional Al igual que la unidimensional, la transformada de Fourier Bidimensional es biunívoca. De esta forma, se puede obtener la señal original aplicando a la transformada inversa:

  11. 2. Transformada de FourierInterpretación de la TF Bidimensional • Cada punto (k,l) de la transformada representa la componente espectral de frecuencia horizontal k y vertical l que posee la imagen original. • Para una imagen NxN las frecuencias horizontal y vertical máximas representables son kMAX=lMAX=N/2.

  12. 2. Transformada de FourierInterpretación de la TF Bidimensional • Las flechas de la figura muestran el sentido en que aumentan las frecuencias en la imagen transformada

  13. 2. Transformada de FourierInterpretación de la TF Bidimensional • Si además se tiene en cuenta que la transformada es periódica en todas direcciones y para imágenes reales además es simétrica respecto al centro, es visualmente más conveniente desplazar el cuadro NxN de la imagen transformada y emplear como centro el punto (0,0). • En la siguiente figura se aprecia con facilidad este hecho:

  14. 3. Transformada de Fourier BidimensionalPropiedades: Separabilidad Una transformación bidimensional se dice separable si el resultado de la misma puede obtenerse por la aplicación consecutiva de dos transformadas unidimensionales. Esta característica permite emplear los mismos algoritmos de cálculo de la transformada de Fourier unidimensional. Existe un algoritmo óptimo para el cálculo de la transformada: FFT (Fast Fourier Transform)

  15. 3. Transformada de Fourier BidimensionalPropiedades: Linealidad La Transformada de Fourier Bidimensional de una señal escalada es la misma que la escalada de la transformada. La Transformada de Fourier Bidimensional de la suma de dos señales es la misma que la suma de las transformadas de cada señal.

  16. N-1 0 Altas frecuencias Bajas frecuencias 3. Transformada de Fourier BidimensionalPropiedades: Simetría Si la imagen es real (de valores reales, no complejos), entonces se verifica: • Sólo es necesario calcular la mitad de los puntos en la aplicación de la primera transformada unidimensional. • Sólo hay que efectuar la mitad de las transformadas ya que es simétrica respecto al punto central (N/2,M/2) ó (0,0), según se escoja el origen. Simetría respecto al centro

  17. Utilizando las TF, pueden calcularse operaciones de convolución de máscaras. • La transformada caracteriza a la propia máscara. Esto permite analizar sus propiedades espectrales y diseñar una máscara propia: • Definiendo su transformada M(k,l) • Calculando su inversa M(n,m)=TF-1[M(k,l)] 3. Transformada de Fourier BidimensionalPropiedades: Convolución circular Convolución entre señales con simetría FFT

  18. 4. Descriptores de Fourier Los Descriptores de Fourier representan la forma del objeto destacando que los primeros descriptores indican la forma general del objeto y los últimos descriptores los más pequeños detalles, con lo que para una clasificación un pequeño conjunto de descriptores puede ser suficiente. La gran ventaja de los DF es que son invariantes frente a la traslación, la rotación y la escalabilidad. Estos son las principales características en las que basarse para buscar una utilidad a los DF, y su principal uso es para, de una forma u otra, reconocer objetos.

  19. 4. Descriptores de Fourier Al realizar la transformada de cada punto, obtenemos un descriptor en forma de número complejo. Para obtener una información visual o en forma numérica es necesario representar la magnitud o amplitud y la fase de cada uno de los puntos de la imagen transformada.

  20. Imagen original Espectro de Amplitud Espectro de Fase 4. Descriptores de Fourier Obtendremos así dos matrices, representando el espectro de amplitud y el espectro de fase:

  21. 4. Descriptores de Fourier Los valores que representan los espectros poseen un rango dinámico mucho mayor que el ofrecido por 256 niveles de gris. Mediante un reajuste logarítmico de los valores, estos son ajustados a 256 niveles. La ecuación que se le aplica es la siguiente:

  22. 5. Compresión aplicando TF Bidimensional Ejemplo para TF Unidimensional: La TF Unidimensional se aplica sobre una función continua que describe el contorno de una imagen. Conforme mas descriptores tengamos, mas aproximada será la imagen que recuperemos a la original. La compresión busca el máximo número de descriptores que podemos eliminar de forma que se recupere la imagen original sin problemas.

  23. 5. Compresión aplicando TF Bidimensional Ejemplo para TF Unidimensional: Dependiendo del número de Descriptores que eliminemos, la recuperación posterior de la imagen original será más exacta cuanto menos número de ellos eliminemos.

  24. 5. Compresión aplicando TF Bidimensional Pasos de la compresión bidimensional: • Obtenemos la imagen transformada de la original. • Eliminamos un número determinado de descriptores. • Obtenemos la inversa de la transformada a la que hemos eliminado descriptores. • Binarizamos la imagen resultante para recuperar la original.

  25. 5. Compresión aplicando TF Bidimensional Paso 1: Aplicamos la FFT Bidimensional Imagen Original Imagen transformada

  26. 5. Compresión aplicando TF Bidimensional Paso 2: Eliminación de descriptores Nuestro objetivo es estudiar que número máximo de Descriptores de Fourier podemos eliminar de forma que podamos luego volver a recuperar la imagen original sin pérdida de información. Eliminamos de tres formas posibles: • Por filas • Por columnas • En zigzag

  27. 5. Compresión aplicando TF Bidimensional • Dependiendo del orden en que eliminemos los descriptores y el tipo de imagen, obtendremos diferentes resultados. A continuación aplicamos cada uno de estos algoritmos a una misma imagen para ver los diferentes efectos.

  28. 5. Compresión aplicando TF BidimensionalEliminación de Descriptores por Filas

  29. Imagen inversa 5. Compresión aplicando TF BidimensionalEliminación de Descriptores por filas • Eliminación por filas Transformada Eliminación Inversa Imagen Original 41 % descriptores eliminados

  30. 5. Compresión aplicando TF BidimensionalEliminación Descriptores por Columnas

  31. Imagen inversa 5. Compresión aplicando TF BidimensionalEliminación de Descriptores por columnas • Eliminación por columnas Transformada Eliminación Inversa Imagen Original 41 % descriptores eliminados

  32. 5. Compresión aplicando TF BidimensionalEliminación Descriptores en Zig Zag

  33. Imagen inversa 5. Compresión aplicando TF BidimensionalEliminación de Descriptores en Zig-Zag • Eliminación en zig-zag Transformada Eliminación Inversa Imagen Original 41 % descriptores eliminados

  34. 5. Compresión aplicando TF BidimensionalBinarización Paso 3: Binarizamos la imagen inversa para recuperar la imagen binaria original. Al aplicar la inversa de la Transformada de Fourier Bidimensional, se obtienen valores de intensidad . Por tanto, adaptamos antes el rango entre [0, 255] para pasar la matriz a escala de grises. La finalidad principal es reducir el volumen de información inicial.

  35. 5. Compresión aplicando TF BidimensionalBinarización La binarización transformará la imagen con múltiples niveles de gris a sólo dos (blanco y negro). La imagen resultante varía con la elección del Umbral de Binarización. Su correcta elección es, por tanto, fundamental para la aplicación de posteriores algoritmos, aunque no será fácil.

  36. 5. Compresión aplicando TF BidimensionalBinarización Una herramienta de gran ayuda para la elección del Valor Umbral es el llamado Histograma de la imagen. Éste es una representación gráfica que muestra el número de puntos que poseen cada uno de los niveles de gris de una imagen.

  37. 5. Compresión aplicando TF BidimensionalBinarización Según la definición vista de Histograma de una imagen, cuanto mayor sea su anchura, mayor será su nivel de detalle, es decir, el número de puntos significativos será homogéneo en todo el rango de grises y, por tanto, tendremos una imagen de mayor contraste.

  38. 5. Compresión aplicando TF BidimensionalBinarización • El Valor Umbral de binarización dependerá del tipo de imagen. Concretamente se ajustará en función de la imagen obtenida tras eliminar los descriptores e invertir de la transformada. Nota: Se podría obtener de forma automática el mejor umbral de binarización para cada imagen. • Por defecto se elegirá como Valor Umbral la mitad de la escala de grises: 128.

  39. 1ª fila N especiales 4 4 1ª columna 8x8 8x8 6. Conclusiones obtenidas en el estudio • Todas están basadas en imágenes binarias de 8x8 puntos. • El elemento (1,1) contiene el número de “1’s” (puntos negros) de la imagen. • Los elementos de la diagonal principal son “especiales” (son necesarios) hasta el cruce con la diagonal secundaria.

  40. conjugados conjugados 6. Conclusiones obtenidas en el estudio 1. Aspectos de simetría en los descriptores: • La 1ª columna y la 1ª fila son especiales. Cumplen que la 1ª mitad de la fila (o columna) están duplicadas en el cuadrante simétrico pero conjugadas.

  41. 6. Conclusiones obtenidas en el estudio • Todos los descriptores de la transformadas excepto el valor (1,1) se repite (conjugado o no) en otro lugar concreto de la matriz transformada obedeciendo unas reglas de simetría capaces de reproducirse. • De este modo, podemos considerar el numero de descriptores realmente únicos a la mitad.

  42. 6. Conclusiones obtenidas en el estudio • Si realizáramos un juego visual en el que cuadriplicamos la matriz transformada de la misma forma en que se pliega un folio, obtendríamos en un orden superior una imagen totalmente simétrica respecto a su centro. • Usualmente se normalizan los espectros para centrarlos. La información más relevante pasa de las esquinas pasa al centro.

  43. 6. Conclusiones obtenidas en el estudio 2. Importancia de algunos descriptores: - La primera fila y primera columna no sólo tienen una propiedad de simetría especial sino que al recuperar la imagen únicamente con esos descriptores se observa que contienen la mayor parte de la información vertical y horizontal de la imagen.

  44. 6. Conclusiones obtenidas en el estudio 3. Estudio de las rectas:

  45. 6. Conclusiones obtenidas en el estudio

  46. 6. Conclusiones obtenidas en el estudio • Aplicando la propiedad de linealidad de la transformada podemos obtener conclusiones respecto a las rectas:

  47. 6. Conclusiones obtenidas en el estudio Observamos que las transformadas de las rectas se pueden obtener como suma de las transformadas de sus puntos por separado. Existen propiedades que cumplen las matrices transformadas de las rectas.

  48. 6. Conclusiones obtenidas en el estudio • Información de rectas verticales aparecen en la fila 1 de la matriz transformada. • Información de rectas horizontales aparecen en la columna 1 de la matriz transformada. • Información de diagonales principales aparecen en la posición (1,1) y en la diagonal uno por debajo de la secundaria de la matriz transformada. • Información de diagonales secundarias aparecen en la diagonal principal de la matriz transformada.

  49. 6. Conclusiones obtenidas en el estudio • A partir de estas propiedades de las rectas y de lo visto anteriormente (f1 y c1) se podrían generar mascaras que filtren esos descriptores y recuperar imágenes donde destaquen cada una de esas componentes, o varias a la vez.

  50. 1 1 N = 3 x (2x2) = 12 6. Conclusiones obtenidas en el estudio • 4. Componentes conexas: • Para cualquier número de componentes conexas de 2x2 puntos (cuadrados) sea cual sea su posición, se cumple que: • Las propiedades generales sigue cumpliéndose. • Los elementos de la fila (dim(y)/2)+1 y columna • (dim(x)/2)+1 son siempre cero. 

More Related