Una imagen digital es una representación bidimensional de una imagen a partir de una matriz numérica, frecuentemente binaria. Estas imágenes, generalmente se obtienen al convertir señales continuas en formato digital, las cuales se pueden visualizar en diversos medios como impresoras digitales, monitores y dispositivos de proyección digital. Hoy en día, la frecuencia en la cual esta información se transmite, almacena, procesa y visualiza en formato digital está aumentando rápidamente, por lo cual, el diseño de métodos de ingeniería para mejorarla integridad visual y facilitar la búsqueda de información ha tenido un alto interés.
Un aspecto del procesamiento digital de imágenes, que lo convierte en un tema de estudio tan interesante, es la sorprendente diversidad de aplicaciones en donde se utilizan estas técnicas de procesamiento o análisis. Prácticamente todas las ramas de la ciencia poseen subdisciplinas que utilizan dispositivos de grabación o sensores para recopilar datos de imágenes del universo que nos rodea, como por ejemplo: meteorología, radiología, radares, oceanografía, inspecciones industriales, sismología, imágenes ultrasónicas, vigilancia, reconocimiento aéreo y cartografía, imágenes satelitales, etc. En definitiva, todos estos conjuntos de datos visibles pueden considerarse como imágenes, las cuales pueden ser procesadas, modificadas y mejoradas usando técnicas de procesamiento, aún cuando la información no provenga de fuentes de luz visible (como las infrarrojas o rayos X).
Existen tres tipos de operaciones básicas de procesamiento de imágenes digitales en niveles de grises (operaciones de punto, operaciones aritméticas y operaciones geométricas), pero, para propósito de este artículo, nos enfocaremos solo en la primera. Las operaciones de punto se subdividen según la manera en que modifican la escala de grises, aplicándose en pixeles individuales sin considerar los pixeles vecinos. En otras palabras, las operaciones de puntos se definen solo en función de la intensidad de un pixel determinado, por lo que la herramienta básica para comprender, analizar y diseñar este tipo de operaciones es el histograma de la imagen.
El histograma Hƒ de la imagen digital ƒ es un diagrama o gráfico de la frecuencia de aparición de cada nivel de gris en ƒ. Por lo tanto, Hƒ es una función unidimensional con dominio {0, …K-1} con un rango que se extiende desde 0 hasta el número de pixeles de la imagen MN. Por lo tanto, el histograma se define explícitamente por Hƒ (k)=J el cual solo implica un conteo simple de los niveles de grises. Bajo la premisa anterior, la operación de punto de una imagen digital ƒ(n) no es más que una función h de una sola variable aplicada de manera idéntica a cada pixel de la imagen, creando así una nueva imagen modificada g(n). Por lo tanto, por cada coordenada n la forma de la función h es determinada por g(n)=h[ƒ(n)].
El desplazamiento de imagen aditivo se define bajo la forma g(n)=[ƒ(n)]+L, donde L puede tomar cualquier valor dentro de la escala de grises asumiendo que las imágenes se han cuantificado en enteros en el rango {0…,K- 1}. Por lo tanto, el histograma juega una relación dada por Hg (k)=Hƒ (k-L), donde el valor de L corresponde al desplazamiento del histograma a la izquierda o a la derecha en la escala de grises. En la Figura 1, podemos ver el efecto del desplazamiento aditivo con L=±70 y sus respectivos histogramas.
Es evidente como las imágenes son afectadas a medida que desplazamos los histogramas hacia la izquierda o derecha en la escala de grises. A medida que el histograma es desplazado hacia la izquierda, la imagen se oscurece, por el contrario, a medida que es desplazado hacia la derecha, se esclarece. Estos efectos pueden ayudar a encontrar detalles o información en las imágenes las cuales a simple vista no son perceptibles.
Este tipo de técnica, también llamada estiramiento de contraste es una operación de punto lineal que expande el histograma de la imagen para llenar todo el rango de escala de grises disponible. Un aspecto interesante de esta técnica, es que hoy en día, casi todas las cámaras de video comerciales de uso doméstico y profesionales aplican el estiramiento de histograma a escala completa como una función básica antes de que las imágenes sean incorporadas en la memoria. El estiramiento de contraste se define como , FSHS (Full-Scale HistogramStretch), considerando que ƒ posee un histograma comprimido con el valor máximo de nivel gris B y el valor mínimo A dado por y . En la Figura 2, podemos ver el efecto del estiramiento de histograma a escala completa.
En esta figura, se puede apreciar que en el histograma de la imagen original (izquierda) existen zonas donde se cuenta con muy poca información (encerradas con círculos), estas zonas por lo general, provocan que las imágenes tengan problemas de contraste. Si se observa la imagen de la derecha, queda en evidencia el efecto que tiene eliminar esas zonas y estirar el histograma hacia estos límites. En este caso, la imagen poseía un buen equilibrio de pixeles por lo que la diferencia no es tan notoria, sin embargo, en imágenes infrarrojas donde el ruido espacial y el contraste es muy variable, esta técnica muestra ser una herramienta notable para eliminar los problemas de contraste de una imagen que ha sido captada por un sensor que presenta, por ejemplo, deficiencia en sus filtros.
Una de las operaciones de punto no lineales más importantes es la ecualización por histogramas, también llamada aplanamiento de histograma. La idea subyace en una extensión del estiramiento de contraste visto en el punto anterior, en la cual no solo se llena el rango completo de escala de grises, sino que también lo distribuye de una manera uniforme en todo el rango. La demostración matemática en orden de explicar la ecualización de histogramas es bastante extensa, por lo que solo nos enfocaremos en definirla como un histograma normalizado de g de la forma para 0≤ x ≤1 donde se aplica un FSHS para estirar el histograma ya aplanado para llenar luego el rango completo de la escala de grises. En la Figura 3, podemos ver el efecto que tiene aplicar una ecualización de histogramas a una imagen digital.
En esta imagen se puede apreciar claramente el efecto que tiene emparejar el histograma equilibrando los pixeles en toda la escala de grises. Al igual que el estiramiento de histograma, este tipo de técnica es muy útil cuando las imágenes digitales presentan problemas de contraste, siendo capaz de resaltar zonas que en su forma original son muy difíciles de detectar a simple vista, solo basta mirar los detalles del mar en la imagen de la derecha.
Para el análisis de las técnicas aquí descritas, se tomaron imágenes digitales procedentes de fuente abierta en formato JPEG (Joint Photographic Experts Group) y en extensión RGB (Red, Green, Blue) las cuales fueron transformadas en imágenes monocromáticas para facilitar su explicación. Las técnicas se aplicaron bajo esta extensión, pues los modelos en color u otras imágenes multiespectrales utilizan los mismos métodos aquí descritos. Tanto para la transformación monocromática de las imágenes digitales como la aplicación de las técnicas aquí descritas, se utilizó el programa MatLab versión R2017b con la finalidad de poder manipular matemáticamente, según las ecuaciones aquí expuestas, las matrices que conforman una imagen digital.
El procesamiento digital es un campo que permite manipular matemáticamente una señal cualquiera sea su naturaleza y que contenga una información determinada, su fin último es poder modificarla o mejorarla en un cierto grado. En el presente artículo, quedó en evidencia el potencial del procesamiento digital aplicado en imágenes, cabe destacar que solo se revisaron las herramientas básicas basadas en problemas de contraste aplicadas en forma separada, no obstante, todas estas técnicas se pueden combinar para un resultado óptimo. Finalmente, cabe destacar que existen un sinfín de literatura que describe en forma detallada distintas técnicas que se ocupan no solo para el tipo de problemas aquí descritos, sino también para la eliminación del ruido espacial (análisis frecuencial de imágenes) y filtros adaptativos para corregir la no-uniformidad (filtros que adaptan y mejoran las secuencias de imágenes o videos en tiempo real), entre otros.
Formulas:
Versión PDF
Año CXXXIX, Volumen 142, Número 1003
Noviembre - Diciembre 2024
Inicie sesión con su cuenta de suscriptor para comentar.-