Curso de
Procesamiento Digital de Imágenes
Impartido por: Elena Martínez
Departamento de Ciencias de la Computación
IIMAS, UNAM, cubículo 408
http://turing.iimas.unam.mx/~elena/Teaching/PDI-Mast.html
[email protected]
Programa del Curso
1.
2.
3.
4.
Introducción.
Fundamentos de la imagen digital.
Realce de la imagen en el dominio espacial.
Realce de la imagen en el dominio de la
frecuencia.
5. Restauración de la imagen.
6. Representación del color.
7. Compresión de imágenes.
3. Relace de la imagen en el
dominio espacial
a) Antecedentes.
b) Algunas transformaciones básicas de niveles
de gris.
c) Procesamiento del histograma.
d) Realce de la imagen utilizando operaciones
artméticas/lógicas.
e) Filtros espaciales básicos.
f) Filtros espaciales de suavizamiento (smooth).
g) Filtros espaciales de realce (sharp).
Realce de una imagen
 El realce de una imagen se relaciona con procesar la
imagen de manera que el resultado sea otra imagen más
conveniente que la imagen original para una aplicación
específica.
 Lo anterior significa que los procesos son orientados al
problema (métodos: Rayos-X  Satélite).
 Para el realce de la imagen se utilizan métodos en los
dominos del espacio de la imagen y de la frecuencia ( o
combinación de ellos).
Métodos en el domino del
espacio de la imagen
 Son procesos que operan directamente en el conjunto de
pixeles que componen la imagen.
 No existe una teoría general para el realce. Cuando una
imagen es procesada para interpretación visual, el
observador es el que tiene la última palabra. Cuando es
procesada para visión por computadora, la tarea de
evaluación es un poco más fácil y depende del resultado en
el reconocimiento del problema en cuestión (ejemp. texto).
Métodos en el domino del
espacio de la imagen
 Como mencionamos, el realce espacial es un proceso que
opera directamente en el conjunto de pixeles que componen
la imagen.
 g(x,y)= T[f(x,y)], donde f(x,y) es la imagen de entrada y
g(x,y) la de salida y T es un operador sobre f definido en una
vecindad alrededor de (x,y).
 El vecindario alrededor de (x,y) se define utilizando una
subimagen cuadrada (o rectangular) centrada en (x,y).
Métodos en el domino del
espacio de la imagen
El centro de la subimagen se mueve de pixel a pixel
empezando de arriba hacia abajo y de izquierda a derecha (por
ejemplo). El operador T se aplica en cada posición (x,y) para
producir una salida g en esa posición.
Métodos en el domino del
espacio de la imagen
 Cuando el vecindario es de 1 x 1, entonces g depende
únicamente de el valor de f en (x,y) y T se vuelve una
función de transformación de niveles de gris (intensidades o
mapeo):
s=T(r)
donde r,s son los niveles de gris de f(x,y) y g(x,y) en (x,y).
- Técnicas de procesamiento de puntos (por ejemplo:
expansión del contraste, umbralización) porque sólo
dependen del nivel de gris en ese punto.
Métodos en el domino del
espacio de la imagen
Expansión (extendimiento)
del contraste: los valores de r
abajo de m se comprimen, lo
contrario por arriba de m.
Produce mayor contraste
Umbralización: este es el caso
límite del anterior, donde T(r)
produce dos niveles (binario).
Métodos en el domino del
espacio de la imagen
 Vecindades más grandes permiten considerable
flexibilidad como son los procesos con las llamadas
máscaras o filtros: cuando los valores de f en una vecindad
predefinida de (x,y) determinan los valores de g en (x,y).
- Técnicas de procesamiento a través del uso de máscaras
(kernel, template o ventana, o filtros) (Se discutiran en la
sección 3(e)).
3. Relace de la imagen en el
dominio espacial
a) Antecedentes.
b) Algunas transformaciones básicas de niveles
de gris.
c) Procesamiento del histograma.
d) Realce de la imagen utilizando operaciones
artméticas/lógicas.
e) Filtros espaciales básicos.
f) Filtros espaciales de suavizamiento (smooth).
g) Filtros espaciales de realce (sharp).
Algunas transformaciones
básicas del nivel de gris
 Las transformaciones más simples, como se ha
mencionado, son las de los niveles de gris. Estos valores
están relacionados por la expresión s=T(r) , donde T es la
transformación que mapea los valores de los pixeles r a los
valores de los pixeles s.
 Típicamente estos valores se almacenan en un arreglo de 8
bits que tendrá 256 niveles y se implementan a través de las
llamadas Look-up (LUT) tables.
Algunas transformaciones
básicas del nivel de gris
 Lineal:
- Identidad
- Negativa
 Logarítmica:
- Directa
- Inversa
 Potencia:
- Exponente
- Raíz
Imágenes negativas
 Se obtiene utilizando al función de transformación
s=T(r):
Para el rango [0, L-1] al rango s=L-1-r
Imágenes negativas
Parecido al negativo fotográfico. Este proceso es conveniente
cuando queremos realzar detalles blancos o grises sobre un fondo
oscuro. El contenido de información es el mismo.
Transformaciones logarítmicas
 La forma general de una transformación logarítmica es:
s= c log (1+r)
donde c es una constante, y se asume que r  0.
 La curva mostrada anteriormente muestra cómo esta
transformación mapea un rango dinámico más angosto de
niveles de gris bajos de la imagen de entrada a un rango
más ancho de niveles en la imagen de salida. Lo opuesto
también se cumple para valores altos en la imagen de
entrada.
Transformaciones logarítmicas
 Cualquiera de las curvas mostradas en la figura anterior
puede realizar esta expansión/compresión de niveles de
gris. De hecho la función de potencia que veremos después
es mucho más versátil para este propósito.
 Sin embargo, la función logarítmo tiene la importante
característica que comprime el rango dinámico de imágenes
con una variación muy grande de niveles de gris. Un
ejemplo clásico de este tipo de imágenes es el espectro de
Fourier que veremos más adelante.
Transformaciones logarítmicas
El espectro de Fourier tiene valores de 0 a 106. Cuando estos
valores se escalan linealmente a un desplegado de 8 bits los
valores altos dominaran a los bajos (igualmente importantes).
Transformaciones de potencia
 La forma general de una transformación de potencia es:
s = c r
donde c y  son constantes positivas.
 Algunas veces la expresión se escribe como s = c (r + )
para tomar en cuenta un posible offset (esto es, una posible
medida de salida cuando la entrada es cero).
 Las curvas de la transformación de potencia para valores
fraccionales de  mapean un rango estrecho de entradas
oscuras a un rango más amplio de valores de salida.
Transformaciones de potencia
 Corrección
Gamma
 =c=1:
Identidad
Transformaciones de potencia
 A diferencia de la función logarítmica, en la función de
potencia tenemos una familia de curvas de transformación
simplemente variando el valor de . Como se ve en la
gráfica anterior las curvas con valores  >1 tienen el efecto
exactamente opuesto a las curvas con  < 1.
 Una gran variaded de dispositivos de adquisición,
impresión y desplegado de imágenes responde de acuerdo
a leyes de potencia. Como convención se utiliza como
exponente a  , y las transformaciones se conocen como
corrección gama.
Transformaciones de potencia
Lo anterior también aplica para otros
dispositivos como impresoras o scaners
Un tubo de rayos
catódicos (CRT)
tiene una respuesta
intensidad-voltaje
que es una función
de potencia, con
exponentes que
varían de 1.8 a 2.5.
Estos dispositivos
tienden a mostrar
imágenes más
oscuras de lo que
deberían.
Corrección Gama
 La corrección gama es relevante si el desplegado de una
imagen en un monitor es de importancia. Las imágenes que
no son corregidas pueden parecer muy oscuras o muy
claras. Para reproducir los colores correctamente también
se requiere de la corrección gama ya que ésta no sólo
cambia el brillo sino también las relaciones entre rojo,
verde y azul.
 El uso creciente de Internet ha hecho muy popular el uso
de la corrección gama, ya que una misma imagen puede ser
vista por miles de usuarios cada uno de los cuales cuenta
con diferente monitor.
Realce de contraste usando
funciones de potencia
Resonancia magnética
(MR) de la espina
dorsal superior
humana, con una
fractura cerca del
centro vertical de la
espina,
aproximadamente a un
cuarto de la imagen
vista de arriba hacia
abajo.
Realce de contraste usando
funciones de potencia
Este es el caso
opuesto del
anterior. Ahora
tenemos una
imagen muy clara,
los valores de 
que debemos
utilizar serán
mayores que 1.
Funciones de transformación
lineal por trozos (piecewise)
 Un método complementario a los vistos anteriormente es
el de considerar funciones de transformación lineal por
trozos (piecewise). La principal ventaja de estas funciones
sobre las anteriormente discutidas es que pueden ser
funciones con una complejidad arbitraria. De hecho
veremos que para algunas aplicaciones la implementación
práctica sólo puede ser hecha a través de estas funciones.
Una desventaja es que su especificación requiere de
considerable intervención del usuario.
Expansión del Contraste
 Las imágenes de bajo contraste pueden ser resultado de
una iluminación pobre, de un rango dinámico muy pequeño
en el sensor de la imagen, o tal vez, de parámetros de
calibración erróneos en la apertura de los lentes durante la
adquisición de la imagen.
 La idea de la expansión del contraste es el de incrementar
el rango dinámico de los niveles de gris de la imagen que es
procesada.
Expansión del Contraste
 La expansión del contraste es una de las formas más
simples de funciones lineales por trozos (piecewise).
 Utilizando puntos
de control para
definir la forma
de la función.
Expansión del Contraste
 Las posiciones de (r1,s1) y (r2,s2) controlan la forma de la
función de transformación.
- Si r1= s1 y r2= s2 la transformación es una función
lineal que no produce ningún cambio en los niveles.
- Si r1= r2 , s1= 0 y s2= L-1 , la transformación se
convierte en una función de umbralización que genera
una imagen binaria.
Expansión del Contraste
 Otras formas de esta función:
- Valores intermedios de (r1,s1) y (r2,s2) producen
varios grados de expansión de los niveles de gris de
la imagen de salida, con lo cual afecta al contraste.
- Generalmente se asume que r1 r2 , s1  s2 , de
manera que la función es de valor único y
monotónicamente creciente. Esta condición precerva
el orden de los niveles de gris, por lo tanto evita
artefactos de intensidad en la imagen procesada.
Expansión del Contraste
(b) Imagen de
polen 700x, de
bajo contraste.
(c) (r1,s1)=(rmin,0)
y (r2,s2)=
(rmax,L-1), donde
rmin y rmax son el
nivel de gris min y
max respect.
(d) Función de
umbralización,
donde r1 = r2 = m,
m = media.
Rebanadas de niveles de gris
 El método de rebanadas de niveles de gris (Gray-Level
Slicing) sirve para resaltar un rango específico de niveles
de gris en una imagen. Las aplicaciones incluyen resaltar
características como masas de agua en imágenes de satélite,
resaltar defectos en imágenes de Rayos-X, etc.
 Existen varias maneras de hacer rebanadas de niveles de
gris. Aquí discutiremos dos de ellas:
Rebanadas de niveles de gris
 Una manera es desplegar un valor alto de nivel de gris
para todos los valores de niveles de gris en el rango de
interés, y establecer valores bajos para todos los demás
niveles (imagen binaria).
Rebanadas de niveles de gris
 Una segunda aproximación es resaltar el rango deseado
de niveles de gris pero preservar el fondo y las tonalidades
de los niveles de gris de la imagen.
Rebanadas de niveles de gris
Rebanadas de planos-bit
 En lugar de resaltar rangos de niveles de gris, este
método se basa en resaltar las contribuciones hechas a la
apariencia total de la imagen por un bit específico.
 Supóngase que cada pixel de la imagen se representa por
8 bits. Imagínese que la imagen está compuesta por 8
planos de 1-bit, que van del 0 al 7. En términos de bytes de
8-bits, el plano 0 contiene todos los bits de más bajo orden
en el byte que comprende el pixel de la imagen, y el plano
7 contiene todos los bits de orden alto.
Rebanadas de planos-bit
Rebanadas de planos-bit
Imagen de 8-bits de un fractal (un fractal es una imagen
generada a través de expresiones matemáticas).
Rebanadas de planos-bit
Sólo los bits de más alto
nivel (los 4 primeros de
arriba) contienen
información visual
significativa. Los otros 4
planos contribuyen más
sutilmente en los
detalles.
El plano 7 corresponde
exactamente a una
imagen umbralizada con
el nivel de gris 128.
Rebanadas de planos-bit
 Separar las imágenes en sus bits es útil para
analizar la importancia realtiva que juega cada uno
de los planos-bit de la imagen; es un proceso que
ayuda a determinar que tan adecuados son el
número de bits utilizados en la cuantización de la
imagen. También este tipo de descomposición de la
imagen puede ser útil para los métodos de
compresión de la imagen (que se veran más
adeante).
Instituto de Investigaciones en
Matemáticas Aplicadas y en Sistemas
(IIMAS)
http://turing.iimas.unam.mx/~elena/Teaching/PDI-Mast.html
Descargar

rebanadas de niveles de gris - Departamento de Ciencias de la