Curso de
Procesamiento Digital de Imágenes
Impartido por: Elena Martínez
Departamento de Ciencias de la Computación
IIMAS, UNAM, cubículo 408
http://turing.iimas.unam.mx/~elena/Teaching/PDI-Mast.html
[email protected]
2. Fundamentos de la imagen digital
a) Elementos de percepción visual.
b) La luz y el espectro electromagnético.
c) Sensado y adquisición de imágenes.
d) Muestreo y cuantización de imágenes.
e) Algunas relaciones básicas entre
pixeles.
f) Operaciones lineales y no lineales.
Sensado y Adquisición
Si podemos desarrollar un sensor que sea capaz de
detectar energía radiada de una banda del espectro
electromagnético, entonces podremos adquirir eventos
de esa banda. Sin embargo, hay que notar que la
longitud de onda electromagnética que requerimos
para “ver” un objeto debe ser del mismo tamaño o
más pequeña que el objeto.
Por ejemplo: para “ver” moléculas de agua cuyo tamaño es de 10-10 m,
necesitamos una fuente capaz de emitir en la banda ultravioleta lejana o
en la región de rayos-X suave. Ésta puede ser una limitación para
construir un sensor, aunada a las limitaciones de los materiales.
Sensado y Adquisición
El tipo de imágenes en las que estamos interesados
se generan como una combinación de la fuente de
“iluminación” y el reflejo o absorción de energía de
la fuente por los elementos de la escena que quieren
ser capturados.
Dependiendo de la naturaleza de la fuente, la energía
de la iluminación puede ser reflejada por el objeto
(una superficie plana) o transmitida a través del
mismo (rayos-x a través del cuerpo humano).
Sensado y Adquisición
Hay tres tipos de arreglos
básicos de sensores para
transformar la energía
luminosa a imágenes
digitales.
En todos ellos la energía
de entrada se transforma
en voltaje mediante la
combinación de una
entrada eléctrica y un
sensor de un material que
responde a la energía a
ser detectada. La
respuesta del sensor es
un voltaje que debe ser
digitalizado.
Un sólo sensor
Un ejemplo de un sólo sensor puede ser el fotodiodo,
que está construído con un material de silicon y cuyo
voltaje de respuesta es proporcional a la luz. El uso de
un filtro colocado enfrente provee de selectividad.
Por ejemplo, un filtro verde (pasa-v) enfrente del
sensor favorece la luz en la banda verde del espectro.
Como consecuencia, la salida del sensor será más
fuerte para la luz verde que para cualquier otro
componente del espectro visible.
Un sólo sensor
Para obtener imágenes 2D con un sólo sensor debe existir un
desplazamiento relativo en las direcciones x y y entre el
sensor y la zona a ser adquirida.
Por ejemplo: para el escaneo de alta presición, se monta una película
negativa en un rodillo cuya rotación provee un desplazamiento en una
dirección. El sensor se monta en una rosca sinfin que provee el
desplazamiento en la dirección perpendicular.
Un sensor en línea
Para construir imágenes 2D: El arrelgo en línea provee de
elementos de imagen en una dirección. El movimiento
perpendicular a la línea provee de la otra dirección.
Un sensor en línea
Plano. Scanner planos. Imágenes aéreas: el sistema se monta
en un avión y éste vuela a una velocidad y altitud constantes
sobre el área geográfica a ser capturada. En una barra
perpendicular a la dirección de vuelo se montan diferentes
sensores que responden a diferentes bandas del espectro.
Circular. Sensores montados en un anillo se utilizan en
medicina y aplicaciones industriales para obtener imágenes
en pila a lo largo de los objetos 3D. Una fuente de rayos-X provee
de iluminación, y un sensor colocado en forma opuesta colecta la
energía del rayo-X que pasa a través del objeto. La salida de los
sensores debe ser procesada para reconstruir la imagen de una seccióntransversal (cross-section). CAT, MRI y PET (fuentes y sensores dife.).
Un arreglo de sensores
El arreglo de sensores es como el recuadro visto
anteriormente que puede ser de tamaño N x M, en
este tipo de arreglos no es necesario ningún
movimiento, la escena se toma íntegra, toda la
imagen a la vez (adquisición en paralelo).
Este es el tipo de arreglos que predomina en cámaras
digitales CCDs u otros sensores de luz. Pueden venir
en paquetes de 4000 x 4000. La respuesta de cada
sensor es proporcional a la integral de la energía
luminosa proyectada en la superficie del sensor.
Un arreglo de sensores
Un modelo simple de imagen
 Una imagen puede ser definida como una
función bidimensional, f(x,y), donde x y y son
coordenadas espaciales (arreglo de sensores).
 El valor de f en (x,y)
la intensidad o brillo
en ese punto (integral sobre el área del sensor).
 0 < f(x,y) <  (valor proporcional a la energía
radiada por la fuente física).
Un modelo simple de imagen
 f(x,y) puede caracterizarse por dos
componentes:
1. La cantidad de iluminación de la fuente que
incide en la escena a ser capturada (i(x,y)).
2. La cantidad de iluminación reflejada por los
objetos de la escena (r(x,y)).
Un modelo simple de imagen
 Componentes: Iluminación y Reflectancia
• Iluminación:
i(x,y) (fuente de iluminación)
• Reflectancia: r(x,y) (caract. de los objetos)
• f(x,y)= i(x,y) • r(x,y)
con 0 < i(x,y) < 
y 0 < r(x,y) <1 (0=absorción total
1=reflectancia total)
Un modelo simple de imagen
 La intensidad de una imagen monocromática
f en (x0,y0) es el nivel de gris (l) de la imagen en
ese punto:
l=f (x0,y0)
 Lmin  l  Lmax
donde Lmin : Positivo
Lmax : Finito
Un modelo simple de imagen
 En la práctica:
Lmin = imin • r min
Lmax = imax • r max
 El intervalo: [Lmin ,Lmax ] : es llamado la
escala de gris.
se expresa en [0, L-1]
l=0 : negro
l=L-1 : blanco
2. Fundamentos de la imagen digital
a) Elementos de percepción visual.
b) La luz y el espectro electromagnético.
c) Sensado y adquisición de imágenes.
d) Muestreo y cuantización de imágenes.
e) Algunas relaciones básicas entre
pixeles.
f) Operaciones lineales y no lineales.
Muestreo y cuantización de imágenes
 La digitalización del espacio y la amplitud de
f (x,y) se llama:
- Muestreo de la imagen: cuando se refiere a
las coordenadas espaciales (x,y).
- Cuantización del nivel de gris: cuando se
refiere a la amplitud f.
Muestreo y cuantización de imágenes
 Muestrear, así como lo definimos, asume que
tenemos una imagen continua en ambas
direcciones coordenadas así como en la
amplitud.
 En la práctica, el método de muestreo está
determinado por el arreglo de sensores
utilizado para generar la imagen digital.
Muestreo y cuantización de imágenes
Contínua:
Digital:
Muestreo y cuantización de imágenes
 De lo anterior, se puede ver claramente que la
calidad de una imagen digital depende grandemente
del número de muestras y niveles de gris utilizados
para muestrar y cuantizar la imagen en cuestión.
 Sin embargo, veremos más adelante que el
contenido de información de la imagen también es
un característica importante a considerar cuando
elegimos estos parámetros.
Representación de la imagen digital
El resultado de muestrear y cuantizar una imagen, f(x,y), es
una matriz de números reales que tiene M renglones y N
columnas. Los valores de (x,y) ahora son cantidades discretas
y enteras. El origen esta en (x,y)=(0,0). El siguiente valor se
encuentra en la primer renglón y está representado por
(x,y)=(0,1), es
decir la segunda
muestra del
primer renglón,
y así sucesivamente.
Representación de la imagen digital
Escribimos una imagen digital completa, como la matrix
M x N, de la siguiente forma:
 f (0,0)

f (1,0)

f ( x, y ) 

...

 f ( M  1,0)
f (0,1)
...
...
...
...
...
f ( M  1,1)
...
f (0, N  1)


f (1, N  1)


...

f ( M  1, N  1)
Imagen digital
Elementos de la imagen
(pixels)
Representación de la imagen digital
 Si expresamos el muestreo y la cuantización en
términos matemáticos más formales:
- Z : denota los reales enteros
- R : denota los números reales
 El muestreo es la partición del plano xy en una
malla, donde las coordenadas del centro de cada
cuadro de la malla es el par de elementos del
producto cartesiano: Z x Z (Z2)
Representación de la imagen digital
 Z2 es el conjunto de todos los pares ordenados de
elementos (x,y) con x y y enteros de Z.
 f(x,y) es una imagen digital si:
- (x,y) son enteros de Z2
- f es una función que asigna un valor de nivel
de gris (de R) a cada par distinto de coordenadas
(x,y) (cuantización).
- Como los niveles de gris son generalmente
también enteros, entonces Z reemplaza a R.
Representación de la imagen digital
 El proceso de digitalización requiere de
tomar decisiones acerca de los valores de M y
N, así como el número de niveles de gris , L,
para cada pixel.
- M y N son enteros positivos.
- L , por cuestiones de procesamiento,
almacenamiento y muestreo, generalmente se
le asignan valores que son potencias de 2:
L=2k
Representación de la imagen digital
 Asumimos además que los niveles de gris son
cantidades enteras igualmente espaciadas en el
intervalo [0, L-1]. A este rango se le conoce
generalmente como el rango dinámico de la imagen.
 Si llamamos b al número de bits requeridos para
almacenar una imagen digital entonces:
b=MxNxk
Si M=N (imagen cuadrada):
b = N2 k
Número de bits de la imagen
Cuando una imagen tiene 2k niveles de gris se le llama
comúnmente una “imagen de k-bits”. Por ejemplo: una
imagen con 256 niveles de gris se le llama “imagen de 8-bits”.
Una imagen de 8 bits de tamaño 1024 x 1024 requiere de:
Resolución espacial y de
niveles de gris
 El muestreo es el factor principal que determina la
resolución espacial de una imagen. La resolución
espacial es el detalle más pequeño que puede
distinguirse en una imagen.
 La resolución de los niveles de gris similarmente
se refiere al cambio más pequeño que se puede
distinguir entre un nivel y otro (proceso altamente
subjetivo).
Resolución espacial
Imagen de 1024 x 1024 con 8 bits de niveles (256).
Submuestreo llevado a cabo borrando un número apropiado
de renglones y columnas de la imagen original. El número
de niveles de gris se mantiene fijo en 256.
Resolución espacial
Regresar las
imágenes
submuestreadas
al tamaño de la
imagen original,
replicando
renglones y
columnas, para
poder comparar
más facilmente el
efecto del
submuestreo.
Resolución de niveles de gris
En este ejemplo,
mantenemos el
tamaño de la imagen
fijo en 452 x 374.
Reducimos los
niveles de gris de 256
a 2 en potencias de 2.
La imagen original
(a) tiene k=8 (256
niveles).
Resolución de niveles de gris
Conforme reducimos los
niveles de gris la
información se va
perdiendo dando lugar a
los llamados “falsos
contornos”
generalmente presentes
en las partes suaves de
las imágenes donde se
requiere mayor número
de niveles para
representarlas.
Resolución espacial y de
niveles de gris
 Podemos considerar, como una regla muy
general, que si asumimos potencias de 2 por
conveniencia, que la resolución más pequeña y
más o menos razonable para representar una
imagen libre de efectos de submuestreo y de
falsos contonrnos , sería una imagen de 256 x
256 con 64 niveles de gris.
Resolución espacial y de
niveles de gris
 ¿Cuántas muestras y niveles de gris se
necesitan para una buena aproximación?
- La resolución de una imagen (el grado de detalle
a distinguir) depende del número de muestras y del
número de niveles de gris.
- Mientras estos parametros se incrementan, el
arreglo discreto se aproxima más a la imagen original.
- Sin embargo, el almacenamiento y el procesado
se incrementan rápidamente en función de M, N y k.
Resolución espacial y de
niveles de gris
 Se pueden generar diferentes versiones
(imagenes) del mismo objeto a través de:
- Variaciones de M y N
- Variaciones de k (número de bits)
- Variaciones de ambos
 ¿Existe alguna relación entre estos parámetros?
Resolución espacial y de
niveles de gris
Huang [1965] realizó un estudio para tratar de cuantificar el
efecto de estas variaciones: a) La imagen de la mujer tiene
relativemente poco detalle, b) el hombre con la cámara
contiene una cantidad intermedia de detalle, mientras c) la
multitud contiene una gran cantidad de detalles.
Resolución espacial y de
niveles de gris
Se generaron un conjunto de estos tres tipos de imágenes
variando simultáneamente N (M=N, cuadrada) y k. Después,
a un conjunto de observadores se les pidió evaluar
(subjetivamente) la calidad de cada una de estas imágenes.
Los resultados se sumarizan en lo que el llamó: curvas de
isopreferencia en el plano Nk:
- Cada punto en la plano Nk representa una imagen con
valores de N y k iguales a las coordenadas en ese punto.
- Los puntos que caen en la curva de isopreferencia
corresponden a imágenes con valores iguales de calidad
subjetiva.
Resolución espacial y de
niveles de gris
Conforme aumentan N
y k ,las curvas
muestras ciertas colas
hacia la derecha, para
a) y b). Sin embargo,
para c) parece haber
una tendencia a una
línea vertical, ésto
indica que para un
valor fijo de N, la
calidad percibida es
independiente de k.
Resolución espacial y de
niveles de gris
 Conclusión:
- La calidad de las imágenes incrementa
con el incremento de N y k.
- Algunas veces, para valores fijos de N, la
calidad mejora decrementando k
(incrementando así el contraste aparente).
- Para imágenes con gran cantidad de
detalle, sólo se necesitan unos cuantos
niveles de gris.
Instituto de Investigaciones en
Matemáticas Aplicadas y en Sistemas
(IIMAS)
http://turing.iimas.unam.mx/~elena/Teaching/PDI-Mast.html
Descargar

imagen - Departamento de Ciencias de la Computación :: IIMAS