Curso de
Procesamiento Digital de Imágenes
Impartido por: Elena Martínez
Departamento de Ciencias de la Computación
IIMAS, UNAM, cubículo 408
http://turing.iimas.unam.mx/~elena/Teaching/PDI-Mast.html
[email protected]
Programa del Curso
1.
2.
3.
4.
Introducción.
Fundamentos de la imagen digital.
Realce de la imagen en el dominio espacial.
Realce de la imagen en el dominio de la
frecuencia.
5. Restauración de la imagen.
6. Representación del color.
7. Compresión de imágenes.
6. Representación del color
a) Antecedentes.
b) Fundamentos del color.
c) Modelos de color.
- RGB
- CMY y CMYK
- HSI
d) Pseudocolor.
- Rebanado de intensidad.
- Transformación de niveles de gris a
color.
Modelos de color
 El propósito de los modelos de color (los también
llamados espacios de color o sistemas de color) es el de
facilitar la especificación de los colores utilizando algún
estándar.
 En escencia, un modelo de color es una especificación de
un sistema coordenado y de un subespacio, dentro de ese
sistema, donde cada color puede ser representado por un
sólo punto.
Modelos de color

La mayoría de los modelos de color hoy en día están orientados ya
sea al hardware (como monitores a color o impresoras) o a alguna
aplicación donde el objetivo es la manipulación del color (como la
creación de gráficas a color para animaciones).

En términos de procesamiento de imágenes, los modelos orientados
al hardware más comunmente utilizados en la práctica son el
modelo RGB (rojo, verde, azul) modelo para monitores a color y
para una gran variedad de cámaras de video en color; el CMY (cyan,
magenta, amarillo) y el CMYK (cyan, magenta, amarillo, negro),
modelos para impresoras en color; y el HSI (brillo (hue), saturación,
intensidad) que corresponde al modelo más cercano a la manera en
que los humanos percibimos el color.
Modelo RGB

En el modelo RGB, cada color aparece en sus componentes
espectrales primarios de rojo, verde y azul. Este modelo está basado
en un sistema coordenado Cartesiano. El subespacio de interés para
el modelo RGB es un cubo:
Modelo RGB

Los valores RGB son las tres esquinas del cubo que intersectan los
ejes; el cyan, magenta y amarillo son las otras tres esquinas; el
negro esta en el origen; y el blanco en la esquina más lejana al
origen. En este modelo, la escala de grises (valores iguales de R,G y
B) se extienden sobre la línea que une el negro con el blanco.
Modelo RGB

Los diferentes colores en este modelo son puntos dentro de este
cubo, y se definen por vectores que se extienden desde el origen.
Por conveniencia, se asume que todos los colores han sido
normalizados de manera que tenemos un cubo unitario. Esto es,
todos los valores de R, G y B están dentro del rango de [0,1].

Las imágenes representadas en el modelo de color RGB consisten
en tres componentes de imágenes, una para cada color primario.
Cuando sirven de entrada a un monitor a color, estas tres imágenes
se combinan en la pantalla de fósforo para producir una imagen a
color compuesta.
Modelo RGB

El número de bits que se utiliza para representar cada pixel en el
espacio RGB es llamado profundidad de pixel (pixel depth).

Considere una imagen RGB en el que cada imagen roja, verde y
azul es una imagen de 8-bits. Bajo estas condiciones cada pixel de
color RGB [esto es, una tripleta de valores (R,G,B)] se dice que
tiene 24 bits de profundidad (3 planos imagen por el número de bits
por plano). El término imagen de color total (full color) se utiliza
generalmente para denotar una imgen de color RGB de 24-bits. El
número total de colores de una imagen RGB de 24-bits es
(28)3=16,777,216.
Modelo RGB

Este cubo está compuesto de (28)3=16,777,216 colores. Una manera
conveniente de ver estos colores es generando planos de colores
(caras o cortes seccionales del cubo). Esto se realiza simplemente
fijando uno de los tres colores y permitiendo variar a los otros dos.
Por ejemplo, un corte seccional que pase a través del centro del
cubo y que sea paralelo al plano-GB es el plano (127,G,B) para G, B
= 0, 1, ..., 255. Aquí estamos utlizando los valores de los pixles no
normalizados.
Modelo RGB
Una imagen de un plano
seccional se ve
simplemente alimentando
el monitor con las
imágenes de las tres
componentes individuales.
En las imágenes el
componente 0 es negro y
el 255 blanco (imágenes
en tonos de gris).
Abajo se muestran las tres
superficies escondidas de
los planos del cubo que se
generaron de la misma
manera.
Modelo RGB

Es interesante notar que adquirir una imagen en color es
básicamente el proceso visto en la figura anterior pero al revés. Una
imagen en color puede ser adquirida utilizando tres filtros sensitivos
a la luz roja, verde y azul respectivamente. Cuando vemos una
escena en color con una cámara monocromática equipada con estos
filtros, el resultado es una imagen monocromática cuya intensidad
es proporcional a la respuesta del filtro. Repitiendo este proceso con
cada filtro produce tres imágenes monocromáticas que son los
componentes RGB de una escena en color. En la práctica los
sensores de imágenes en color RGB generalmente integran este
proceso en un sólo dispositivo.
Modelo RGB

Mientras las tarjetas de video de alta calidad y los monitores
proveen de un muy buen despliegue de colores en RGB de 24-bits,
muchos sistemas que se utilizan están limitados a 256 colores.
También hay numerosas aplicaciones donde tiene sentido utilizar
sólo unos cientos de colores o a veces sólo unos cuantos. Un buen
ejemplo que veremos más adelante es el pseudocolor.

Se considera de interés entónces tener un subconjutno de colores
que puedan reproducir fielmente una imagen de manera razonable
independientemente del hardware del observador (por ejemplo,
cuando una misma imagen se despliega a través de internet en
numerosos y diferentes tipos de monitores y tarjetas).
Modelo CMY y CMYK

Como hemos mencionado anteriormente el cyan, magenta y
amarillo son los colores secundarios de la luz o bien los colores
primarios de los pigmentos. Por ejemplo, cuando una superficie
recubierta de un pigmento cyan se ilumina con luz blanca, no se
refleja la luz roja de ella. Es decir, el cyan substrae la luz roja de la
luz blanca que es reflejada, la cual está compuesta por cantidades
iguales de luz roja, verde y azul.

La mayoría de los dispositivos que depositan pigmentos coloreados
sobre papel, tales como impresoras y fotocopiadores en color,
necesitan una entrada CMY o bien una conversión interna de RBG
a CMY.
Modelo CMY y CMYK

La conversión RGB a CMY se lleva a cabo mediante la expresión:
 C  1  R 
 M   1  G 
    
 Y  1  B 
donde asumimos que todos los colores han sido normalizados de [0,1].

De esta expresión se puede ver que el cyan puro no contiene rojo
(esto es C = 1 - R). Similarmente el magenta puro no refleja el
verde y el amarillo puro no refleja el azul. En teoría la mezcla de
estos tres colores da el negro, pero en la práctica esta mezcla da un
negro de muy mala calidad, es por ésto que se incluye un cuarto
color K que representa el negro.
Modelo HSI
 Hemos visto que los modelos RBG y CYM están relacionados
con el hardware, sin embargo no son útiles para describir los
colores en términos prácticos para la interpretación humana.
Por ejemplo, uno no se refiere al color de un automovil dando
porcentajes del contenido de cada uno de los colores
primarios!
 Cuando los humanos vemos un color lo describimos en
términos de su tono (H), saturación (S) y su brillo o intensidad
(I).
Modelo HSI

Hemos visto que el tono es un atributo cromático que describe un
color puro (amarillo puro, naranja puro, etc), mientras que la
saturación proporciona una medida del grado en que el color puro
está diluído en luz blanca. El modelo HSI debe su utilidad a dos
hechos:
1. La componente de intensidad (I) está desacoplada de la información
cromática.
2. Las componentes de tono (H) y saturación (S) están íntimamente
relacionadas con la forma en que los humanos precibimos el color.

El modelo HSI es una herramienta ideal para el procesamiento de
imágenes en color.
Modelo HSI

Como discutimos antes, una imagen en color RGB puede ser vista
como 3 imágenes de intensidades monocromáticas (representando el
rojo, verde y azul), así que no debe sorprendernos que seamos
capaces de extraer la intensidad de una imagen RGB.

Esto es evidente si tomamos el cubo unitario RGB y lo paramos con
el vértice negro (0,0,0) en la base y el vértice blanco (1,1,1)
directamente arriba de él. La intensidad (escala de gris) está a lo
largo de la línea vertical que une estos dos vértices (eje de
intensidad). Por lo tanto si queremos determinar la componente de
intensidad de cualquier color, simplemente pasamos un plano
perpendicular al eje de intensidad y que contenga al punto de color.
Relación entre RGB y HSI

La intersección del plano con el eje de intensidad nos dará un punto
con valor de intensidad en el rango [0,1]. También notamos que la
saturación (pureza) de un color incrementa como función de la
distancia al eje de intensidad. De hecho la saturación de los puntos
sobre el eje de intensidad es cero, como evidencia del hecho de que
todos los puntos a lo largo de ese eje son grises.
Relación entre RGB y HSI

El tono tambien puede ser determinado dado un punto RGB. La
figura (b) muestra un plano formado por los puntos negro, blanco y
cyan. El hecho de que los puntos negro y blanco estén contenidos en
el plano nos dice que el eje de intensidad también está contenido en
el plano. Además, todos los puntos contenidos en el segmento de
plano definido por el eje de intensidad y los bordes del cubo tienen
el mismo tono (cyan en este caso).
Relación entre RGB y HSI

Todos los colores generado por estos tres colores caen en el
triángulo definido por ellos. Si dos de esos puntos son blanco y
negro y el tercero es un punto de color, todos los puntos del
triángulo tendrán el mismo tono porque las componentes de negro y
blanco no pueden cambiar el tono. Si rotamos el plano sombreado
alrededor del eje vertical de intensidad obtendremos diferentes
tonos.
Relación entre RGB y HSI
 La clave para recordar la relación entre el cubo RGB y su
correspondiente espacio de colores HSI es que el espacio HSI
se representa por el eje vertical de intesidad y la posición de
los puntos de color que caen en planos perpendiculares a este
eje. Conforme el plano se mueve para arriba o para abajo del
eje de intensidad, los bordes definidos por la intersección de
cada plano con las caras del cubo tiene forma triangular o
hexagonal. Esto se puede ver más claramente si miramos el
cubo desde su eje de escala de grises hacia abajo, como se ve
en la siguiente figura:
Relación entre RGB y HSI
a)
c) y d) sólo representan otras posibles formas
de la misma representación.
En este plano vemos que los
colores primarios están
separados por 120°, los colores
secundarios están a 60° de los
primarios, lo que significa que
los ángulos entre secundarios
también son 120°.
b) Muestra la misma forma
hexagonal y un punto arbitrario
de color. El tono en el punto se
determina por un ángulo con
respecto a una referencia (rojo),
y el tono se incrementa conforme
a las manecillas del reloj desde la
referencia. La saturación (la
distancia al eje vertical de
intensidad) es el tamaño del
vector del origen al punto.
Relación entre RGB y HSI
Los componentes importantes del espacio de
color HSI, son el eje vertical de intensidad,
el tamaño del vector al punto de color y el
ángulo que este vector hace respecto a la
referencia (eje rojo). Por lo tanto no es
inusual el plano HSI esté definido en
términos de los hexágonos vistos antes o en
forma de triángulo o círculos.
La forma geométrica elegida no importan
realmente, cualquiera de estas formas puede
convertirse en la otra mediante
transformaciones geométricas.
Conversión RGB a HSI

Dada una imagen de color RGB, el componente H se calcula como:
 
H 
360  
si B  G
si B  G
 1 / 2R  G   R  B  
donde   cos 
1/ 2 
2
 R  G   R  B G  B  
1


Conversión RGB a HSI

El componente de saturación, S :
3
min R, G, B 
S  1
R  G  B 

El componente de intensidad, I :
1
I  R  G  B 
3

Se asume que los valores de RGB están normalizados en el rango
[0,1] y que el ángulo  se mide respecto al eje rojo del espacio HSI.
Conversión HSI a RGB

Dados HSI ahora queremos encontrar los componentes RGB. Las
ecuaciones a utilizar dependen del valor del ángulo H. Existen tres
sectores de interés correspondientes a los intervalos de 120° de
separación entre los colores primarios.

Sector RG (0°  H < 120°):
B  I (1  S )

S cos H 
R  I 1 


cos(
60

H
)


G  3I  ( R  B )
Conversión HSI a RGB

Sector GB (120°  H < 240°): Si H está en este sector primero le
restamos 120° : H = H - 120°
R  I (1  S )

S cos H 
G  I 1 


cos(
60

H
)


B  3I  ( R  G )
Conversión HSI a RGB

Sector BR (240°  H  360°): Si H está en este sector primero le
restamos 240° : H = H - 240°
G  I (1  S )

S cos H 
B  I 1 


cos(
60

H
)


R  3I  (G  B)
Conversión HSI a RGB
Imagen RGB realzada
Imagen RGB oscura
HSI
Expansión
de I
RGB
Modelo HSI
 Los ejemplos sobre la utilidad de este modelo van desde el
diseño de sistemas automáticos para determinar el grado
de maduración de frutas y otros vegetales, hasta sistemas
para comparar muestras de color o inspeccionar la calidad
de productos coloreados.
Instituto de Investigaciones en
Matemáticas Aplicadas y en Sistemas
(IIMAS)
http://turing.iimas.unam.mx/~elena/Teaching/PDI-Mast.html
Descargar

modelo de color - Departamento de Ciencias de la Computación