por Victor » Sab Sep 09, 2006 9:24 pm
Con respecto al tema de imágenes, siento que no esté debidamente explicado, pero es el extracto de una conferencia que dí en Zaragoza en Junio de este año.
1. Representación Digital de la Información Visual
a. Píxeles, canales y componentes.
Las imágenes digitales se guardan como una sucesión de puntos individuales o píxeles. Cada píxel tiene una cierta información asociada que representa un color.
También se podría decir que una imagen es una suma de tres capas de imágenes más simples o canales.
Efectivamente una imagen es un conjunto de píxeles y cada píxel tiene una información color característico asociado. Pero el color del píxel realmente viene dado por tres componentes específicos que son el valor de rojo, verde y azul. Usando una combinación de estas tres intensidades de color podemos representar todo el espectro cromático visible en un píxel.
b. Resolución espacial.
Hay diferentes maneras de medir la cantidad de información que está contenida en una imagen digital.
La más simple es simplemente contar la cantidad de píxeles que contiene dicha imagen. Nos estamos refiriendo a la resolución espacial de la imagen y viene dada por el área de la misma.
De este modo una imagen que tiene 500 píxeles de alto por 500 píxeles de ancho contendrá 250.000 píxeles. Como la mayoría de las imágenes no son cuadradas, especificando el número de píxeles no nos bastará, por ello, para especificar la resolución espacial de una imagen la designaremos por su ancho por alto. Por ejemplo 1024 x 768 píxeles.
c. Resolución de profundidad.
Cada componente de un píxel puede ser representado por un número arbitrario de bits. Un bit es la representación más simple de información y tiene asociado dos valores que son 0 y 1.
Si representamos el color con un solo bit, tendremos que éste puede ser 0 o 1, o lo que es lo mismo, blanco o negro.
El número de bits que posee un componente se le denomina profundidad de bits y es el modo en el que se mide la resolución de color.
En una imagen un mayor número de píxeles dará lugar a una imagen con más finura de detalle, mientras que un mayor número de bits por componente dará a una mayor riqueza cromática.
La profundidad de bits, es decir, la resolución de profundidad también se la conoce como resolución de color o resolución dinámica o incluso como resolución cromática.
Dado que una resolución de profundidad de 1 bit da lugar a solo dos colores, que son el blanco y el negro, será necesario dotar a cada componente o de un mayor número de bits.
Normalmente se trabaja con una resolución de 8 bits por componente, es decir 8 bits asignados a rojo, 8 bits asignados al verde y 8 bits asignados al azul.
8 bits de profundidad significan 28 que es igual a 256 niveles. Con lo que 8 bits por componente son 256 diferentes tonos del mismo componente.
Como hemos dicho que una imagen está compuesta por los diferentes valores de los componentes, Tenemos que una imagen de 8 bits por componente puede tener 16.777.216 colores diferentes que es básicamente la escala cromática que es capaz de captar el ojo humano.
Aunque parezcan mucho colores no es ni de lejos la capacidad cromática que puede tener por ejemplo una película de celuloide que digitalizada puede tener una resolución de profundidad de 16 bits por componente con lo que da un total de 281 billones de colores diferentes.
d. Normalización de valores.
Como las imágenes pueden poseer diferentes resoluciones de profundidad y consecuentemente pueden representarse por diferentes rangos numéricos es referirse al valor del píxel como un número racional comprendido entre 0 y 1.
De este modo para una componente de 8 bits la equivalencia sería de 0 = 0, 255 = 1 Por tanto un píxel cuyo valor sea de 128 tendremos que su valor normalizado es de 0.5 Si por ejemplo tuviésemos un valor de píxel de 512 correspondiente a una resolución de profundidad de 10 bits su valor normalizado sería de 0.5
Es así como se puede trabajar con valores normalizados independientemente de si la imagen posee una resolución de profundidad de 4 bits o de 24 bits por componente.
e. Espacios de color RGB y HSV.
Hasta el momento no hemos referido al color como el conjunto de tres componentes que son el rojo, el verde y el azul. RVA en español o RGB en inglés. Este modelo o espacio de color, ciertamente es el más común y es en el que se basa la coloración del celuloide y la captación de imágenes de video y fotografía.
Existe otro espacio de color conocido como HSV. HSV se refiere a (en inglés) Hue, Saturation y Value.
Hue de un píxel se refiere a su color básico. Se representa como un valor del rango de 0 a 360, refiriéndose en una escala circular a su posición.
Saturation es el brillo o pureza de un valor Hue específico. En nuestra paleta circular veremos que radialmente varia la saturación de un color, o su pureza.
Value viene a referirse al valor de rojo, verde o azul de un Hue dado. Efectivamente con valores bajos de rojo verde y azul tenemos como resultado el color negro.
Hay que señalar que el uso del espacio de color HSV no está pensado para guardar información de color de una imagen sino para manipularla.
f. Canales adicionales.
Hasta ahora hemos hablado de imágenes formadas por tres componentes y cada componente tenía asignado un canal. De este modo una imagen se podía dividir en tres canales, uno por componente. Pero las imágenes pueden contener más canales aunque no tengamos más componentes cromáticos que asignar.
Para aumentar la información de una imagen sin necesidad de modificar la que ya está contenida en cada uno de los tres canales básicos que la conforman, aumentamos el número de canales de dicha imagen. Si por ejemplo queremos dotar a la imagen de información respecto a su transparencia, añadiremos un canal más. Como la información que necesitamos no es de tipo cromático, dicho canal no estará conectado con los canales de las componentes con lo obtendremos una escala de valores definida por la resolución de profundidad.
Por ejemplo en una imagen de 32 bits de resolución de profundidad tendríamos los tres canales correspondientes a las tres componentes RGB, cada uno de 8 bits más un cuarto canal con una resolución de profundidad e 8 bits igualmente con información de transparencia. A mayor valor dentro del rango mayor transparencia, por ejemplo: un valor de 255 significaría transparencia total.
2. Formatos: Resolución y Aspect Ratio
a. Display aspect ratio
El display aspect ratio de una imagen proporciona información sobre la proporción de la imagen.
El display aspect ratio o simplemente aspect ratio de una imagen es la relación entre el ancho y el alto de la misma. La notación que se utiliza puede ser o bien una rlación de números lo más enteros posibles como puede ser 4:3 o 16:9 o bien la división de las dos magnitudes, es decir ancho y alto siendo para el caso de 4:3 1.33 y para el caso de 16:9 1.77.
b. Píxeles no cuadrados y Píxel aspect ratio
Hemos determinado que el aspect ratio de una imagen es el resultado de dividir la altura entre la anchura, pero hay situaciones en que de este modo no se obtiene el verdadero formato que se está usando. Esto sucede porque los displays modifican la relación ancho-alto de la imágenes.
El cine y el video posee formatos en los que la relación de aspecto (aspect ratio) de la imagen es diferente de la original digital. Nos referimos a sistemas que poseen píxeles no cuadrados. No cuadrados significa que el ancho y el alto del píxel no son iguales.
Esta relación ancho-alto de un píxel no cuadrado puede ser representada como el aspect ratio. Para distinguirla de la relación de aspecto de la imagen, la llamamos Pixel Aspect Ratio.
En un monitor de ordenador normal el píxel aspect ratio es de 1:1, con lo que la anchura es la misma que la altura.
En el caso de trabajar con imágenes provenientes de cine, donde la distorsión viene producida por las lentes donde no hay píxeles en los que identificar el píxel aspect ratio, hablamos de formatos anamórficos.
c. Resolución dependiente de aspect ratio
En función de las necesidades, el formato de una imagen puede especificarse vía resolución, aspect ratio o ambos.
Por ejemplo, si hemos de generar imágenes para cine, sabemos que el aspect ratio será de 1.85, con lo que la resolución de la imagen a generar será a nuestro libre albedrío en función de las necesidades de calidad. Por ejemplo una imagen renderizada a una resolución de 640x346 posee un aspect ratio de 1.85, válido para cine; pero con toda seguridad, la resolución de la imaegn no será, ni de lejos, suficiente para la calidad necesaria.
Saludos.