martes, 30 de marzo de 2010

Some cuestiones para analizar...

Estos son algunos temas que se me ocurre debería tener en cuenta a la hora de desarrollar el software de reconocimiento de imágenes:

1. Cómo reconocer los colores? Podría ser una herramienta útil el cuentagotas de Photoshop (o Paint) que te dice exactamente qué color es en cuanto RGB.

2. Cómo reconocer formas? Tal vez uno de los puntos más dificiles del proyecto...

  • Podría hacerse a partir de formas predeterminadas (ej. cuadrado, círculo, elipse, rectángulo, triángulo, rombo, etc.).
  • Podría ser mediante la agrupación de esas formas predeterminadas hasta que coincide con la forma real de la imagen.
  • Si fuesen polígonos los de la forma real, podría ser tenido en cuenta la cantidad de lados, ángulos y tamaño.
  • Si fuesen formas irregulares, las opciones anteriores no servirían (al menos en ppio.) y habría que tener algún otro método. Se me ocurre algún tipo de ecuación o inecuación trazada dentro del plano (con ejes X e Y) en el cual se muestran. Esta opción serviría eventualmente para el upgrade del software a una versión que reconozca 3D (tirando un eje más, Z) y tal vez 4D. En el caso de 4D ya habría que determinar una medida que separe los frames (fps, por ej.), logrando que cada frame fuese parte del nuevo eje de esa dimensión sobre la cual se traza la ecuación o inecuación.
  • Podría ser con todas las opciones anteriores en conjunto....no debieran ser excluyentes entre si.
3.  Cómo lee el software una imagen? Este tal vez sea uno de los puntos más complicados y del cual depende el problema 2.

  • Una imagen, es cuánto tiempo de duración de los sonidos? Es un segundo? es un solo acorde de sonidos? o son muchos segundos determinados por la cantidad de pixeles?
  • Una imagen, debería leerse de alguna manera y esa lectura implica el tiempo que dura la experiencia sonora? O sea.... debería leerse pixel por pixel para determinar el color y cada pixel dispara un sonido? Si es así, cómo reconocés las formas descriptas en el problema 2 si una forma consiste de muchos pixeles?
  • De qué manera lee el software la imagen? de izquierda a derecha y de arriba a abajo? de arriba a abajo todo junto? en forma centrípeta? en forma centrífuga?
  • Se lee pixel por pixel? se lee de a varios pixeles? 
  • Se reconocen las formas y luego se dispara finalmente un sonido para cada forma?  
  • Y si una forma tiene muchos colores? qué tipo de sonido dispara? un acorde (por ser muchos pixeles de distintos colores) por forma o un acorde (por ser muchas formas) por color?
Soluciones a los problemas anteriores:
- Solución A: tomar ciertas hipótesis como punto de partida de la experiencia y desarrollar el software arbitrariamente a partir de estas.

- Solución B: estudiar factibilidad de cada opción y elegir entre las posibles, la mejor.

- Solución C: desarrollar todas y dar la posibilidad de elegir a quien va a experimentar antes de comenzar la experiencia. Sería como la elección de una plantilla en photoshop...uno elige el tamaño, la paleta de colores, etc.


...algún otro problema más???

No hay comentarios:

Publicar un comentario