Más cerca de las interfaces gestuales

[youtube]http://www.youtube.com/watch?v=gOtPVof2K94[/youtube]

Es una de las manías de la casa: las características técnicas de un ordenador de hoy no se parecen en nada a las que tenía hace 15 años… pero seguimos interactuando con él de la misma forma: el mismo teclado, el mismo ratón (o el mismo touchpad, por muy multitouch que sea). Y una de las cosas que «nos llama» son las webcams y el reconocimiento facial (y gestual).

Mi ordenador debería ser más que suficientemente potente como para [en condiciones de luz suficiente] reconocerme, saber si llevo las gafas puestas, si me he afeitado, si sonrío, si saco la lengua o si estoy mirando a la pantalla de la derecha o de la izquierda [y, si me apuras, a qué punto de esa pantalla estoy mirando]. Y, también, desde luego [con un objetivo de ojo de pez, vale], para saber dónde tengo los brazos y las manos y qué gestos estoy haciendo. Y eso, más el reconocimiento de voz (asistido por la lectura de labios) debería servirme, hoy, para interactuar con el ordenador. Y no lo hace. Pero estamos un poco más cerca: si Sony puede empaquetar bastantes cosas con respecto a las caras en un SDK para la Playstation 3, igual algún día sí tiene sentido comprarse una buena webcam para el ordenador. Crucemos los dedos…

Vía Engadget.

Microsoft Touchless: la webcam como interfaz

Microsoft Touchless es capaz de reconocer la punta de un rotulador como interfaz de usuario en esta captura de pantalla de una demo
Aplicación de demo de Microsoft Touchless

Interesante movimiento el de los Microsoft Office Labs (aunque, la verdad, no me acaba de cuadrar la parte de ‘office’) con el lanzamiento, en abierto (Microsoft Public License) del Touchless SDK, un kit de desarrollo de software que permite a los usuarios crear y experimentar aplicaciones ‘multitouch’. El ‘paquetito’ contiene documentación y DLLs para los que quieran jugar con el SDK (con Visual Studio 2005, 2008 o la gratuita Express Edition).

Touchless no es el colmo de la sofisticación. Ni siquiera «cutting edge». Es un motor tirando a sencillo que explota técnicas no muy avanzadas de reconocimiento de imágenes para buscar objetos «llamativos» en las imágenes capturadas por la webcam y usarlos como marcadores que luego se utilizarán para interactuar con la aplicación de turno. No debería costar mucho, por ejemplo, poner un par de objetos brillantes en los extremos de mis gafas y controlar un juego de coches inclinando la cabeza hacia los lados y alejándome o acercándome a la pantalla… Pero poner al alcance de todos los desarrolladores ‘Visual’ la librería, por poco que se lo miren, debería dar pie a más de una aplicación interesante e innovadora.

Con un poco de suerte, la cosa seguirá avanzando por estos derroteros y dentro de unos meses una aplicación podrá ver si sonrío o no, o reconocer gestos hechos con las manos, y habremos dado un pasito más en el camino de la interacción persona ordenador…

Vía.

PS Para los interesados en el tema, lectura interesante. Especial atención al primer vídeo (¡de 2006!) que incide sobre el tema de la webcam como interfaz…