Con el descubrimiento en la entrada anterior de Open, el blog sobre código abierto del Times, me he dado el inevitable ‘chapuzón’ por sus archivos. Y no he podido saltarme tres entradas muy relacionadas con un problema que Isma comentaba por aquí hace unas semanas: cómo narices navegar por el alud de información que genera un diario cada día. Un problema para nada trivial. Open se ha detenido hasta tres veces en el tema:
- En octubre, con Messing Around With Metadata se paraban casi en los mismos problemas que Isma: desambiguación, sumarización, normalización y taxonomías a partir de etiquetas.
- En diciembre tocaban el tema de los microformatos con The Magical Minimalism of Microformats y la gran revolución que pueden aportar a la futura web semántica.
- Finalmente, a principios de este año tenemos Mining the Collective Intelligence of NYTimes.com Users, en el que tratan sobre cómo usar la minería de datos para extraer conocimiento de la actividad de el hormiguero de usuarios que navegan diariamente por sus archivos…
Tres entradas más que recomendables para los interesados en la cosa esta de la web semántica…