¿Qué hacer con cuatro terabytes de datos?

Impresionante lo que se puede llegar a hacer cuando uno tiene un presupuesto para desarrollos tecnológicos como el del New York Times, lo junta con unas pocas décadas de diarios que han pasado al dominio público, lo adereza con la infraestructura de almacenamiento barato de Amazon y le añade unas gotas de cloud computing, también cortesía de Amazon

Cuentan en Open, el blog sobre código abierto en el Times, cómo han tomado 70 años de archivos bibliográficos (de 1851 a 1922), que estaban repartidos en infinidad de TIFFs (y estamos hablando de una aproximación bastante razonable del infinito, por lo que cuentan: unos cuatro terabytes), los han subido a S3 y han usado EC2 (más una buena colección de código abierto) para generar once millones de PDFs (apenas un gigabyte y medio de documentos) en 24 horas…

De hecho, eso es lo que hicieron en noviembre pasado. Porque ahora, en un «más difícil todavía» de los que dan vértigo, han lanzado una herramienta web para navegar por ese mar de información: la muy impresionante TimesMachine, con la que uno puede, por ejemplo, leerse la primera página del diario anterior en cien años a su nacimiento:

Primera página del Times del 19 de septiembre de 1873

Demos gracias, pues, al código abierto, a la ley de Moore y, sobre todo, a la duración limitada del copyright y a la amplitud de miras de la gente del New York Times por algo tan maravilloso (que lamentablemente diarios centenarios de por aquí como La Vanguardia o ABC tardarán mucho en imitar, me da a mí la impresión).

Fin de semana musical en la red

Intenso fin de semana, sí señor:

  • En breve estará disponible la descarga de la beta del cliente de Qtrax, modelo «música gratis a cambio de publicidad» (un modelo tan innovador que las FMs del mundo llevan unas cuantas décadas viviendo divinamente de él).
  • Amazon anuncia que su estrategia en la venta de MP3, efectivamente, es «first we take Manhattan, then we’ll take Berlin».
  • Sony Ericsson anuncia que ha firmado con unas cuantas discográficas (entre ellas Sony BMG, Warner Music y EMI) para añadir algo así como tres millones y medio de pistas a su servicio de descargas musicales PlayNow, disponible para sus móviles en 32 países.

Todo esto, desde luego, después de que CBS avisara de que su iniciativa de música gratis en last.fm no está yendo mal

Casi ná.

Amazon también juega a las redes sociales

En Mashable tienen la noticia del día: resulta que Amazon.com, sin anunciarlo, también se ha lanzado al juego de las redes sociales. Si uno va a su perfil se encuentra con la sorpresa de que ha adquirido una página pública al estilo Facebook, con privacidad controlada (la granularidad es la habitual en estos casos: privada del todo, para amigos o pública completamente) en la que aparecen nuestras últimas compras, la capacidad de invitar a amigos, las últimas novedades de nuestra red social, una gestión de calendarios en la que añadir (por ejemplo) cumpleaños en los que deberíamos hacer un regalo…

Otra de las características interesantes es «Your media library» (tienen un blog en el que compruebo que existe ¡desde abril!), a la que es fácil incorporar cualquier ítem comprado en la tienda, pero también cualquier otro de nuestra mediateca particular (cuentan, incluso, con un lector de códigos de barras a través de webcam que tengo que probar). Debe contarse, eso sí, con que aunque su base de datos es enorme tienden a la lengua inglesa (a ver para cuándo lanzan un amazon.es). Se puede, naturalmente, marcar qué cosas queremos compartir con el público y cuáles no (todo el mundo tiene discos de los 80 que mejor no enseñar a nadie :-P). Como es natural, es fácil generar un ‘widget’ que añadir a cualquier página web:

Naturalmente, se cuenta con la posibilidad de añadirle una «Amazon Associates ID» a la cosa y obtener un dinerillo extra por ello (aún no cuento con él, pero todo se andará).

Si alguien quiere curiosear, mi (incipiente) ‘media library’ es esta.