Gestionando correo

Un par de artículos sobre correo y minería de datos. En el primero, muy originalmente titulado Data Mining Email explican cómo convertir un buzón mbox (un estándar que usa, por ejemplo, Mozilla) a una base de datos PostgreSQL y algo (bastante) de Perl. En el segundo, Creating Custom Email Queries (que parece bastante más difícil de seguir) hablan de montar una base de datos como back end de un sistema ya existente de correo.

(Todo viene de la curiosidad por el funcionamiento de GMail, combinado con el agobio nuestro de cada día de gestionar mi correo (que no será tan aplastante como el de algunos, pero no está mal), más un renovado interés por las bases de datos y esto de la minería de datos, que con los volúmenes de información que movemos, digo yo que es un campo con futuro.)

[Escuchando: Everybody Getting High – Mick Jagger – Goddess In The Doorway]

Albergar imágenes

ImageShack parece un servicio muy interesante. Promete albergar de manera gratuita imágenes de hasta 850 ks de peso. El procedimiento es sencillo: se busca la imagen, se le da a un botón, la imagen sube al servidor y este da, a cambio, la dirección, en diversos formatos (cómo código para colgar en un foro, en XHTML (ambas con versión thumbnail generado automáticamente (si la imagen subida pasa de 200×200)) y, finalmente, como URL ‘pura y dura’. Si no se quiere, no hace falta ni siquiera registrarse. Y prometen una vida de un año para cada imagen, que se pone a cero cada vez que se visualiza.

En caso de acceder a la imagen vía la URL, nos aparecerá en una página con publicidad, pero si se inserta la imagen en una página, no hay contrapartida aparente lo único que pasa es que debes ponerle un alt=»Image Hosted by ImageShack.us». No es lo pejor para la accesibilidad, pero tampoco es el peor precio (vale, sí, una página con 20 imágenes seguidas con ese alt es un poco tortura china para un ciego con un lector de páginas…). Yo tampoco sé como lo hacen (se agradecerá cualquier pista), pero lo hacen. Como experimento, la imagen de hace dos posts ahora vive en ImageShack (y sin el «alt» no ha funcionado).

Como última limitación, se reservan el derecho de eliminar imágenes que consuman un ancho de banda excesivo. Faltaría, claro, que definiesen ‘ancho de banda excesivo’ (me juego algo a que usar el sevicio para albergar la foto del balón de Beckham en la dichosa subasta sería considerado excesivo, y dudo que un sitio con 200 o 300 visitas diarias lo fuera, pero nunca se sabe), pero por el precio, es difícil quejarse.

Supongo que sirve para demostrar que el espacio en disco y el ancho de banda son cada día más baratos.

Finalmente, comentar su rango en Alexa, que en el momento de escribir esto, es de 1,857 (im presionante, yo ahora mismo ando rondando la posición un millón, y el sitio en el que trabajo baila entre el 2,000 y el 6,000, y no es pequeño).

Inclasificables

Una comparación de algoritmos de ordenación. Curioso.

Una colección de herramientas para hackers (entendidos más como piratas que como programadores brillantes, en este caso).

De stream RealAudio a MP3, entre otras cosas.

Una biblioteca de textos de libre distribución, formateados para Palm y Microsoft Reader: la Ebook Library at the Electronic Text Center, University of Virginia.

Una «historia de la informática» (o más bien del escritorio) desde el punto de vista NADD.

Para tocar desde un XC90 de Lego.

Herramientas de línea de comandos en Windows XP.

¿El fin del mundo se acerca?

Image Hosted by ImageShack.us

La noticia en CNet.

Otra aplicación en la web

Creo que voy a comenzar a usar una nueva aplicación web: Webnote es una pantalla de post-its. Tiene un defecto importante, y es la falta de seguridad: todo el mundo puede acceder a todos los datos, ya que sólo pide nombre de usuario (y no contraseña), pero para lo que lo voy a usar, creo que puedo permitirme correr el riesgo.

Además, el código (en Python) está disponible bajo licencia BSD.