Validación de enlaces

En un blog como este, que parece que no hace más que publicar enlaces, lo efímero de las páginas web hace que parte de la información publicada caduque, y a veces muy rápidamente. Al cabo de unos días (a veces, unas horas), los enlaces ‘se mueren’ (el fenómeno se conoce como link rot, en inglés). Para los lectores habituales no es un gran problema (ya que han seguido el enlace poco después de que se publicara, si es que les interesaba), pero para los que llegan desde buscadores, la cosa tiene algo más de importancia…

En fiftyfoureleven.com reflexionan sobre el tema. Su idea es almacenar los enlaces en una tabla aparte de la base de datos, y con un robot, comprobar periódicamente la validez de los enlaces. Si un enlace da un 404, lo ponemos en una lista de ‘malos’ y, al cabo de un tiempo, volvemos a comprobar si el fallo era temporal (y ‘perdonamos’ al enlace) o tiene pinta de ser permanente (y lo invalidamos). La siguiente mejora es no invalidarlo, sino sustituirlo por una copia en caché de algún tipo, para lo que sugieren el caché de Google, o de dar alternativas listando otras páginas que enlazan al mismo sitio vía un sitio como Technorati. (Bueno, también habla de redirigirlo si da un 301, y de matarlo directamente si da un 410.)

Se me ocurren un par de cosillas que añadir:

  • Furl guarda en caché copia de los enlaces que uno almacena (imagino que del.icio.us también) en el momento en que lo almacena 8a no ser que el sitio enlazado lo impida…). Si uno almacenase con el enlace la referencia Furl correspondiente, no debería ser difícil ofrecer la copia Furl como alternativa…
  • Por otro lado, mantener los enlaces en tabla separada es una buena opción si uno mantiene un ‘linkblog’ aparte, pero no es una alternativa para este blog (ni otros muchos). Aquí necesitaríamos algo más complicado, que entrara en cada entrada de la tabla de posts de WordPress, buscara los enlaces, los siguiera y marcara de alguna forma los problemáticos (se me ocurre usar <del> o usar un rel="deadlink" o similar, con un poco de CSS y JavaScript…).

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *