Para webmasters curiosos, y con una cuenta en Google (sirven las de GMail y las del dichoso Analytics, por ejemplo), te puedes ir a la página de Google Sitemaps, irte a la parte de abajo, meter la URL de tu sitio, seguir un proceso de verificación (te dan un nombre de archivo HTML, creas un archivo vacío con ese nombre y lo subes a la raíz del sitio, y así se creen que les estás preguntando por un sitio de tu propiedad), y a partir de ya Google te explica cuáles son las búsquedas Google más populares que devuelven tu sitio como resultado, las consultas en que la gente hace click con más frecuencia, estadísticas de la distribución de páginas por las que se ha pasado el robot (ahora mismo Data is not available at this time. Please check back later for statistics about your site
), un análisis de cómo ve el robot tu sitio (de nuevo, Data is not available at this time. Please check back later for statistics about your site
:-( ) y enlaces a las búsquedas típicas que hace uno para ver cómo está en Google: site: (ahora mismo me tienen idexadas 10.100 páginas), allinurl: (devuelve 10.600, pero claro, 10.100 son mías…), link: (865), cache: (llevan un retraso de unas 24 horas, ¡intolerable! :-P) y related:. (Vía)
Cuando funcionen las ‘crawl stats’ y el ‘page analysis’ ya contaré… En esencia, las ‘crawl stats’ te dicen si el robot ha podido navegar con comodidad por el sitio (que mayormente sí, aunque estaría bien ponerle 301s a las cosas que me he cargado, y ahorrarle trabajo al pobre ‘spider’) y la distribución de páginas con pagerank alto, medio y bajo (qué deprimente, señor…). El ‘page analysis’ parece menos interesante, y sólo te cuenta los ‘encodings’ y tipos de ficheros que ve el robot en el sitio.