7 abr 2013

Cómo visualizar las páginas y etiquetas indexadas de tu blog o sitio web en Google

Con este artículo sobre el uso de Herramientas de Webmasters, aprendimos algunos principios de optimización aprovechando la potencia de este conjunto de utilidades web de Google. Muchos os plantearéis cómo podéis ver las páginas indexadas por Google.
Descubre cómo el buscador interactuará con tu sitio web cuando otros usuarios lo busquen.

Con esta sencilla instrucción podéis ver cómo reconocerlas.



1) Escribe en la barra de direcciones de tu navegador la dirección www.google.com.

2) En la caja de búsqueda de Google escribe el comando que a continuación te expongo:

[site:sitio_web_o_nombre_blog]
  • Donde "site:"  te muestra los resultados indexados de tu blog o sitio en Google. Por ejemplo, tendrías que poner en la caja de búsqueda de Google para ver los resultados indexados de un blog de blogger: 
site:nombre_blog_blogger.blogspot.com.es 
  •  Donde nombre_blog_blogger sería el nombre de tu blog.
3) Para ver las etiquetas que has utilizado indexadas por Google escribe el comando que a continuación en la caja de búsqueda de Google:

[site:sitio_web_o_nombre_blog/search/]
  • Donde "site:"  te muestra los resultados indexados de tu blog o sitio en Google. Por ejemplo, tendrías que poner en la caja de búsqueda de Google para ver los resultados indexados de un blog de blogger: 
site:nombre_blog_blogger.blogspot.com.es 
  •  Y search, la lista de etiquetas indexadas.
Ten en cuenta que el proceso de indexado no tiene porqué haber tomado todas tus entradas o todas tus etiquetas tal y como se explica en las herramientas web de Google.

El conocimiento de esta información, puede servirte para saber cómo interactuará el buscador con los usuarios y adaptarte de la mejor manera. .


Escrito por Miguel García Sánchez - Colomer

Dispuesto a ayudarte con tu Blog en todo lo posible, Diarios de la nube es mi medio para llegar hasta ti. El conocimiento es universal, es del mundo, es de todos, esta es mi parte y la comparto contigo.

32comentarios:

  1. Hola Miguel:
    He seguido tu primer punto donde pone site y la url del blog y sólo ha aparecido lo que te muestro a continuación:
    "baños - oasisingular - inne's blog
    oasisingular.blogspot.com.es/search/label/bañosCompartirNo hay disponible una descripción de este resultado debido al archivo robots.txt de este sitio. Más información"
    que corresponde a una sóla etiqueta y no aparece nada más. ¿a ti que te parece? Yo lo veo muy mal ¿no?

    Espero con impaciencia tu respuesta. Grácias,

    MAR

    ResponderEliminar
    Respuestas
    1. Otra cosa Mar, estás realizando la busqueda con search/label, lo que implica es que es posible que no rstrs haciendo uso de las etiquetas. Lee mi entrada sobre las etiquetas y comentame si las estas utilizando en tu web.

      Eliminar
  2. No es tan malo, vayamos por partes, disculpa si cometo errores escribiendo pero estoy desde el móvil. ¿Has tocado por error el archivo robots.txt de tu sitio web o blog?. Si así fuera, no pasa nada porque se puede modificar. Pero no lo toques directamente si no sabes lo que puedas cambiar. Verás, ese archivo le dice a los robots rastreadores de google qué no está permitido indexar y qué si está permitido. Es posible que dentro del archivo tengas el comando Disallow, para no permitir que se vea algo. Si quieres copialo y pegalo quitando los fatos privados de tu web y tratamos de solucionar el inconveniente. Pero no te preocupes que no es nada que pueda dañar tu web, es la forma en que ese archivo le ha dicho a los rastreadores de google lo que deben añadir al índice.

    Lo dicho, ponmelo y lo tratamos, procura cuando lo metas en comentarios que no salga el nombre de tu web para que preservemos tu privacidad lo mejor posible.

    No te preocupes que lo arreglamos.

    Un saludo.

    ResponderEliminar
  3. Hola, y muchísimas grácias por contestar tan pronto.
    Este es el archivo robot personalizado que modifiqué con ayuda de Jesús Aguirre (lo modifiqué el viernes 5)

    # Blogger Sitemap generated on 2013.04.05
    User-agent: *
    Disallow: /search
    Allow: /
    Sitemap: http://he quitado el nombre del blog/atom.xml?redirect=false&start-index=1&max-results=500

    Tal como me has recomendado, he quitado el nombre del blog.
    Nuevamente muchas grácias por tu ayuda.

    MAR

    ResponderEliminar
    Respuestas
    1. Haz los pasos de soporte google y dime los resultados:

      Para probar el archivo robots.txt de un sitio, sigue estos pasos:
      En la página principal de las Herramientas para webmasters de Google, haz clic en el sitio que quieras.
      En la opción de estado, haz clic en URL bloqueadas.
      Si aún no se ha seleccionado, haz clic en la pestaña Probar robots.txt.
      Copia el contenido del archivo robots.txt y pégalo en el primer cuadro.
      En el cuadro URL, indica el sitio en el que quieras probar el archivo.
      En la lista User-agents, selecciona los user-agents que quieras.

      Eliminar
    2. Mar, ¿qué resultados te salieron de la prueba que te he comentado para el archivo robots?.

      Un saludo,

      Eliminar
    3. Hola,
      Me sale:
      Bloqueado por la línea 3: Disallow: /search

      Eliminar
  4. Hola otra vez:
    "Otra cosa Mar, estás realizando la busqueda con search/label, lo que implica es que es posible que no rstrs haciendo uso de las etiquetas. Lee mi entrada sobre las etiquetas y comentame si las estas utilizando en tu web"
    Estoy utilizando las etiquetas y he realizado la búsqueda con el site y me dice que no hay resultados????

    ResponderEliminar
    Respuestas
    1. search label es para utilizar en la barra de direcciones del navegador, no como comando en la caja de Google. Por eso no te salen las etiquetas.

      Si lo quieres hacer en la caja de Google pondrías site:sitio_web_o_nombre_blog/search/

      De todas maneras, creo que aún no se han indexado tus etiquetas y entradas.

      Sigue los pasos que hago en la entrada:

      http://diariosdelanube.blogspot.com.es/2013/04/mejora-tu-posicionamiento-web-optimiza.html

      Concretamente realiza una secuencia como esta:

      en herramientas para webmasters, en el menú de la izquierda, te metes en "Optimización" y acto seguido en "sitemaps". En la pantalla que te sale, pulsa el botón de arriba a la derecha que pone "Añadir o Probar sitemap". Cuando le des al botón te saldrá una pequeña ventana en la que te sale tu URL terminada en una caja de texto para meter "sitemap.xml". Pon sitemap.xml y pulsa "Enviar sitemap". Esto hará que te diga Google la lista de página que tienes indexadas y las que aún están por indexar.

      Después, repite la operación explicada, pero esta vez en lugar de darle a "Enviar sitemap.xml" dale a "Probar sitemap". Comprueba que no haya errores.

      Cuando hayas terminado esos pasos, continuando con las instrucciónes que te puse en la entrada sobre las herramientas web de Google, ve a la opción de menú "Salud" y después "Explorar como Google", pulsa en esa pantalla el botón "Recuperar" sin ponen NADA en la caja de texto y elige la opción "URL y páginas vinculadas", verás que en la lista de abajo en la columna "Estado Solicitudes de Rastreo" te saldrá "Correcto". Si te pone un botoncito en la misma fila donde te aparece correcto en el que pone "Pendiente de enviar al índice" haz el envío.

      Me vas contando los resultados y las dudas. Haz todo con cuidado y no repitas las operaciones innecesariamente, esto basta con que se haga una vez. Es para asegurarnos de que añades tus páginas al índice.

      Ten paciencia porque los resultados no se ven en el mismo día, tarda un tiempo (puede llegar a una semana o más) en añadir parte de tus entradas y etiquetas (nunca todas).

      Ve comentándome tus resultados y dudas conforme realices los cambios.

      Eliminar
    2. Hola otra vez,
      He enviado sitemap y me indica 10 errores, después he probado sitemap, y me indica lo que pongo a continuación:

      "Se ha producido un error al intentar acceder al sitemap. Asegúrate de que cumpla nuestras directrices y de que se encuentre en la ubicación especificada y vuelve a enviarlo.
      1
      Error general de HTTP: 404 - Página no encontrada"

      Evidentemente, ya no he seguido con tus indicaciones hasta esperar tus comentarios para resolver los errores. Grácias!!

      Eliminar
  5. Hola, yo he puesto lo de site y me ha salido esto:No hay disponible una descripción de este resultado debido al archivo robots.txt de este sitio. ¿Cómo lo puedo solucionar? Muchas gracias.

    ResponderEliminar
    Respuestas
    1. Hola Noemí, comprueba el archivo robots tal como indica google y me comentas los resultados:
      Para probar el archivo robots.txt de un sitio, sigue estos pasos:
      En la página principal de las Herramientas para webmasters de Google, haz clic en el sitio que quieras.
      En la opción de estado, haz clic en URL bloqueadas.
      Si aún no se ha seleccionado, haz clic en la pestaña Probar robots.txt.
      Copia el contenido del archivo robots.txt y pégalo en el primer cuadro.
      En el cuadro URL, indica el sitio en el que quieras probar el archivo.
      En la lista User-agents, selecciona los user-agents que quieras.

      Eliminar
    2. El archivo pone esto:
      User-agent: Mediapartners-Google
      Disallow:

      User-agent: *
      Disallow: / búsqueda
      Allow: /

      Mapa del sitio: http://nombre del blog/feeds/posts/default?orderby=UPDATED

      De nuevo muchas gracias. Saludos.

      Eliminar
    3. Es exáctamente como el mío. Lo que debe pasar es que has creado el blog relativamente hace poco o has hecho una solicitud de indexación relativamente hace poco.

      Realiza una secuencia como esta:

      en herramientas para webmasters, en el menú de la izquierda, te metes en "Optimización" y acto seguido en "sitemaps". En la pantalla que te sale, pulsa el botón de arriba a la derecha que pone "Añadir o Probar sitemap". Cuando le des al botón te saldrá una pequeña ventana en la que te sale tu URL terminada en una caja de texto para meter "sitemap.xml". Pon sitemap.xml y pulsa "Enviar sitemap". Esto hará que te diga Google la lista de página que tienes indexadas y las que aún están por indexar.

      Después, repite la operación explicada, pero esta vez en lugar de darle a "Enviar sitemap.xml" dale a "Probar sitemap". Comprueba que no haya errores.

      Cuando hayas terminado esos pasos, continuando con las instrucciónes que te puse en la entrada sobre las herramientas web de Google, ve a la opción de menú "Salud" y después "Explorar como Google", pulsa en esa pantalla el botón "Recuperar" sin ponen NADA en la caja de texto y elige la opción "URL y páginas vinculadas", verás que en la lista de abajo en la columna "Estado Solicitudes de Rastreo" te saldrá "Correcto". Si te pone un botoncito en la misma fila donde te aparece correcto en el que pone "Pendiente de enviar al índice" haz el envío.

      Me vas contando los resultados y las dudas. Haz todo con cuidado y no repitas las operaciones innecesariamente, esto basta con que se haga una vez. Es para asegurarnos de que añades tus páginas al índice.

      Ten paciencia porque los resultados no se ven en el mismo día, tarda un tiempo (puede llegar a una semana o más) en añadir parte de tus entradas y etiquetas (nunca todas).

      Ve comentándome tus resultados y dudas conforme realices los cambios.

      Eliminar
  6. Hola, Miguel, gracias por tu respuesta, me sale esto: Autorización por línea 6: Allow: /
    Se ha detectado como directorio; los archivos concretos pueden tener distintas restricciones.

    Aunque no tengo claro si es lo que tenía que hacer, ando un poco perdida.Saludos.

    ResponderEliminar
    Respuestas
    1. Si lo cambiaste el día 5, el robots.txt no tiene porqué estar mal ni mucho menos. Es posible que no haya sido indexado aún (han pasado sólo 3 días y esto puede tardar).

      Ejecuta paso a paso lo que te comento en esta entrada:

      http://diariosdelanube.blogspot.com.es/2013/04/mejora-tu-posicionamiento-web-optimiza.html

      Ten en cuenta que la adición al índice tarda, no es inmediata y que has actualizado recientemente el archivo robots. Ahora bien, si ejecutas lo que te comento en la entrada, podemos estar más seguros de que la indexación sea satisfactoria.

      Ejecuta cada paso comentado y mantenme al tanto de los resultados, lo que te va saliendo y, sobre todo, si te surgen dudas me vas preguntando.

      Ánimo que por el momento es todo normal, realiza lo que te indiqué. Un saludo.

      Eliminar
  7. Hola!!
    He probado con dos etiquetas y me sale:
    Bloqueado por la línea 3: Disallow: /search

    ¿Debería modificiar algo?

    Grácias por tu ayuda,

    MAR

    ResponderEliminar
    Respuestas
    1. Hola Mar, no creo que haya problema con el robots. yo lo tengo parecido.

      Las indexaciones no son instantáneas. Por ello puede tardar en añadirte al índice. Sigue los pasos que te puse en el comentario "Miguel García Sánchez - Colomer8 de abril de 2013 10:00".

      Y me vas planteando tus avances y dudas, con eso vamos a asegurarnos de que envías al índice tus entradas y etiquetas.

      Eliminar
  8. De las instrucciones que te pasé, haz sobre todo el apartado referente al sitemap, es decir: en herramientas para webmasters, en el menú de la izquierda, te metes en "Optimización" y acto seguido en "sitemaps". En la pantalla que te sale, pulsa el botón de arriba a la derecha que pone "Añadir o Probar sitemap". Cuando le des al botón te saldrá una pequeña ventana en la que te sale tu URL terminada en una caja de texto para meter "sitemap.xml". Pon sitemap.xml y pulsa "Enviar sitemap". Esto hará que te diga Google la lista de página que tienes indexadas y las que aún están por indexar.

    Después, repite la operación explicada, pero esta vez en lugar de darle a "Enviar sitemap.xml" dale a "Probar sitemap". Comprueba que no haya errores.

    Cuando hayas terminado esos pasos, continuando con las instrucciónes que te puse en la entrada sobre las herramientas web de Google, ve a la opción de menú "Salud" y después "Explorar como Google", pulsa en esa pantalla el botón "Recuperar" sin ponen NADA en la caja de texto y elige la opción "URL y páginas vinculadas", verás que en la lista de abajo en la columna "Estado Solicitudes de Rastreo" te saldrá "Correcto". Si te pone un botoncito en la misma fila donde te aparece correcto en el que pone "Pendiente de enviar al índice" haz el envío.

    Me vas contando los resultados y las dudas. Haz todo con cuidado y no repitas las operaciones innecesariamente, esto basta con que se haga una vez. Es para asegurarnos de que añades tus páginas al índice.

    ResponderEliminar
  9. Ok, mirad, tanto para Mar como Noemí, realizad los pasos que os comenté:

    " haz sobre todo el apartado referente al sitemap, es decir: en herramientas para webmasters, en el menú de la izquierda, te metes en "Optimización" y acto seguido en "sitemaps". En la pantalla que te sale, pulsa el botón de arriba a la derecha que pone "Añadir o Probar sitemap". Cuando le des al botón te saldrá una pequeña ventana en la que te sale tu URL terminada en una caja de texto para meter "sitemap.xml". Pon sitemap.xml y pulsa "Enviar sitemap". Esto hará que te diga Google la lista de página que tienes indexadas y las que aún están por indexar.

    Después, repite la operación explicada, pero esta vez en lugar de darle a "Enviar sitemap.xml" dale a "Probar sitemap". Comprueba que no haya errores.

    Cuando hayas terminado esos pasos, continuando con las instrucciónes que te puse en la entrada sobre las herramientas web de Google, ve a la opción de menú "Salud" y después "Explorar como Google", pulsa en esa pantalla el botón "Recuperar" sin ponen NADA en la caja de texto y elige la opción "URL y páginas vinculadas", verás que en la lista de abajo en la columna "Estado Solicitudes de Rastreo" te saldrá "Correcto". Si te pone un botoncito en la misma fila donde te aparece correcto en el que pone "Pendiente de enviar al índice" haz el envío."

    Después vendría bien que utilizando Chrome, os metierais en Herramientas del Webmaster, después en la opción de menú "Salud" y dentro de la misma "Indexación", "Estado de la indexación". Después os metéis en "Avanzada" y activáis todos los "checks" que os salen:

    Total indexadas
    Rastreadas alguna vez
    Páginas bloqueadas por robots
    Páginas eliminadas

    Y me decís qué resultados os salen, si hay "gráfica" que indique que se ha producido la indexación.

    Con todo esto me vais pasando las dudas y resultados.

    Un saludo!

    ResponderEliminar
  10. Hola, ya he hecho lo que me mandaste y sale que no hay errores y en la columna de estado solicitudes de rastreo sale correcto, creo que está bien así. Muchísimas gracias!!!!! Saludos.

    ResponderEliminar
    Respuestas
    1. Genial Noemí, me alegro mucho de haberte podido ayudar. Cualquier cosa aquí me tienes. Recuerda que la indexación es progresiva y tardará un tiempo, en breve estarás correctamente indexada y disfrutando de la potencia del buscador de Google.

      Un saludo!,

      Eliminar
  11. Hola Miguel,
    Antes te he enviado un mensaje, pero no hagas caso, no lo había hecho bien. Yo al igual que Noemí, he seguido todos los pasos y todo me ha salido correcto y cuando he llegado al estado de indexación, lo he activado todo y me sale como nota negativa 41páginas bloqueadas por robot. ¿Cómo puedo solucionarlo?

    Grácias de antemano,

    MAR

    ResponderEliminar
  12. Por cierto, lo que te he escrito hace un momento es sólo con la url, sin www, ni nada, lo he probado con www... y el resultado es peor, me dice que total indexadas 0, rastreadas alguna vez 26, y 28 bloqueadas por robots. Ya me dirás,

    Grácias,

    MAR

    ResponderEliminar
  13. Ok, haz una copia del robot.txt que utilizas y monta uno como este que te crea Google:

    User-agent: Mediapartners-Google
    Disallow:

    User-agent: *
    Disallow: / search
    Allow: /

    Mapa del sitio: http://nombre de tu blog/feeds/posts/default?orderby=UPDATED

    Pruébalo y me dices. Si no funciona reemplázalo con el que tenías, pero lo más probable que te funcione.

    Avísame cuando hayas terminado las pruebas con los resultados.

    Un saludo!,

    ResponderEliminar
  14. Hola Miguel,
    He pegado lo que ponías y me dice:

    "El contenido del archivo robots.txt no cumple las normas de formato."

    ¿Como podemos solucionarlo?

    MAR

    ResponderEliminar
    Respuestas
    1. Puedes o recuperar el anterior robots.txt que lo tienes más arriba en comentarios puesto.

      Si no los has copiado bien, hay algo que puede fallar:

      User-agent: Mediapartners-Google
      Disallow:

      User-agent: *
      Disallow: /search
      Allow: /

      Sitemap: http://nombre_de_tu_blog/feeds/posts/default?orderby=UPDATED

      Acuérdate al pegarlo de poner el nombre de tu blog bien en la dirección.

      Para subir un archivo robots sigue estas instrucciones:

      http://support.google.com/blogger/bin/answer.py?hl=es&answer=2472627

      Recuerda si no te funciona, tienes el tuyo original más arriba (el mío está así porque utilizo ADSense).

      Ya me dices.

      Eliminar
  15. MAR!, otra cosa, tener URLs bloqueadas es normal, yo con el robots.txt que te he puesto, tengo 78. A pesar de todo funciona el comando site:nombre_blog para ver las páginas que tengo indexadas.

    utilizando Chrome, métete en Herramientas del Webmaster, después en la opción de menú "Salud" y dentro de la misma "Indexación", "Estado de la indexación". Después te metes en "Avanzada" y activas todos los "checks" que te salen:

    Total indexadas
    Rastreadas alguna vez
    Páginas bloqueadas por robots
    Páginas eliminadas

    Y me dices qué resultados te salen, si hay "gráfica" que indique que se ha producido la indexación.

    Pienso que ni siquiera tienes que cambiar el robots.txt si haces todos los pasos que anteriormente te mencioné.

    Recuerda el comando site: se escribe así:

    site:nombre_blog.blogspot.com (no pongas http por delante).

    Bueno, ya me cuentas.

    ResponderEliminar
  16. Hola!
    Bueno, ya he podido poner el robot que me comentabas (era sin http), veremos como funciona. Después he hecho lo del site, y tienes razón salen un montón de mis urls (otra vez sin http), por último el estado de indexación es el 101 indexadas, 103 rastreadas alguna vez y 41 bloqueadas por robots.

    Saludos,
    MAR

    ResponderEliminar
    Respuestas
    1. Pues ya lo tienes, me alegro muchísimo de haber podido ayudar. Ahora si que estarás perfectamente indexada. Que lo disfrutes!.

      Eliminar
  17. Por cierto!!
    !Ya te tengo en mi blog como "mis otros blogs favoritos"
    Grácias por tu inestimable ayuda.

    MAR

    ResponderEliminar
    Respuestas
    1. No, gracias a ti, me hace muy feliz haberte podido ayudar. Y por supuesto, gracias también por añadirme a tus blogs favoritos. Por cierto qué hermoso tienes el tuyo, un honor estar en esa lista de blogs.

      Cualquier duda por aqui andamos.

      Eliminar

 

© 2015 Por: Miguel García Sánchez - Colomer en Diarios de la nube Todos los derechos reservados.