Aller au contenu
Fundamentos SEO

Indexación en Google: crawl, presupuesto y desbloqueo

7 min

Google indexa tus páginas en tres etapas: descubrimiento, rastreo e indexación. Un presupuesto de rastreo mal gestionado deja tus páginas clave fuera del índice. Comprueba primero la cobertura en Search Console y, a continuación, elimina las URLs parásitas que desperdician tu cuota.

Una página no indexada es una página invisible. Sin embargo, muchos sitios sufren problemas de indexación silenciosos que sus propietarios nunca detectan. Aquí tienes el método para diagnosticar y resolver estos bloqueos.

Cómo Google descubre e indexa tus páginas

Googlebot parte de páginas ya conocidas y sigue los enlaces para descubrir otras nuevas. Después lee el contenido, renderiza el JavaScript si es necesario y transmite la página al índice — un proceso que puede tardar desde unas horas hasta varias semanas.

La indexación no está garantizada: Google decide de forma soberana qué páginas merecen ser indexadas en función de su calidad, unicidad y la autoridad del sitio.

Presupuesto de rastreo: qué es y cuándo es crítico

El presupuesto de rastreo corresponde al número de páginas que Googlebot acepta rastrear en tu sitio dentro de un intervalo de tiempo determinado. Está limitado para no sobrecargar tu servidor.

Para la mayoría de los sitios de menos de 1 000 páginas, el presupuesto de rastreo no es un problema. Se vuelve crítico para los grandes e-commerces, los sitios con facetas o las plataformas que generan miles de URLs dinámicas.

Las páginas de escaso valor añadido — resultados de filtros, URLs de sesión, duplicados — desperdician este presupuesto y retrasan la indexación de tus páginas prioritarias.

En los grandes sitios de e-commerce, entre el 20 y el 60 % de las URLs rastreadas pueden ser variantes de bajo valor que consumen innecesariamente el presupuesto de rastreo.

Estudios sectoriales 2025-2026 sobre arquitecturas SEO en e-commerce

Diagnosticar los problemas de indexación

El informe «Cobertura» (ahora «Indexación de páginas») en Search Console es tu primera herramienta. Distingue las páginas indexadas, excluidas y con errores, con la razón precisa de cada categoría.

Utiliza la herramienta de inspección de URL para probar una página específica: Google te indica si está indexada, la fecha del último rastreo y los posibles problemas detectados.

  • Error 404 o 5xx: la página es inaccesible en el momento del rastreo.
  • Bloqueada por robots.txt: Googlebot no tiene acceso.
  • Etiqueta noindex presente: has solicitado explícitamente la exclusión.
  • Página duplicada, Google eligió una URL canónica diferente.
  • Descubrimiento imposible: ningún enlace interno apunta a la página.

Acelerar la indexación de tus nuevas páginas

Envía tus nuevas URLs a través de la herramienta de inspección de URL de Search Console o mediante la API de Indexación (reservada teóricamente a ofertas de empleo y podcasts, pero utilizada a menudo para otros contenidos).

El método más fiable sigue siendo construir enlaces internos desde tus páginas ya bien indexadas hacia tus nuevas URLs: Googlebot las descubrirá de forma natural en el siguiente rastreo.

FAQ

¿Por qué mi página no aparece en Google a pesar de haberla enviado en el sitemap?

El sitemap indica a Google que la página existe, pero no obliga a su indexación. Google evalúa la calidad, la unicidad y la relevancia antes de indexar. Comprueba que no haya ningún noindex y que la página ofrezca un contenido sustancial.

¿Puede aparecer en los resultados una página bloqueada en robots.txt?

Sí, si otros sitios enlazan a ella. Google puede mostrar la URL sin haberla rastreado, lo que significa que no se muestra ningún extracto. Para excluir totalmente una página, combina robots.txt con la etiqueta noindex, o utiliza únicamente noindex.

¿Cuál es el plazo normal entre la publicación y la indexación?

Para un sitio bien establecido, de unas pocas horas a 48 horas para las páginas enlazadas desde la página de inicio. Para un sitio reciente o una página huérfana, puede llevar varias semanas.