Fundamentos de SEO

Indexação Google: crawl, orçamento e desbloqueio

7 min

O Google indexa as suas páginas em três etapas: descoberta, crawl e indexação. Um orçamento de crawl mal gerido deixa as suas páginas-chave fora do índice. Verifique primeiro a cobertura na Search Console e elimine os URLs parasitas que desperdiçam a sua quota.

Uma página não indexada é uma página invisível. No entanto, muitos sites sofrem de problemas de indexação silenciosos que os seus proprietários nunca detetam. Aqui está o método para diagnosticar e resolver estes bloqueios.

Como o Google descobre e indexa as suas páginas

O Googlebot parte de páginas já conhecidas e segue os links para descobrir novas. Em seguida, lê o conteúdo, renderiza o JavaScript se necessário, e envia a página para o índice — um processo que pode demorar de algumas horas a várias semanas.

A indexação não é garantida: o Google decide soberanamente quais as páginas que merecem ser indexadas com base na sua qualidade, exclusividade e autoridade do site.

Orçamento de crawl: o que é e quando é crítico

O orçamento de crawl corresponde ao número de páginas que o Googlebot aceita rastrear no seu site num determinado intervalo de tempo. É limitado para não sobrecarregar o seu servidor.

Para a maioria dos sites com menos de 1.000 páginas, o orçamento de crawl não é um problema. Torna-se crítico para grandes lojas de e-commerce, sites com facetas ou plataformas que geram milhares de URLs dinâmicos.

As páginas de baixo valor acrescentado — resultados de filtros, URLs de sessão, duplicados — desperdiçam este orçamento e atrasam a indexação das suas páginas prioritárias.

Nos grandes sites de e-commerce, entre 20 e 60 % dos URLs rastreados podem ser variantes de baixo valor que consomem inutilmente o orçamento de crawl.

Estudos sectoriais 2025-2026 sobre arquiteturas SEO de e-commerce

Diagnosticar problemas de indexação

O relatório «Cobertura» (agora «Indexação de páginas») na Search Console é a sua primeira ferramenta. Distingue as páginas indexadas, excluídas e com erros, com a razão precisa para cada categoria.

Utilize a ferramenta de inspeção de URL para testar uma página específica: o Google indica-lhe se está indexada, a data do último crawl e eventuais problemas detetados.

Erro 404 ou 5xx: a página estava inacessível no momento do crawl.
Bloqueada pelo robots.txt: o Googlebot tem acesso proibido.
Baliza noindex presente: solicitou explicitamente a exclusão.
Página duplicada, o Google escolheu um URL canónico diferente.
Descoberta impossível: nenhum link interno aponta para a página.

Acelerar a indexação das suas novas páginas

Submeta os seus novos URLs através da ferramenta de inspeção de URL da Search Console ou através da API Indexing (reservada a ofertas de emprego e podcasts em teoria, mas frequentemente utilizada para outros conteúdos).

O método mais fiável continua a ser a criação de links internos desde as suas páginas já bem indexadas para os seus novos URLs: o Googlebot irá descobri-los naturalmente durante o próximo crawl.

FAQ

Porque é que a minha página não aparece no Google apesar da submissão do sitemap?

O sitemap indica ao Google que a página existe, mas não obriga à indexação. O Google avalia a qualidade, exclusividade e relevância antes de indexar. Verifique que não há nenhum noindex presente e que a página oferece conteúdo substancial.

Uma página bloqueada no robots.txt pode aparecer nos resultados?

Sim, se outros sites apontarem para ela. O Google pode exibir o URL sem ter conseguido rastreá-lo, o que significa que não é apresentado nenhum extrato. Para excluir totalmente uma página, combine robots.txt e baliza noindex, ou use apenas noindex.

Qual é o prazo normal entre publicação e indexação?

Para um site bem estabelecido, de algumas horas a 48 horas para páginas ligadas a partir da página inicial. Para um site recente ou uma página órfã, pode demorar várias semanas.