Indexação Google: crawl, orçamento e desbloqueio
7 min
O Google indexa as suas páginas em três etapas: descoberta, crawl e indexação. Um orçamento de crawl mal gerido deixa as suas páginas-chave fora do índice. Verifique primeiro a cobertura na Search Console e elimine os URLs parasitas que desperdiçam a sua quota.
Uma página não indexada é uma página invisível. No entanto, muitos sites sofrem de problemas de indexação silenciosos que os seus proprietários nunca detetam. Aqui está o método para diagnosticar e resolver estes bloqueios.
Como o Google descobre e indexa as suas páginas
O Googlebot parte de páginas já conhecidas e segue os links para descobrir novas. Em seguida, lê o conteúdo, renderiza o JavaScript se necessário, e envia a página para o índice — um processo que pode demorar de algumas horas a várias semanas.
A indexação não é garantida: o Google decide soberanamente quais as páginas que merecem ser indexadas com base na sua qualidade, exclusividade e autoridade do site.
Orçamento de crawl: o que é e quando é crítico
O orçamento de crawl corresponde ao número de páginas que o Googlebot aceita rastrear no seu site num determinado intervalo de tempo. É limitado para não sobrecarregar o seu servidor.
Para a maioria dos sites com menos de 1.000 páginas, o orçamento de crawl não é um problema. Torna-se crítico para grandes lojas de e-commerce, sites com facetas ou plataformas que geram milhares de URLs dinâmicos.
As páginas de baixo valor acrescentado — resultados de filtros, URLs de sessão, duplicados — desperdiçam este orçamento e atrasam a indexação das suas páginas prioritárias.
Nos grandes sites de e-commerce, entre 20 e 60 % dos URLs rastreados podem ser variantes de baixo valor que consomem inutilmente o orçamento de crawl.
Estudos sectoriais 2025-2026 sobre arquiteturas SEO de e-commerce
Diagnosticar problemas de indexação
O relatório «Cobertura» (agora «Indexação de páginas») na Search Console é a sua primeira ferramenta. Distingue as páginas indexadas, excluídas e com erros, com a razão precisa para cada categoria.
Utilize a ferramenta de inspeção de URL para testar uma página específica: o Google indica-lhe se está indexada, a data do último crawl e eventuais problemas detetados.
- Erro 404 ou 5xx: a página estava inacessível no momento do crawl.
- Bloqueada pelo robots.txt: o Googlebot tem acesso proibido.
- Baliza noindex presente: solicitou explicitamente a exclusão.
- Página duplicada, o Google escolheu um URL canónico diferente.
- Descoberta impossível: nenhum link interno aponta para a página.
Acelerar a indexação das suas novas páginas
Submeta os seus novos URLs através da ferramenta de inspeção de URL da Search Console ou através da API Indexing (reservada a ofertas de emprego e podcasts em teoria, mas frequentemente utilizada para outros conteúdos).
O método mais fiável continua a ser a criação de links internos desde as suas páginas já bem indexadas para os seus novos URLs: o Googlebot irá descobri-los naturalmente durante o próximo crawl.
FAQ
Porque é que a minha página não aparece no Google apesar da submissão do sitemap?
O sitemap indica ao Google que a página existe, mas não obriga à indexação. O Google avalia a qualidade, exclusividade e relevância antes de indexar. Verifique que não há nenhum noindex presente e que a página oferece conteúdo substancial.
Uma página bloqueada no robots.txt pode aparecer nos resultados?
Sim, se outros sites apontarem para ela. O Google pode exibir o URL sem ter conseguido rastreá-lo, o que significa que não é apresentado nenhum extrato. Para excluir totalmente uma página, combine robots.txt e baliza noindex, ou use apenas noindex.
Qual é o prazo normal entre publicação e indexação?
Para um site bem estabelecido, de algumas horas a 48 horas para páginas ligadas a partir da página inicial. Para um site recente ou uma página órfã, pode demorar várias semanas.