Sitemap ya XML na robots.txt: usanidi sahihi
6 min
Sitemap ya XML inaorodhesha kurasa zako za kipaumbele ili kurahisisha ugunduzi wao na Googlebot. Faili ya robots.txt inadhibiti sehemu zipi za roboti zinazoweza kutambaa. Faili hizi mbili zinazosaidiana na lazima zisasishwe ili kuepuka makosa ya kuorodhesha.
Sitemap na robots.txt ni faili mbili za usanidi wa SEO za kimsingi zaidi. Zilizosanidiwa vibaya, zinaweza kutoa bila kukusudia kurasa kuu au kupoteza bajeti ya utambaaji kwenye URLs zisizo na maana.
Sitemap ya XML: muundo na mazoea mazuri
Sitemap ya XML inaorodhesha URLs unazotaka kuorodheshwa, ikifuatana na data za nyuma za hiari (tarehe ya marekebisho, mzunguko wa usasishaji, kipaumbele). Google inasoma data hizi za nyuma lakini haizifuati kwa usahihi.
Kwa tovuti za zaidi ya URLs 50,000 au zaidi ya MB 50, unda faili ya sitemap index inayoelekeza faili nyingi za sitemap za mada (makala, bidhaa, makundi).
- Jumuisha URLs za canonical tu, zinazoweza kuorodheshwa na zinarudisha msimbo 200.
- Tenga kurasa za noindex, mwelekeo na kurasa zenye vigezo.
- Wasilisha sitemap yako katika Search Console na irejelee katika robots.txt.
- Sasisha sitemap moja kwa moja kwa kila uchapishaji mpya.
Faili ya robots.txt: maagizo na mipaka
Robots.txt inakaa kwenye mzizi wa kikoa na inatumia sintaksia rahisi ya sheria za Allow na Disallow kwa kila wakala wa mtumiaji. Inaambia Googlebot sehemu zipi za tovuti usiitambae - lakini haihakikishi kutengwa kwa kuorodhesha.
Ukurasa uliozuiwa na robots.txt bado unaweza kuonekana kwenye matokeo kama viungo vya nje vinaelekeza kwake. Kwa kutengwa kabisa, tumia tagi ya noindex, si robots.txt.
- Zuia folda za utawala, hatua na majaribio.
- Zuia URLs za utafutaji wa ndani zinazozalisha maelfu ya tofauti.
- Usizuie kamwe faili za CSS na JS zinazohitajika kwa utoaji wa ukurasa.
- Rejelea URL ya sitemap chini ya faili ya robots.txt.
Makosa muhimu na jinsi ya kuyaepuka
Kosa zito zaidi: kuzuia kwa bahati mbaya tovuti nzima na 'Disallow: /' katika robots.txt baada ya uhamishaji au usanidi wa hatua ambao haukusafishwa vizuri. Angalia faili hii kwanza baada ya kila usambazaji.
Kujumuisha URLs zenye hitilafu (404, 301) kwenye sitemap ni kosa la kawaida ambalo linafichomwa kwa Google ukosefu wa nidhamu na kupoteza bajeti ya utambaaji kwenye rasilimali zisizopo.
Wakati wa ukaguzi wa SEO, kati ya 15 na 40% ya tovuti zinaonyesha kutofautiana kati ya sitemap yao na kurasa zinazoweza kuorodheshwa kweli kweli, mara nyingi kutokana na matengenezo duni baada ya masasisho ya tovuti.
Tafiti za sekta 2025-2026 kuhusu ukaguzi wa kiufundi wa SEO
FAQ
Je, ninapaswa kuonyesha kipaumbele na mzunguko kwenye sitemap?
Vitagi hivi (priority na changefreq) kwa kiasi kikubwa vinapuuzwa na Google ambayo inategemea ishara zake mwenyewe kukadiria mzunguko wa utambaaji. Uwepo wao hauna madhara lakini kutokuwepo kwao pia si tatizo.
Muda gani Google inachukua kusoma sitemap iliyowasilishwa?
Baada ya kuwasilishwa katika Search Console, Google kwa ujumla inasoma sitemap ndani ya saa 24 hadi 72. Ugunduzi wa URLs mpya na uorodheshaji wao halisi unachukua muda mrefu zaidi kulingana na mamlaka ya tovuti.
Je, robots.txt inafanya kazi kwa injini zote za utafutaji?
Roboti zote zinazoheshimu viwango zinafuata robots.txt. Hata hivyo, roboti mbaya (wakosoaji, watambaaji wasio sawa) huipuuza. Kwa hivyo robots.txt si zana ya usalama bali zana ya usimamizi wa utambaaji.