SEO کے بنیادی اصول

XML Sitemap اور robots.txt: صحیح Configuration

6 min

XML sitemap Googlebot کے لیے آپ کے ترجیحی صفحات کی دریافت آسان کرنے کے لیے انہیں درج کرتا ہے۔ robots.txt فائل کنٹرول کرتی ہے کہ robot کون سے sections crawl کر سکتا ہے۔ یہ دو فائلیں complement ہیں اور indexation errors سے بچنے کے لیے up to date رکھنی چاہیے۔

Sitemap اور robots.txt دو سب سے بنیادی SEO configuration فائلیں ہیں۔ غلط configure ہونے پر، یہ غیر ارادی طور پر اہم pages کو خارج کر سکتی ہیں یا بیکار URLs پر crawl budget ضائع کر سکتی ہیں۔

XML Sitemap: Structure اور Best Practices

XML sitemap ان URLs کی فہرست بناتا ہے جنہیں آپ indexed دیکھنا چاہتے ہیں، ساتھ میں اختیاری metadata (modification date، update frequency، priority) بھی۔ Google یہ metadata پڑھتا ہے لیکن ان کی لفظی پیروی نہیں کرتا۔

50,000 سے زیادہ URLs یا 50 MB سے زیادہ سائٹس کے لیے، ایک sitemap index بنائیں جو کئی thematic sitemap فائلوں (articles، products، categories) کی طرف اشارہ کرے۔

صرف canonical، indexable URLs جو 200 code واپس کریں شامل کریں۔
Noindex pages، redirections اور parameter والے pages کو خارج کریں۔
Search Console میں اپنا sitemap جمع کریں اور robots.txt میں reference کریں۔
ہر نئی اشاعت پر sitemap خود بخود اپڈیٹ کریں۔

Robots.txt فائل: Directives اور حدود

Robots.txt domain کی root میں ہوتی ہے اور user-agent کے مطابق Allow اور Disallow rules کی simple syntax استعمال کرتی ہے۔ یہ Googlebot کو بتاتی ہے کہ سائٹ کے کون سے حصے crawl نہ کریں — لیکن indexation کے خارج ہونے کی ضمانت نہیں دیتی۔

Robots.txt سے blocked page اب بھی نتائج میں دکھ سکتا ہے اگر external links اس کی طرف اشارہ کریں۔ مکمل exclusion کے لیے noindex tag استعمال کریں، robots.txt نہیں۔

Administration، staging اور test folders کو block کریں۔
Internal search URLs کو block کریں جو ہزاروں variations بناتی ہیں۔
صفحے کے rendering کے لیے ضروری CSS اور JS فائلیں کبھی block نہ کریں۔
Robots.txt فائل کے نیچے sitemap URL reference کریں۔

Critical Errors اور انہیں کیسے بچائیں

سب سے سنگین غلطی: migration یا staging configuration صفائی کے بعد robots.txt میں 'Disallow: /' سے پوری سائٹ کو غیر ارادی طور پر block کرنا۔ ہر deployment کے بعد اس فائل کو پہلے چیک کریں۔

Sitemap میں error URLs (404، 301) شامل کرنا ایک عام غلطی ہے جو Google کو ریگورسنس کی کمی کا سگنل دیتی ہے اور غیر موجود resources پر crawl budget ضائع کرتی ہے۔

SEO آڈٹس کے دوران، 15 سے 40 فیصد سائٹس ان کے sitemap اور واقعی indexable pages کے درمیان inconsistencies دکھاتی ہیں، اکثر سائٹ اپڈیٹس کے بعد ناکافی دیکھ بھال کی وجہ سے۔

صنعتی مطالعات 2025-2026 technical SEO آڈٹس پر

FAQ

کیا sitemap میں priority اور frequency indicate کرنی چاہیے؟

یہ tags (priority اور changefreq) Google کی طرف سے بڑے پیمانے پر نظرانداز کیے جاتے ہیں جو crawl frequency کا تخمینہ لگانے کے لیے اپنے سگنلز پر انحصار کرتا ہے۔ ان کی موجودگی نقصاندہ نہیں لیکن ان کی غیر موجودگی بھی مسئلہ نہیں۔

Submit شدہ sitemap پڑھنے میں Google کو کتنا وقت لگتا ہے؟

Search Console میں submission کے بعد، Google عموماً 24 سے 72 گھنٹوں میں sitemap پڑھ لیتا ہے۔ نئی URLs کی دریافت اور ان کی effective indexation میں سائٹ کے اختیار کے لحاظ سے زیادہ وقت لگتا ہے۔

کیا robots.txt تمام search engines کے لیے کام کرتا ہے؟

معیار کا احترام کرنے والے تمام robots robots.txt کا احترام کرتے ہیں۔ تاہم، malicious robots (scrapers، non-compliant crawlers) اسے نظرانداز کرتے ہیں۔ اس لیے robots.txt ایک security ٹول نہیں بلکہ crawl management ٹول ہے۔