การจัดทำดัชนีของ Google : crawl งบประมาณ และการปลดบล็อก
7 min
Google จัดทำดัชนีหน้าเว็บของคุณในสามขั้นตอน : การค้นพบ การรวบรวมข้อมูล (crawl) และการจัดทำดัชนี crawl budget ที่จัดการไม่ดีจะทำให้หน้าสำคัญของคุณอยู่นอกดัชนี ตรวจสอบความครอบคลุมใน Search Console ก่อน จากนั้นกำจัด URL ขยะที่สิ้นเปลืองโควตาของคุณ
หน้าที่ไม่ถูกจัดทำดัชนีคือหน้าที่มองไม่เห็น ทว่าหลายเว็บไซต์ประสบปัญหาการจัดทำดัชนีแบบเงียบ ๆ ที่เจ้าของไม่เคยตรวจพบ นี่คือวิธีการวินิจฉัยและแก้ไขปัญหาเหล่านี้
Google ค้นพบและจัดทำดัชนีหน้าเว็บของคุณอย่างไร
Googlebot เริ่มจากหน้าที่รู้จักอยู่แล้วและติดตามลิงก์เพื่อค้นพบหน้าใหม่ ๆ จากนั้นอ่านเนื้อหา เรนเดอร์ JavaScript หากจำเป็น และส่งหน้านั้นเข้าสู่ดัชนี — กระบวนการที่อาจใช้เวลาตั้งแต่ไม่กี่ชั่วโมงไปจนถึงหลายสัปดาห์
การจัดทำดัชนีไม่มีการรับประกัน : Google เป็นผู้ตัดสินใจแต่เพียงผู้เดียวว่าหน้าใดสมควรถูกจัดทำดัชนี โดยพิจารณาจากคุณภาพ ความเป็นเอกลักษณ์ และ authority ของเว็บไซต์
Crawl budget : คืออะไรและสำคัญเมื่อไหร่
Crawl budget คือจำนวนหน้าที่ Googlebot ยอมรวบรวมข้อมูลบนเว็บไซต์ของคุณภายในช่วงเวลาหนึ่ง มันถูกจำกัดไว้เพื่อไม่ให้เซิร์ฟเวอร์ของคุณทำงานหนักเกินไป
สำหรับเว็บไซต์ส่วนใหญ่ที่มีน้อยกว่า 1 000 หน้า crawl budget ไม่ใช่ปัญหา แต่จะกลายเป็นเรื่องวิกฤตสำหรับ e-commerce ขนาดใหญ่ เว็บไซต์ที่มีตัวกรองแบบ facet หรือแพลตฟอร์มที่สร้าง URL แบบไดนามิกนับพัน
หน้าที่มีมูลค่าต่ำ — ผลลัพธ์ของตัวกรอง URL ของ session รายการซ้ำ — สิ้นเปลืองงบประมาณนี้และทำให้การจัดทำดัชนีหน้าสำคัญของคุณล่าช้า
บนเว็บไซต์ e-commerce ขนาดใหญ่ URL ที่ถูกรวบรวมข้อมูลระหว่าง 20 ถึง 60% อาจเป็นรูปแบบย่อยที่มีมูลค่าต่ำซึ่งกิน crawl budget โดยไม่จำเป็น
การศึกษาภาคอุตสาหกรรมปี 2025-2026 เกี่ยวกับสถาปัตยกรรม SEO e-commerce
วินิจฉัยปัญหาการจัดทำดัชนี
รายงาน « ความครอบคลุม » (ปัจจุบันคือ « การจัดทำดัชนีหน้าเว็บ ») ใน Search Console คือเครื่องมือแรกของคุณ มันแยกแยะหน้าที่ถูกจัดทำดัชนี ถูกยกเว้น และมีข้อผิดพลาด พร้อมเหตุผลที่ชัดเจนสำหรับแต่ละหมวด
ใช้เครื่องมือตรวจสอบ URL เพื่อทดสอบหน้าใดหน้าหนึ่งโดยเฉพาะ : Google จะบอกว่าหน้านั้นถูกจัดทำดัชนีหรือไม่ วันที่ crawl ล่าสุด และปัญหาที่ตรวจพบ
- ข้อผิดพลาด 404 หรือ 5xx : หน้าเข้าถึงไม่ได้ในขณะ crawl
- ถูกบล็อกโดย robots.txt : Googlebot ถูกห้ามเข้าถึง
- มีแท็ก noindex : คุณได้ขอยกเว้นการจัดทำดัชนีอย่างชัดเจน
- หน้าซ้ำ Google เลือก URL canonical อื่นแทน
- ค้นพบไม่ได้ : ไม่มีลิงก์ภายในใดชี้ไปยังหน้านั้น
เร่งการจัดทำดัชนีหน้าใหม่ของคุณ
ส่ง URL ใหม่ของคุณผ่านเครื่องมือตรวจสอบ URL ของ Search Console หรือผ่าน Indexing API (ในทางทฤษฎีสงวนไว้สำหรับประกาศรับสมัครงานและพอดแคสต์ แต่มักถูกใช้กับเนื้อหาอื่นด้วย)
วิธีที่น่าเชื่อถือที่สุดยังคงเป็นการสร้างลิงก์ภายในจากหน้าที่ถูกจัดทำดัชนีดีอยู่แล้วไปยัง URL ใหม่ของคุณ : Googlebot จะค้นพบมันตามธรรมชาติในการ crawl ครั้งถัดไป
FAQ
ทำไมหน้าของฉันไม่ปรากฏใน Google ทั้งที่ส่ง sitemap แล้ว?
Sitemap บอก Google ว่าหน้านั้นมีอยู่ แต่ไม่ได้บังคับให้จัดทำดัชนี Google ประเมินคุณภาพ ความเป็นเอกลักษณ์ และความเกี่ยวข้องก่อนจัดทำดัชนี ตรวจสอบว่าไม่มีแท็ก noindex และหน้านั้นมีเนื้อหาที่มีสาระเพียงพอ
หน้าที่ถูกบล็อกใน robots.txt สามารถปรากฏในผลการค้นหาได้หรือไม่?
ได้ หากมีเว็บไซต์อื่นลิงก์มาหา Google อาจแสดง URL โดยไม่สามารถ crawl ได้ ซึ่งหมายความว่าจะไม่มีตัวอย่างข้อความแสดง หากต้องการยกเว้นหน้าโดยสมบูรณ์ ให้ใช้ robots.txt ร่วมกับแท็ก noindex หรือใช้ noindex เพียงอย่างเดียว
ระยะเวลาปกติระหว่างการเผยแพร่กับการจัดทำดัชนีคือเท่าไหร่?
สำหรับเว็บไซต์ที่มีชื่อเสียงดี ใช้เวลาไม่กี่ชั่วโมงถึง 48 ชั่วโมงสำหรับหน้าที่มีลิงก์จากหน้าแรก สำหรับเว็บไซต์ใหม่หรือหน้ากำพร้า อาจใช้เวลาหลายสัปดาห์