중복 콘텐츠와 canonical 태그
7 min
중복 콘텐츠는 여러 URL 간에 권위를 희석시키고 Google이 표시할 페이지를 선택하는 것을 방해합니다. canonical 태그는 어떤 버전이 기준인지 나타냅니다. 매개변수 URL, 페이지네이션 URL, HTTP/HTTPS 또는 www/non-www 버전에 체계적으로 사용하세요.
콘텐츠 중복은 그 자체로는 패널티가 아니지만 Google이 어떤 버전을 색인할지 혼자 선택하게 만들며, 항상 원하는 버전을 선택하지는 않습니다. canonical 태그로 이 제어권을 되찾을 수 있습니다.
가장 흔한 중복 원인
중복 콘텐츠의 대부분은 기술적이고 의도하지 않은 것입니다. e-커머스 사이트는 특히 취약합니다: 정렬 필터, 페이지네이션 매개변수, 제품 변형, 세션 URL이 동일한 페이지의 수십 개 버전을 생성합니다.
콘텐츠 신디케이션, 여러 도메인에서의 기사 재사용, 페이지 인쇄 버전은 감사 시 자주 잊혀지는 외부 중복 원인입니다.
- www가 있는 URL과 없는 URL(예시.kr vs www.예시.kr).
- 리다이렉트되지 않은 HTTP와 HTTPS 버전.
- e-커머스 URL의 정렬 및 필터 매개변수.
- 유사한 콘텐츠가 있는 페이지네이션 페이지(/page/2, /page/3).
- 여러 카테고리를 통해 접근 가능한 제품 페이지.
canonical 태그: 문법과 사용법
canonical 태그는 비정규 페이지의 head에 배치되어 기준 URL을 가리킵니다. 메인 페이지에서 자체를 가리키는 자기 참조 canonical을 사용할 수 있으며, Google이 권장하는 좋은 관행입니다.
각 페이지의 자기 참조 canonical은 Google에 의도를 확인하고, 누군가 대체 버전에 링크를 만들 경우 불필요한 URL이 우위를 점하는 것을 방지합니다.
- 도메인 간 canonical: 신디케이션된 콘텐츠의 원본 소스 표시.
- AMP 페이지 canonical: 표준 비AMP 버전을 가리킴.
- 페이지네이션 canonical: 시리즈의 메인 페이지를 가리킴.
- canonical 연쇄 금지(A가 B를 가리키고 B가 C를 가리킴): Google은 종종 연쇄를 무시함.
canonical vs 301 리다이렉트: 언제 무엇을 선택하나
301 리다이렉트는 서버 수준에서 대체 URL을 제거하므로 canonical보다 강력합니다. 두 URL이 완전히 동일하고 하나가 불필요하다면 리다이렉트를 선호하세요.
기술적 또는 기능적 이유로 두 URL을 모두 접근 가능하게 유지해야 하는 경우 canonical이 적합합니다. 예를 들어 인쇄 가능한 페이지나 특정 캠페인을 위해 유지되는 모바일 버전.
중형 e-커머스 사이트에서 색인된 페이지의 10~35%가 canonical과 robots.txt 규칙 조합으로 해결되는 기술적 중복입니다.
2025-2026년 e-커머스 SEO 감사 부문별 연구
FAQ
Google이 항상 canonical 태그를 따르나요?
canonical은 지시어가 아닌 신호입니다. Google은 대부분의 경우 이를 따르지만, 가리키는 페이지가 현재 버전보다 덜 관련성이 있다고 판단하면 무시할 수 있습니다. 상충하는 신호(잘못된 버전으로의 내부 링크, 중복 버전이 포함된 사이트맵)는 효과를 감소시킵니다.
중복 콘텐츠가 Google 패널티를 초래하나요?
검색 결과를 조작하기 위해 의도적으로 복사된 콘텐츠가 아닌 한 그렇지 않습니다. 기술적 또는 우연한 중복은 패널티를 발생시키지 않지만 권위를 희석시키고 잘못된 정규 버전이 선택될 수 있습니다.
사이트의 중복 콘텐츠를 어떻게 감지하나요?
콘텐츠 해시 비교 모드가 있는 Screaming Frog가 내부 중복 감지에 가장 효과적입니다. 외부 중복의 경우, Copyscape나 Siteliner를 통해 다른 도메인에서의 텍스트 재사용을 감지할 수 있습니다.