메뉴 바로가기 본문 바로가기

중복 콘텐츠란? SEO에서 페널티 대상? 단점과 대처법을 설명

  • 2023.11.26

중복 콘텐츠는 콘텐츠가 " 완전히 동일 "하거나 " 매우 유사한 "페이지가 여러 개 존재하는 상태입니다.

「중복」이라고 하는 말을 듣고, 타 사이트로부터 무단 복제한 「복사 컨텐츠」를 이미지 한 분도 많을지도 모릅니다.

그러나 SEO에서 문제시되는 중복 콘텐츠는 악의적인 복사 콘텐츠가 아니라 사이트 운영에서 자연스럽게 발생하는 중복을 가리키는 경우가 대부분입니다.

또 「중복 컨텐츠 = 페널티」라고 생각하고 있는 Web 담당자도 많습니다만, 실제로는 페널티는 없습니다 .

이처럼 SEO에서 '중복 콘텐츠'는 오해가 많은 테마입니다.

중복 콘텐츠는 SEO에도 영향을 미치는 것이므로, 적절하게 대처할 수 있도록 웹 담당자는 이 기사에서 이해를 깊게 해 둡시다.

이 기사의 주제

 

  • 중복 콘텐츠란?
  • SEO에서 중복 콘텐츠는 페널티인가?
  • 중복 콘텐츠의 SEO상의 단점 【대처해야 할 이유】
  • 중복 콘텐츠를 처리하는 방법
  • 중복 콘텐츠를 확인하는 방법
  • 중복 콘텐츠 및 SEO 관련 FAQ

 

「중복 컨텐츠의 기준은?」 「정형문을 사용해도 괜찮습니까?」등, 의문을 가지고 있는 웹 담당자는 요체크입니다.

중복 콘텐츠란?

중복 콘텐츠는 콘텐츠가 '완전히 동일'또는 '매우 유사한'여러 페이지입니다 .

중복 콘텐츠는 자체 사이트 내에서도 다른 사이트에서도 발생할 수 있습니다.

Google은 중복 콘텐츠를 다음과 같이 정의합니다.

단일 페이지에 여러 URL로 액세스할 수 있거나 다른 페이지의 콘텐츠가 유사한 경우(예: 한 페이지에 모바일 버전과 PC 버전 모두 URL이 있는 경우), Google은 이러한 페이지를 같은 페이지의 중복 버전으로 간주합니다.

인용자 : 중복 URL 정규화 및 canonical 태그 활용 | Google 검색 중앙

간단히 말하면 " 다른 URL인데 같은 (유사한) 콘텐츠가 표시된다 "상태입니다.

처음에 말했듯이 Google에서 사용하는 '중복'이라는 단어는 일반적으로 악의적으로 제작된 '복사 콘텐츠' 또는 '스팸 콘텐츠'를 의미하지 않습니다 .

덧붙여 중복 컨텐츠는 이하의 3 종류로 분류할 수 있습니다.

세 가지 중복 콘텐츠

 

  • 정확히 일치하는 중복 콘텐츠
  • 부분 일치의 중복 콘텐츠
  • 도메인 간 중복 콘텐츠

 

각각 해설합니다.

정확히 일치하는 중복 콘텐츠

'완전 일치'의 중복 콘텐츠는 두 페이지가 100% 동일한 경우입니다 .

다른 것은 URL뿐입니다 .

정확히 일치하는 중복 콘텐츠
"www의 유무"나 "http와 https"등 기술적인 요인으로 생기는 경우가 많습니다.

불일치 일치의 중복 콘텐츠

'불완전 일치'의 중복 콘텐츠는 두 페이지 내용이 약간 다른 경우입니다 .

텍스트나 이미지, 디자인 등 일부만 다릅니다 .

불일치 일치의 중복 콘텐츠
예를 들어 EC 사이트의 이미지만 다른 제품 페이지는 불일치 일치의 중복 콘텐츠입니다.

도메인 간 중복 콘텐츠

'도메인 간' 중복 콘텐츠는 별도의 웹 사이트에 동일한 콘텐츠를 게시하는 경우입니다 .

도메인 간 중복 콘텐츠

예를 들어, 작성한 컨텐츠를 다른 미디어(Yahoo! JAPAN 등)로 전달하고 있는 경우나, 컨텐츠가 허가 없이 전재되어 버린 경우등입니다.

SEO에서 중복 콘텐츠는 페널티인가?

결론에서 말하면 검색결과를 조작할 스팸 의도가 없는 한 중복 콘텐츠는 페널티가 되지 않습니다 .

Google은 공식 문서로 다음과 같이 작성합니다.

사이트에 콘텐츠가 중복되는 것은 정상이며 Google 스팸 정책을 위반하지 않습니다.

인용원:What is URL Canonicalization | Google Search Central 
※폐사에서 번역.

중복 콘텐츠가 있는 경우 Google은 검색결과에 둘 중 하나를 '정규 버전'으로 표시하여 다른 한쪽을 표시하지 않도록 합니다 .

이것은 페널티가 아니라 단순한 알고리즘에 의한 조정입니다.

"동일한 내용의 페이지가 검색 결과에 늘어서면 사용자는 불편하네요.

사이트의 대부분이 중복 컨텐츠라면 문제입니다만, 통상의 사이트에서 자연스럽게 일어날 수 있는 중복 컨텐츠에 페널티는 부과되지 않습니다.

참고: 악의적인 사본 콘텐츠는 페널티 대상입니다.

무단 복제된 콘텐츠 (=복사 콘텐츠)"는 페널티 대상입니다. 독자적인 가치를 추가하지 않고 순위를 위해서만 콘텐츠를 양산하지 마세요. 허가 없이 콘텐츠를 전재하는 것은 법적으로 NG입니다.

텍스트나 이미지의 사용회전은 OK? 【중복은 마이너스가 되는 것인가】

웹 사이트를 운영하고 있으면, 이미지나 텍스트의 일부를 사용하는 일도 많지요.

이러한 중복도 페널티 대상이나 마이너스 랭킹 요인이 아닙니다 .

한 페이지의 텍스트를 톱 페이지나 다른 페이지에서 반복해서 사용해도 그 때문에 순위는 내려가지 않는다는 것입니다.
참고: Google: Duplicate Content is Not a Negative Ranking Factor – Search Engine Journal

주의가 필요한 것은, 중복의 비율이 많으면 그 만큼, 페이지내의 오리지날 요소가 적게 되기 쉽다는 것입니다.

아시다시피, Google은 독특한 콘텐츠를 더 높이 평가하고 상위에 표시합니다.

텍스트나 이미지를 부분적으로 유용한 콘텐츠에서는 "원래 요소가 적어지고 순위가 오르기 어려워지는 " 일이 있습니다.

「중복 자체가 마이너스 평가가 된다」라고 생각하는 것이 아니라, 「중복 부분은 무시되므로, 중복 부분 이외의 독자 요소를 늘리는 것이 중요하다」라고 생각하면 좋을 것입니다.

중복 콘텐츠의 SEO상의 단점 【대처해야 할 이유】

앞서 언급했듯이 중복 콘텐츠는 Google 평가를 낮추는 직접적인 요인이 아닙니다.

그러나, 방치해 두면 SEO상의 불편이 생겨 버립니다 .

이 장에서는 중복 콘텐츠에 적절한 조치를 취해야 하는 3가지 이유를 설명합니다.

중복 콘텐츠 SEO의 단점

 

  • 단점 1. 링크 평가가 분산됨
  • 단점 2. 크롤러 리소스가 낭비됨
  • 단점 3. 의도한 페이지가 검색결과에 표시되지 않을 수 있음

 

단점 1. 링크 평가가 분산됨

첫 번째 단점은 링크 평가가 분산된다는 것입니다.

예를 들어 '페이지 A'와 '페이지 B'가 중복 콘텐츠라고 가정합니다.

이 경우, 「페이지 A」에도 「페이지 B」에도 피 링크가 붙을 가능성이 있어, 평가를 분산시키는 원인이 되어 버립니다 .

어느 한쪽을 정규 페이지로 지정하면 링크의 평가를 하나로 집계할 수 있으므로 효율적으로 Google의 평가를 높일 수 있습니다.

단점 2. 크롤러 리소스가 낭비됨

두 번째 단점은 크롤러 리소스가 낭비된다는 것 입니다.

SEO에 있어서는 「신규 컨텐츠」나 「갱신한 컨텐츠」를 빨리 크롤링 받는 것이 중요합니다 .

하지만 중복 콘텐츠를 크롤링하는 데 시간이 오래 걸리면 이러한 중요한 페이지로의 전환이 늦어질 수 있습니다.

소규모 사이트라면 문제 없습니다만, 대규모 사이트에서는 본래 회유해 주었으면 하는 페이지의 크롤 빈도가 내려, 인덱스에 지장이 나올 가능성도 있으므로 대처가 필요합니다.

단점 3. 의도한 페이지가 검색결과에 표시되지 않을 수 있음

세 번째 단점은 의도한 페이지가 검색결과에 표시되지 않을 수 있다는 것입니다 .

Google은 중복 콘텐츠를 발견하면 자동으로 한 페이지를 '정규 버전'으로 설정하여 다른 페이지를 검색결과에 표시하지 않도록 합니다 .

의도 한 페이지를 검색 결과에 표시하려면 'URL 정규화'를 수행하고 Google에 정규 URL을 알려야합니다.

URL 정규화란?

Google로부터 평가를 받는 정규 URL을 하나로 결정, 통합하는 처리. 301 리디렉션 및 canonical 등.

중복 콘텐츠를 처리하는 방법

중복 콘텐츠에 대한 처리 흐름은 다음과 같습니다.

중복 콘텐츠를 처리하는 흐름

 

  1. 중복 콘텐츠 찾기
  2. 정규 페이지 결정
  3. 필요한 조치를 취하십시오.

 

중복 콘텐츠에 대한 구체적인 대처법으로 대표적인 것은 다음 5가지입니다.

중복 콘텐츠 처리

 

  • 대처법 1.301 리디렉션 처리
  • 대처법 2. canonial 태그 설치
  • 대처법 3. 어노테이션 설정
  • 대처법 4. 유사 콘텐츠 삭제 및 통합
  • 대처법 5. 콘텐츠 전송 대상에 대한 조치 요청

 

어떤 방법이라도 좋은 것은 아니며 중복의 원인에 따라 적절한 조치가 달라집니다 .

각각 확인하고 자신의 사이트에서 중복 상황에 맞는 적절한 조치를 취합시다.

대처법 1.301 리디렉션 처리

301 리디렉션 은 지정한 URL로의 전송 처리입니다.

정규 페이지만을 사용자에게 표시시키고 싶은 경우에 사용합니다 .

예를 들어, 다음과 같은 요인으로 중복이 발생하고 있다면 301 리디렉션으로 처리합니다.

  • 「www」의 유무
  • 'http'와 'https'
  • URL 끝에 "/index.html"의 유무
  • URL 끝에 "/"가 있는지 여부

http://example.com 과 https://example.com 에서 중복이 발생한 경우 http 페이지(비정규) → https 페이지(정규)로 리디렉션  향 합니다 .

대처법 2. canonical 태그 설치

canonical(공동) 태그는 두 페이지를 모두 사용자에게 표시하려는 경우에 사용합니다 .

canonical 태그를 사용하면 양 페이지를 남기면서 Google에 정규 페이지(평가해 주었으면 하는 페이지)가 어느 쪽인지를 전할 수 있습니다 .

예를 들어, 다음과 같은 요인으로 중복이 일어나고 있을 때 사용합니다.

  • EC 사이트의 유사도가 높은 상품 페이지(색상 차이 등)
  • PC판・모바일판으로 URL이 다르다
  • URL 매개변수의 유무
  • 웹페이지의 인쇄용 버전이 있음

비정규 페이지에 rel=”canonical” 을 기술해, 정규 페이지를 지정합니다.

대처법 3. 어노테이션 설정

어노테이션은 기기 별로 별도의 URL이 있음을 Google에 알리는 설정입니다 .

PC 버전과 모바일 버전에서 URL이 다른 경우 canonical 태그와 alternate 태그를 설치합니다.

구체적인 방법은 다음과 같습니다.

  • PC판에는 「alternate」태그를 설치해, 모바일판이 있는 것을 나타낸다
  • 모바일 버전에는 "canonical" 태그를 설치하여 PC 버전이 정식 URL임을 알립니다.

참고: 모바일 첫 번째 색인에 대한 추천 방법 | Google 검색 중앙

하지만 Google은 기기별로 URL을 갖고 있는 것이 아니라 어느 쪽이든 대응할 수 있는 반응형 디자인을 권장하므로 대응을 고려해 보세요.

대처법 4. 유사 콘텐츠 감소

유사한 콘텐츠를 여러 개 만들고 있는 상황이라면 다음과 같은 방법으로 줄이는 것도 좋을 것입니다.

  • 두 콘텐츠를 하나로 통합
  • 원본 콘텐츠 추가

예를 들어 여행 사이트에서 두 개의 도시를 별도의 페이지로 소개하고 콘텐츠가 유사하다고 가정합니다.

이 경우 한 페이지에서 두 도시를 함께 소개하거나 각 페이지에 원본 콘텐츠를 추가하여 처리합니다.

대처법 5. 콘텐츠 전송 대상에 대한 조치 요청

자신의 사이트의 콘텐츠를 외부 미디어에서도 전달하는 것을 콘텐츠 신디케이션」이라고 부릅니다.

콘텐츠 신디케이션에 의한 중복은, 전달처와 사전에 이야기를 해 두는 것으로 막습니다.

배달 대상에 요청하고 배달 대상 기사에 "noindex"태그를 설치하십시오 .

noindex 로 하면 외부 사이트에서 전달하는 의미가 없어지는 것은?」라고 생각하는 분도 있을지도 모릅니다만, SNS 경유 혹은 미디어내의 링크로부터의 액세스를 모으는데 있어서는 의미가 있습니다.

참고: 신디케이션 콘텐츠에 "canonical 태그"를 설치하지 않는 것이 좋습니다.

이전에는 전송처의 기사에 「rel=”canonical””을 추가해 주었고, 오리지널 기사를 정규화하는 것이 베스트인 중복 해소 방법으로서 추천되고 있었습니다. 그러나 2023년 5월에 Google은 신디케이션 콘텐츠에 관한 문서를 변경 . canonical 태그를 사용하지 않고 대상 콘텐츠의 색인을 차단하는 것이 좋습니다.
참고: 정규화 문제 수정 | Google 검색 중앙

또한 콘텐츠 신디케이션의 중복 대책으로서, 전달처보다 빨리 페이지를 인덱스 시키거나, 혹은 원래 전달을 하지 않는 것도 효과적입니다.

만약 허가를 받지 않았는데 콘텐츠가 무단으로 다른 사이트에 게재되어 있는 경우는, 이하의 방법으로 대처해 주세요.

콘텐츠가 무단 전재된 경우

Google에 저작권 침해 신고를 할 수 있습니다 . 아래 양식에서 신청하십시오.
저작권 침해 신고: 웹 검색 – Google 

중복 콘텐츠를 확인하는 방법

중복 콘텐츠는 ' Google Search Console (구글 검색 콘솔)'을 사용하여 확인할 수 있습니다.

1. 관리 화면 왼쪽 「인덱스」아래에 있는 「페이지」를 클릭.

Search Console에서 중복 콘텐츠를 확인하려면 1

2. 중복 콘텐츠가 있는 경우 ' 페이지가 색인에 등록되지 않은 이유 '에 메시지가 표시됩니다. 클릭하면 어떤 URL에서 중복이 발생했는지 확인할 수 있습니다.

Search Console에서 중복 콘텐츠를 확인하려면 2단계

※ 각 메시지에 대한 자세한 내용은 Google 도움말 페이지 " 페이지 색인 등록 보고서 "에서 확인할 수 있습니다.

중복 페이지의 URL을 'URL 검사 도구'로 조사하면 어떤 페이지가 Google에서 정식 페이지로 판단되는지 확인할 수 있습니다 .

URL 검사 도구에서 정식 URL 확인

중복 콘텐츠 및 SEO 관련 FAQ

중복 콘텐츠에 대해 자주 묻는 질문에 답변했습니다. 꼭 참고하십시오.

1. 중복 콘텐츠의 기준이 되는 비율은?

중복 콘텐츠의 기준이 되는 특정 비율(%)은 없습니다 .

Google 직원 John Mueller는 Twitter 사용자와의 상호 작용 에서 다음과 같이 답변했습니다.

질문자: 중복 콘텐츠를 나타내는 백분율이 있나요? 예를 들어, 사이트의 다른 페이지와 비교하여 최소 72.6%가 독특한 페이지가 되도록 노력해야 합니까? Google은 비율을 측정하고 있습니까?

뮐러 씨: 숫자가 없습니다 (어떻게 측정할까요?).

※당사에서 번역.

2. 「규약」이나 「면책 사항」은 중복해도 문제 없다?

「규약」이나 「면책사항」등의 정형문이 중복되어 있어도 문제 없습니다 .

EC 사이트에 있어서의 「배송 정보」나 「지불 정보」등의 정형문도 같습니다.

Google은 웹 세계에서 이러한 상용문의 중복이 당연히 발생한다는 것을 이해하고 적절하게 처리할 수 있습니다.

"정형문만으로 구성되어 있어 고유의 콘텐츠가 없다"는 페이지가 대량으로 있으면 문제입니다만, 그렇지 않으면 걱정은 필요 없습니다.
참고: How does required duplicate content (terms and conditions, etc.) affect search? – YouTube (2013)

3. 다른 형식으로 동일한 콘텐츠를 제공하는 것은 중복?

'YouTube 동영상'과 '블로그 기사' 등 형식이 다르면 내용이 같아도 중복으로 간주되지 않습니다 .

각각 다른 콘텐츠로 평가됩니다.

형식이 다르면 모든 사람에게 정보를 전달할 수 있으므로 Google은 오히려 다른 형식으로 수평 배포를 권장합니다.
참고: Google: Same Content in Different Formats is Not Duplicate – Search Engine Journal

4. 자사 EC 사이트와 라쿠텐에서 같은 콘텐츠를 공개하면 중복?

자사 EC 사이트를 운영하고 있고, 라쿠텐 시장이나 아마존에서도 똑같은 콘텐츠를 공개한 경우, 중복 콘텐츠가 됩니다 .

Google의 Matt Catts는 2013년 강연에서 다음과 같이 답변했습니다.

중복 컨텐츠가 된다. 페널티는 아니지만 어떤 것은 검색 결과에 나오지 않을 것이다.

인용원 : EC 사이트에서 자사 사이트와 라쿠텐 숍의 중복 콘텐츠를 방지하는 방법 - 해외 SEO 정보 블로그

복수의 사이트에서 동일 상품을 판매하는 경우의 중복 회피책에 대해서는, 상기의 스즈키 켄이치씨의 블로그를 참고로 해 봐 주세요.

5. 중복 컨텐츠 대책으로 noindex 를 설정하는 것은 OK?

중복 콘텐츠를 방지하기 위해 'noindex' 태그를 사용하는 경우가 있지만 Google은 권장하지 않습니다 .

왜냐하면, noindex 태그는 페이지의 평가를 제로로 해 버리기 때문입니다.

예를 들면 「페이지 A로 순위를 올리고 싶은데 중복된 페이지 B가 오르고 있다」라고 하는 상황에서 B 페이지에 설치해야 하는 것은 noindex 가 아니고, rel=”canonical” 입니다.

그러면 평가를 A 페이지에 수집할 수 있습니다.

그 페이지의 평가는 일절 필요 없다고 확신할 수 있으면 중복 컨텐츠 대책에 「noindex」를 사용해도 OK입니다만, 어디까지나 noindex 는 최종 수단입니다.

【정리】중복 컨텐츠는 페널티가 아니다! SEO에서 이기기 위해 중복 조치를 취합시다.

중복 콘텐츠는 악의적인 콘텐츠가 아니면 패널티 대상이 되지 않습니다.

하지만, 다음과 같은 이유로 SEO에서 바람직하지 않은 현상임은 확실합니다.

중복 콘텐츠 SEO의 단점

 

  • 단점 1. 링크 평가가 분산됨
  • 단점 2. 크롤러 리소스가 낭비됨
  • 단점 3. 의도한 페이지가 검색결과에 표시되지 않을 수 있음

 

사이트에서 중복 콘텐츠를 발견한 후 이 문서에서 소개한 방법으로 해결해 보세요.

중복 콘텐츠를 처리하는 방법

 

  • 대처법 1.301 리디렉션 처리
  • 대처법 2. canonial 태그 설치
  • 대처법 3. 어노테이션 설정
  • 대처법 4. 유사 콘텐츠 삭제 및 통합
  • 대처법 5. 콘텐츠 전송 대상에 대한 조치 요청

 

만약 「중복 컨텐츠를 해소해도 순위가 오르지 않는다」라고 곤란한 경우는, 꼭 당사에 상담해 주십시오.