웹사이트에서 Sitemap 파일의 중요성

게시 됨: 2019-12-03

2019년 12월 11일 최종 업데이트

검색 엔진은 웹 크롤링을 사용하여 다른 사이트의 웹 콘텐츠를 인덱싱하여 웹 콘텐츠를 업데이트합니다. 스파이더 또는 스파이더봇으로도 알려진 웹 크롤러는 페이지 URL의 웹 인덱싱을 위해 World Wide Web을 체계적으로 탐색하는 인터넷 봇입니다. graphic of a spider bot

웹 크롤러는 무엇을 합니까?

웹 크롤러는 사용자가 보다 효율적으로 검색할 수 있도록 다운로드한 페이지를 인덱싱하는 검색 엔진에서 처리할 페이지를 복사합니다. 웹 크롤러는 일반적으로 올바르게 링크된 경우 대부분의 사이트 페이지를 검색할 수 있습니다. 그러나 사이트맵 파일을 사용하면 웹사이트 페이지의 크롤링을 개선할 수 있습니다.

귀하의 사이트가 새롭고 외부 링크가 거의 없거나 사이트가 리치 미디어 콘텐츠를 사용하는 경우 웹 크롤러는 한 페이지에서 다른 페이지로 링크를 따라 웹을 크롤링합니다. 설상가상으로 사이트가 격리되거나 서로 잘 연결되지 않은 방대한 콘텐츠 페이지 아카이브로 광범위하다면 웹 크롤러가 새 페이지나 최근에 업데이트된 페이지의 일부 크롤링을 간과할 수 있습니다. 결과적으로 검색 엔진은 다른 사이트에 링크되어 있지 않으면 귀하의 페이지를 발견하지 못할 수 있습니다. 위의 경우 사이트맵 파일은 검색 엔진이 웹사이트의 일부 페이지를 간과하지 않도록 웹 크롤러에 추가 정보를 제공할 수 있습니다.


저것! 회사는 전 세계 에이전시에 매력적이고 효과적인 웹 디자인 서비스를 제공합니다. 당사의 화이트 라벨 웹 디자인 서비스에 대해 자세히 알아보고 귀하와 귀하의 클라이언트가 웹 존재를 구축하거나 개선하도록 도울 수 있는 방법에 대해 알아보십시오. 오늘 시작하세요!


Sitemap 파일이란 무엇이며 어떻게 구성되어 있습니까?

사이트맵은 각 URL에 대한 추가 메타데이터와 함께 사이트의 URL을 나열하는 XML 태그 파일입니다. 페이지가 마지막으로 업데이트된 시간, 일반적으로 변경되는 빈도, 사이트의 다른 URL에 비해 페이지가 얼마나 중요한지(우선순위) 등. 검색 엔진이 웹사이트를 보다 지능적으로 크롤링할 수 있도록 웹사이트의 페이지, 비디오, 이미지 및 기타 파일과 이들 간의 관계에 대한 정보를 제공하는 다양한 사이트맵 파일을 가질 수 있습니다. 사이트맵은 크롤러에게 웹사이트에서 중요한 파일을 알려주고 이러한 파일에 대한 중요한 정보도 제공합니다. 사이트맵을 지원하는 웹 크롤러는 사이트맵의 모든 URL을 선택하고 관련 메타데이터를 사용하여 해당 URL에 대해 학습합니다.

screenshot of a text file with sitemap code 사이트맵 프로토콜 형식은 XML 태그로 구성됩니다. 사이트맵에는 다음이 포함되어야 합니다.

  • <urlset> 태그 내에 네임스페이스(프로토콜 표준)가 있는 여는 <urlset>.
    • 상위 XML 태그로서 각 URL에 대한 여는 <url> 태그 항목.
      • 페이지의 URL이 있는 각 <url> 상위 태그의 하위 항목인 <loc> 태그.
    • 닫는 </url> 태그,
  • 닫는 </urlset> 태그.

다음은 몇 가지 선택적 태그가 있는 기본 사이트맵 파일 프로토콜 및 구조를 보여줍니다. 사이트맵 프로토콜의 XML 태그 정의에 대한 자세한 내용은 https://www.sitemaps.org/protocol.html을 방문하세요.

screenshot of website code

사이트맵 파일에 나열된 모든 URL은 사이트맵 파일과 동일한 도메인에 있어야 합니다. 예를 들어 사이트맵 파일이 https://www.mydomain.com/sitemap.xml에 있는 경우 https://subdomain.mydomain.com의 URL을 포함할 수 없습니다. 사이트맵 파일이 https://www.mydomain.com/myfolder/sitemap.xml에 있는 경우 https://www.mydomain.com의 URL을 포함할 수 없습니다. 사이트맵 파일 프로토콜은 UTF-8 문자 인코딩 방법을 사용하여 생성해야 합니다. HTML 서버의 루트 디렉토리에 사이트맵을 배치하는 것이 좋습니다. 즉, https://www.mydomain.com/sitemap.xml에 넣으십시오.

사이트맵은 50MB 이하여야 하며 최대 50,000개의 URL을 포함할 수 있습니다. 이러한 제한은 웹 서버가 대용량 파일을 제공하는 데 방해가 되지 않도록 하는 데 도움이 됩니다. 사이트에 50,000개 이상의 URL이 포함되어 있거나 사이트맵이 50MB보다 큰 경우 여러 사이트맵 파일을 만들고 사이트맵 색인 파일을 사용해야 합니다. 사이트는 작지만 URL을 50,000개 이상 늘리거나 파일 크기를 50MB 이상으로 늘릴 계획이라면 사이트맵 색인 파일 사용을 시작하는 것이 좋습니다.


That! Company White Label Services


<loc> 태그에는 페이지 URL의 프로토콜(예: HTTP 또는 HTTPS)을 포함해야 합니다. 웹 서버에 슬래시가 필요한 경우 URL에 슬래시를 포함해야 합니다. 예를 들어 http://www.mydomain.com/은 Sitemap에 대한 유효한 URL이지만 www.mydomain.com은 그렇지 않습니다. 사이트맵에 페이지 URL의 한 버전만 나열하는 것이 중요합니다. 즉, HTTPS URL만 나열하거나 HTTP URL만 나열하고 둘 다 나열할 수는 없습니다. 여러 버전의 페이지 URL을 포함하면 검색 엔진에서 사이트를 불완전하게 크롤링할 수 있습니다.

사이트맵 파일을 검색 엔진에서 사용할 수 있도록 하는 두 가지 일반적인 방법은 검색 엔진 제출 도구를 통해 제출하거나 사이트맵: https://www.mydomain.com/sitemap.xml 과 같은 줄을 웹사이트에 삽입하여 제출하는 것입니다. robots.txt 파일은 사이트맵 파일의 경로를 지정합니다. robots.txt 파일은 웹사이트에서 색인 생성에 포함하지 않으려는 부분을 검색 엔진에 알려주고 사이트맵은 검색 엔진에 원하는 위치를 알려줍니다.

사이트맵 파일이 왜 중요한가요?

graphic of a sitemap structure 사이트맵 파일을 가지고 있다고 해서 불리한 점은 없으며, 하나 있으면 SEO를 향상시킬 수 있으므로 웹사이트에 파일을 두는 것이 좋습니다. 사이트맵은 검색 엔진이 사이트 페이지를 더 쉽게 찾을 수 있도록 해주기 때문에 SEO에 중요합니다. 이것은 검색 엔진이 웹사이트뿐만 아니라 웹 페이지의 순위를 매기기 때문에 중요합니다. 사이트맵을 집의 청사진과 같이 생각할 수 있습니다. 각 웹 페이지가 방으로 되어 있어 검색 엔진이 집 안의 모든 방을 쉽고 빠르게 찾을 수 있습니다.

웹사이트를 최적화하는 데 도움이 되는 다양한 SEO 트릭과 팁이 있으며 그 중 하나는 사이트맵 파일을 사용하는 것입니다. 사이트맵 파일의 중요성은 때때로 크게 과소평가됩니다. 다시 말하지만, 사이트맵은 웹사이트의 문자 그대로의 맵입니다. 웹사이트 탐색을 더 쉽게 만들고 웹사이트에 대한 업데이트된 사이트맵 파일을 유지하면 자신뿐 아니라 검색 엔진에도 적합합니다. 사이트맵 파일은 사이트가 검색 엔진과 통신하는 데 필수적인 방법입니다.

사이트맵 파일을 사용하면 웹사이트에 어떤 이점이 있습니까?

사이트맵 파일을 사용하면 많은 이점이 있습니다. 웹 사이트를 탐색할 수 있는 지도를 제공할 뿐만 아니라 검색 엔진에 더 나은 가시성을 제공합니다. 사이트맵 파일은 웹사이트 페이지의 변경 사항이 발생한 직후 검색 엔진을 링크할 수 있는 기회를 제공합니다. 검색 엔진이 페이지의 변경 사항을 설명하기 위해 서두를 것이라고 기대할 수는 없지만 웹 사이트에 사이트맵 파일이 없을 때와 비교하여 검색 엔진이 의심할 여지 없이 더 빠르게 수정한 내용을 변경합니다.

웹사이트에 대한 사이트맵 링크가 있고 검색 엔진에 제출되면 검색 엔진이 방문자를 사이트로 가져올 때 외부 링크에 덜 의존하게 됩니다. 사이트맵 파일을 가지고 검색 엔진에 제출하면 검색 엔진을 귀하의 웹사이트로 가져오는 외부 링크에 덜 의존하게 됩니다.

graphic of a sitemap structure in use

사이트맵 파일은 열악한 내부 링크를 수정하는 데에도 도움이 됩니다. 예를 들어, 실수로 끊어진 링크나 도달할 수 없는 고아 페이지가 있는 경우입니다. 단순히 오류를 수정하는 것보다 사이트맵에 의존하는 것은 현명한 생각이 아니라는 점에 유의해야 합니다. 검색 엔진 프로세스는 크롤링 일정을 잡기 위해 복잡한 알고리즘에 의존하기 때문에 사이트맵 파일을 사용한다고 해서 사이트맵의 모든 URL이 크롤링되고 색인이 생성되는 것은 아닙니다. 그러나 대부분의 경우 귀하의 웹사이트는 사이트맵 파일이 있으면 이점을 얻을 수 있으며 사이트맵 파일이 있다고 해서 불이익을 받지는 않습니다.

저자: 아르투로 S.