사이트맵 Content-Type이 application/atom+xml인 이유와 영향
사이트맵인데 Google이 피드라고 인식한다면? 이 작은 차이 하나가 검색 노출에 영향을 미칠 수 있어요.
안녕하세요! 요즘 블로그를 열심히 운영하다가 Google Search Console에서 뜨는 ‘사이트맵을 가져올 수 없음’이라는 경고 메시지에 깜짝 놀랐어요. 분명히 사이트맵 주소도 맞고, 접근도 잘 되는데 왜 오류가 나는 걸까 싶었죠. 그러다 보니 자연스럽게 콘텐츠 타입(Content-Type)에 대해 파고들게 되더라구요. 특히 블로그스팟이나 일부 블로그 플랫폼에서는 사이트맵이 application/atom+xml
로 제공되는 경우가 있는데, 이게 단순한 형식 차이 같지만 실제로는 검색 색인에 영향을 줄 수 있다는 사실, 알고 계셨나요? 오늘은 이 주제를 중심으로 한 번 깊이 있게 풀어보려 해요.
목차
사이트맵의 Content-Type이란?
우리가 브라우저에서 어떤 파일을 요청했을 때, 서버는 그 파일의 "Content-Type"이라는 정보를 함께 보냅니다. 이건 쉽게 말하면 "이 문서는 어떤 형식이야"라고 알려주는 일종의 태그 같은 거예요. 사이트맵의 경우 application/xml
또는 text/xml
로 반환되는 게 표준입니다. 그런데 블로그스팟이나 일부 CMS는 application/atom+xml
형식을 쓰고 있죠. 이게 검색엔진 입장에선 "이건 피드인가?"라고 착각할 수 있는 여지를 남겨요.
application/xml vs. application/atom+xml 비교
구분 | application/xml | application/atom+xml |
---|---|---|
정의 | 일반적인 XML 문서 | Atom 피드(XML 기반 블로그/뉴스 피드) |
용도 | 사이트맵, API 등 다양한 XML 콘텐츠 | 블로그 포스트, 뉴스 피드 배포 |
사이트맵 표준 | Google 공식 지원 | 비공식, 일부만 인식 |
Google 지원 | 정상 처리 | 일부 색인 불가 |
왜 사이트맵이 Atom 형식으로 제공될까?
이유는 간단합니다. 블로그스팟(Blogger.com)이나 워드프레스 같은 플랫폼은 RSS나 Atom 같은 피드 형식을 오래전부터 지원해왔고, 이걸 검색 엔진도 '사이트 업데이트 알림용'으로 받아들이기 시작했거든요. 그러다 보니 `/sitemap.xml`을 요청해도 실제론 최신 글 목록을 제공하는 Atom 피드가 뜨는 거예요.
- 플랫폼 자체가 기본적으로 피드 중심 구조를 가짐
- 설정 변경 없이 자동으로 Atom 형식 사이트맵 제공
- 사용자 입장에선 차이를 알아채기 어려움
Google은 어떻게 인식할까?
Google Search Console은 이 Atom 사이트맵도 일단 받아줍니다. 하지만 문제는 이게 "사이트맵으로 인식되느냐, 아니면 단순 피드로 인식되느냐"예요. 실제로는 사이트맵 전용 XML 태그인 <urlset>
가 아닌 <feed>
를 루트로 사용하기 때문에, 검색 색인 처리 방식이 다를 수 있습니다.
실제 검색 색인에 미치는 영향
상황 | 영향 |
---|---|
사이트맵이 Atom 형식 | Google이 '피드'로 해석, 일부 색인 제외 |
Search Console에 제출 | "가져올 수 없음" 오류 발생 가능성 |
검증 도구 활용 시 | 표준 사이트맵 형식 아님으로 경고 |
외부 검증 도구에서의 인식 문제
SEO 체크나 사이트맵 검증 도구들, 예를 들어 XML 사이트맵 검사기 같은 걸 돌리면 application/atom+xml
타입에 대해 이렇게 말할 수도 있어요. “이건 사이트맵 형식이 아닌 것 같습니다.” 심지어 일부 도구는 아예 에러로 판단해버리죠. 이는 표준적인 <urlset>
구조를 기대하는 도구들이 많기 때문이에요.
- 사이트맵 구조가 표준 XML이 아님
- 루트 태그가
<feed>
일 경우 자동 실패 처리 - 일부 검증기에서는 "사이트맵 형식 아님"으로 분류
콘텐츠 타입 해결을 위한 권장 조치
그럼 어떻게 해야 할까요? 해결책은 의외로 간단해요. 블로그스팟 사용자라면 기본적으로 /sitemap.xml
대신, 다음의 주소들을 추가로 Google Search Console에 제출해 보세요.
-
/sitemap-pages.xml
-
/sitemap-posts.xml
-
/feeds/posts/default?rss=2
요약 및 실전 팁 정리
한 줄로 요약하자면 이렇습니다: 사이트맵이 Atom 형식이라면, Google은 이를 피드로 인식할 수 있으며, 색인 효율이 떨어질 수 있다는 점이에요. 그러니 가능하다면 표준 XML 사이트맵 형식도 함께 제출해주는 게 가장 안전한 방법입니다.
아니요, 오류는 아니지만 Google이 일부 색인에서 제한을 둘 수 있어요. 가능하면 표준 XML 형식도 함께 제출하는 게 좋습니다.
네. Googlebot은 Content-Type에 따라 파일을 해석하므로 올바른 타입이 중요해요.
직접 바꾸기는 어렵지만, 다른 경로의 XML 사이트맵 주소를 Search Console에 제출하는 것으로 대체 가능합니다.
Google은 일부 지원하지만, 최적화 측면에선 표준 사이트맵이 더 유리해요.
Google의 sitemaps.org
가이드라인을 따르는 것이 가장 안전합니다. application/xml 또는 text/xml 형식이 권장돼요.
네. 오히려 콘텐츠 종류별로 나눠서 제출하면 Google이 더 정밀하게 색인을 할 수 있습니다.
여기까지 읽어주셔서 정말 감사합니다. 사실 이런 사이트맵의 형식이나 Content-Type 같은 얘기, 처음 들으면 좀 복잡하고 따분할 수도 있죠. 저도 예전엔 그런 기술적인 문제는 그냥 넘어가곤 했거든요. 그런데 직접 Search Console에서 오류 메시지를 마주치고 나니, 하나하나 뜯어보게 되더라구요. 이번 기회에 여러분도 자신의 사이트맵 상태를 한 번쯤 체크해보시면 좋겠어요. 조그만 설정 하나가 색인 품질에 영향을 미칠 수 있거든요. 앞으로도 이런 숨겨진 SEO 팁들, 자주 나눌게요. 댓글이나 메시지로 궁금한 점도 언제든지 남겨주세요. 우리 같이, 더 잘 보이는 웹을 만들어봐요!
sitemap, content-type, atom xml, application/xml, 구글 색인, search console, 블로그스팟, 사이트맵 오류, seo 최적화, 사이트맵 포맷
댓글 쓰기