구글 서치콘솔 사이트맵 제출 오류 해결법: "가져올 수 없음" 원인 점검 가이드
구글 서치콘솔에서 사이트맵을 제출했는데 "가져올 수 없음", "알 수 없음"이라는 메시지가 뜬다면 당황스러울 수 있습니다. 이는 단순 오류일 수도 있지만, 대부분 구글봇이 사이트맵 파일에 정상적으로 접근하지 못했을 때 발생합니다. 이 글에서는 문제의 원인을 단계별로 점검하고 해결할 수 있는 방법을 안내합니다.
1. 사이트맵 URL이 올바른지 확인하세요
Blogger나 다른 CMS를 사용하는 경우 기본 사이트맵 URL이 다를 수 있습니다. 다음은 Blogger의 일반적인 사이트맵 예시입니다:
- 전체 게시물 Atom 피드:
https://yourblog.blogspot.com/atom.xml?redirect=false
- RSS 피드 형식:
https://yourblog.blogspot.com/feeds/posts/default?alt=rss
- 최대 500개 게시물까지 제한된 피드:
https://yourblog.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
직접 브라우저에서 접속하여 XML 형태로 로드되는지 확인하세요. 404 에러나 빈 페이지가 표시된다면 사이트맵 URL에 구조적인 문제가 있을 수 있습니다.
2. robots.txt에서 sitemap 차단 여부 확인
구글봇이 sitemap을 읽지 못하는 가장 흔한 이유는 robots.txt
설정에서 차단되어 있기 때문입니다.
확인 URL: https://yourblog.blogspot.com/robots.txt
올바른 예시:
User-agent: *
Disallow: /search
Allow: /
Sitemap: https://yourblog.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
Disallow 규칙에 sitemap 경로가 포함되어 있으면 안 되고, Sitemap:
항목이 반드시 포함되어 있어야 합니다.
3. 사이트맵 파일 자체의 오류 점검
사이트맵이 정상적으로 보이더라도 구글이 인식하지 못하는 경우가 있습니다. 주요 원인은 다음과 같습니다:
- Content-Type 헤더 확인:
application/xml
또는text/xml
이어야 하며,application/atom+xml
은 문제가 될 수 있음 - XML 문법 오류: 잘못된 태그, 종료 태그 누락, 날짜 포맷 오류 등이 있는 경우 크롤링 실패
curl 명령어로 헤더를 확인해보세요:
curl -I https://yourblog.blogspot.com/atom.xml
4. 구글봇 접근 차단 여부 확인
간혹 서버 측 설정으로 인해 Googlebot의 접근이 차단되는 경우가 있습니다.
- Cloudflare, 웹 방화벽 등의 과도한 보안 설정
- 모바일 버전 URL(
?m=1
)이 잘못 처리되는 경우
Search Console의 URL 검사 도구를 활용해 sitemap.xml 접근 상태를 확인해보세요.
5. 구글의 캐시 처리 지연 가능성
사이트맵 제출 후 바로 상태가 반영되지 않는 경우도 많습니다. "가져올 수 없음" 메시지가 일시적으로 표시될 수 있으며, 실제 색인은 며칠 후 진행될 수 있습니다.
2~3일 후 다시 확인하거나, 사이트맵을 재제출해도 무방합니다.
6. sitemap 분할 제출 시도
블로그에 게시물이 많다면, sitemap을 500개 단위로 나눠서 제출해보세요.
예시:
https://yourblog.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
https://yourblog.blogspot.com/atom.xml?redirect=false&start-index=501&max-results=500
각 URL을 Search Console에서 개별 사이트맵으로 등록하세요.
7. 올바른 프로퍼티에 sitemap 제출했는지 확인
마지막으로 Search Console에 등록한 프로퍼티와 실제 sitemap URL의 도메인이 일치하는지 확인하세요.
- 예: 사이트가
https://zabdamlab.blogspot.com
로 열리는데http
또는www
버전에 제출했다면 오류 발생 - 항상 정확히 일치하는 프로토콜(
https
)과 도메인으로 제출해야 합니다
요약 체크리스트
점검 항목 | 확인 여부 |
---|---|
sitemap 주소가 정확한가? | ✅ |
브라우저에서 sitemap이 로드되는가? | ✅ |
robots.txt에서 sitemap이 차단되지 않았는가? | ✅ |
Content-Type이 올바른가? (application/xml ) |
✅ |
서버 또는 보안 시스템이 Googlebot을 차단하고 있지 않은가? | ✅ |
Search Console의 URL 검사 도구에서 오류가 없는가? | ✅ |
문제가 해결되지 않았다면, sitemap URL을 댓글이나 메시지로 남겨주세요. 실제로 분석해서 구체적인 해결책을 도와드릴 수 있어요.
필요하시면 이 글을 HTML 블록 형태로도 변환해드릴 수 있습니다. 요청만 주세요 😊
댓글 쓰기