오늘 워드프레스 블로그의 정보를 사이트맵 정보를 확인하다가 아래와 같은 오류를 만났습니다. 등록된 사이트의 서치콘솔 사이트맵 가져올수 없음 오류였는데요. 서치콘솔의 색인된 페이지가 몇날 며칠째 늘어나지 않아 색인이 안되는게 문제인가? 싶어서 원인을 알아보다가 찾은 이슈입니다.
오늘은 사이트맵 가져올수 없는 오류에 대해서 해결책을 알아보도록 하겠습니다.
사이트맵 가져올수 없음 오류
이 당시 저의 구글 서치콘솔 패널에서는 8월 21일을 마지막으로 더이상 Sitemap 파일을 읽지못했다는 표시가 나오고 있었습니다. 발견된 페이지수는 0개로 나와 있었죠.
제 홈페이지의 총 페이지수는 10월 21일 기준 9개였고, 포스트의 갯수는 26개가 발행된 상태였습니다. 전체 발견되어야할 총 페이지수는 최소 35개였고, 각종 카테고리등이 포함되면 40개 이상의 페이지가 발견되어야 할 것입니다.
문제해결
이 문제를 해결하기 위해서는 몇가지 방법을 사용할 수 있습니다. 저는 이 모든걸 사용했기 때문에 어떤 방법이 정확히 문제를 해결했는지 알기 어렵습니다. 이 글을 읽는 여러분들은 한번에 하나씩 시도해가면서 원인을 찾을 수도 있고, 저처럼 모든걸 다 하고 원래대로 돌아오길 바라는 방법도 있습니다.
- 캐시 플러그인 삭제 및 기존 플러그인의 캐시 삭제
- 사이트맵 재등록
- RSS 등록
캐시 플러그인 삭제
워드프레스는 다양한 플러그인을 제공합니다. 모든 플러그인이 정상적으로 호환되는 것은 아니기 때문에 문제가 있다면 해당 플러그인은 삭제하는 것이 좋습니다. 특히 속도를 빠르게 해주는 캐시 플러그인은 사이트에 파일을 저장하면서 다른 기능에 오류를 발생시킬 수 있습니다.
저는 여러번 방문한 사용자에게 기존의 무거운 php 대신 가벼운 html 버전을 보여주는 플러그인입니다. 사용자에게 렌더링한 화면을 보여주지 않아서 좋지만, 별도의 페이지를 만들고 지움으로서 사이트맵의 구성에 문제를 줄 수 있다고 하니, 꼭 필요한 기능이 아니면 삭제하면 좋습니다. 저 역시 삭제를 완료하였습니다.
두번째, YARPP 플로그인 (연관글, 또 읽어봐야 하는 글을 보여주는 플러그인) 의 캐시를 모두 삭제하였습니다. 역시 캐시를 사용하면, 사이트 내에 불필요한 정보가 생성될 수 있기 때문입니다. 삭제해도 사이트의 동작에는 큰 이상이 없습니다. (조금 느려진다고 하는데, 사이트 크롤링이 안되는 것도다는 좋습니다.)
사이트맵 재등록
사이트맵 가져올수 없음 이슈를 해결하는 방법 중 두번째는 기존 등록된 사이트맵을 삭제하고, 새로운 사이트맵을 등록하는 것입니다. 아무것도 건들지 않은 사이트라면 사이트맵 자체가 문제가 될리 없습니다. 따라서 일시적인 구글 서치콘솔의 문제이거나 혹은 오류일 수 밖에 없는데요. 이 때에 할 일은 삭제 후 재등록이 가장 좋은 방법입니다.
서치콘솔의 Sitemap 메뉴에 진입합니다. 오른쪽 위에 보면 점 세개짜리 메뉴가 보이고, 이걸 누르면 사이트맵 삭제 메뉴가 나옵니다. 삭제를 누르면 정말 삭제할 것이냐고 묻습니다. 삭제 버튼을 눌러 모두 삭제해줍니다.
그 이후 사이트의 전체 주소를 복사해 콘솔창의 URL 검사창에 넣어줍니다. 서치콘솔은 구글에서 색인을 찾을 거고, 이미 등록된 색인이기 때문에 아래와 같인 이미지를 보여줄 것입니다. 거의 다 왔습니다.
이제 다시 사이트맵으로 가서 사이트맵을 추가합니다. URL 은 sitemap 의 주소를 써주면 되는데, 주로 sitemap_index.xml 이 됩니다. 저의 경우 아래와 같이 입력하였습니다.
시간이 지나면 아래처럼 하나씩 성공으로 바뀌게 되며, 발견된 페이지수도 증가하게 됩니다. 아래 그림은 변경 직후에 리프레시 했을 때 나온 화면입니다. 총 17개의 페이지가 발견되었다고 나옵니다. 문제는 가장 중요한 post 의 사이트맵이 처리되지 않고 있다는 것인데요.
해결 방법은 간단합니다. 그냥 기다리면 됩니다. 사이트맵을 잘 등록했다면, 그리고 사이트맵 파일 자체가 문제가 없다면 그냥 기다리는 것밖에 답이 없습니다. 저는 18시간을 기다렸고, 결국 아래와 같이 post 까지 모두 등록이 완료되어 총 45개의 페이지가 발견되어 등록되었습니다.
RSS 입력
내가 운영하는 워드프레스 블로그의 글이 검색엔진에 노출되기 원하는 것은 모든 운영자의 생각일 것입니다. 공부하고 글을 썼는데도 노출이 안되면 운영할 힘을 잃어버리게 되죠.
때문에 웹사이트를 검색엔진에 등록하는 것입니다. 등록만 하면 되는 줄 알았는데, 사이트맵이란 것도 등록해야 합니다. 여기서 RSS 라는 것도 등록해주면 좋습니다. 이 사이트에 어떤 글이 발행되고 있는지를 알려주는 것입니다. 사이트맵 가져올수 없음 이슈도 이를 통해 해결할 수 있습니다.
RSS 를 입력하는 건 사이트맵을 제출하는 것과 동일하게 하면 됩니다. 새 사이트맵 추가에서 URL 부분에 rss 를 입력합니다. (소문자로 입력하고, 뒤에 .xml 등을 붙이지 않습니다.)
이 상태로 제출하게 되면 제출된 사이트맵에 /rss 가 추가되고, 상태가 성공으로 바뀝니다. 발견된 페이지는 통상 5개 ~ 15개 사이라고 하네요. RSS 에 얼마나 많은 정보를 저장하는지가 관건인데 숫자는 크게 상관없습니다. 일단 성공적으로 가져오는 게 중요합니다.
마치며
구글서치콘솔 사이트맵 가져올수 없음 오류에 대해서 알아봤습니다. 이를 해결하기 위해 sitemap 재등록과 RSS 등록을 해보았는데요.
구글 검색엔진은 사이트를 인덱싱할 때 다양한 정보를 참고합니다. 사이트 자체의 정보와 함게 서치콘솔에 제출된 정보, 사이트맵, rss 등등을 참고하죠. 최대한 많은 정보를 줄수록 구글은 내 사이트에 대해서 더 잘 알게 되고, 이를 통해 다른 사람이 구글에서 뭔가를 검색하면 내 사이트가 노출될 가능성이 높아지게 되는 것입니다.
다만, 모든 글이 다 “노출”되는 건 아닙니다. 사이트 자체가 신뢰성이 높은 컨텐츠를 많이 발행했다면 그 사이트에서 발행되는 글이 좀 더 높은 확률로 검색엔진에 노출되겠죠. 즉, 열심히 꾸준히 글을 발행하는 사이트가 노출될 가능성이 높아지게 된다는 것입니다.
* 꾸준히 발행하기 위해서는 스트레스가 없어야 합니다. 빨간줄 뜨는 것부터 없애세요.
많은 사람들이 블로그에 컨텐츠를 쌓기도 전부터 누락이나 노출이 안된다던지하는 방법적인 이슈를 고민하는 경우가 많습니다. 밥을 하지도 않았는데 벌써부터 맛없으면 어쩌지 하는 것부터 생각하는 꼴입니다.
컨텐츠부터 쌓으시길 바랍니다. 노출이 안되려면 노출이 안될 컨텐츠가 있어야 합니다. 글이 없으면 아무것도 아니에요.