과거 네이버 검색 하면 '카페'나 '블로그'가 아니면 검색 결과에 잘 나오지 않는다는 말이 많았습니다. 그리고 판에 박힌 듯한 포스트들만 있고 정작 유용한 정보는 잘 나오지 않는 느낌도 받았었습니다.
제 블로그가 네이버 검색 결과에 처음 뜨던 시기에는 블로그 이름을 다 쳐야 검색에 나왔습니다. 그러더니 몇몇 게시물이 네이버 검색에 걸리게 되었습니다. 하지만 네이버에서의 유입이 많지는 않았습니다. 구글 블로그(Blogger.com)는 네이버에서 '웹문서'로 검색이 되었기 때문에 검색 결과에 뜨더라도 결과 밑부분에 있는 경우가 대부분이었습니다.
그러나 어느 순간 네이버(모바일 페이지)에서 유입이 증가하더니, 요즘 들어서는 네이버 PC 페이지에서도 유입이 증가하고 있습니다. 2018년 2월 이후 일반적인 키워드로 제 블로그에 방문하는 경우가 많아지고 있습니다. '웹페이지'로 검색된 결과가 위쪽에 뜨는 경우도 많았습니다. 네이버가 통합 검색에서 사이트 검색과 웹 페이지 검색을 통합하여 제공하기 시작한 것이 원인 같습니다.
이 블로그는 일본 여행, 일본 철도나 일본 문화를 다루는 블로그입니다. 이 포스트는 블로그 주제와 전혀 맞지 않습니다. 그러나 이 글을 통해서 블로그를 하면서 독자들에게 어떤 글을 제공해야 하는지 정리를 해 두고 싶었습니다. 앞으로 제가 블로그를 운영하는데 도움이 될 뿐만 아니라 새로 블로그를 하시는 분들께도 도움이 될 것이기 때문입니다.
검색엔진의 기본적인 원리
검색 엔진이 이미 가지고 있는 웹 페이지에서 링크를 추출한 뒤, 그 페이지를 수집합니다. 그런 다음 수집한 페이지에서 다시 링크를 추출해서 그 페이지를 수집하는 것을 계속 반복합니다. 링크를 통한 수집 말고도 웹마스터 도구 등을 이용하여 검색 엔진에 본인의 웹 사이트를 제출할 수도 있습니다.
이렇게 수집된 웹 페이지는, 사용자가 검색창에 검색어를 치면 사용자가 찾을 만한 정보를 보여줍니다. 그렇기 때문에 자신의 블로그나 사이트가 검색에 뜨게 하려면 다른 사람들이 링크를 걸어 주거나, 본인이 직접 검색 엔진에 URL을 제출해야 합니다.
하지만 단순하게 하면 스팸이나 어뷰징의 공격을 받게 됩니다. 마케팅 목적의 글은 위쪽에 나올수록 자사 제품의 매출이 증가합니다. 스팸 글 역시 위쪽에 나와야 스패머 입장에서 이득이 됩니다. 이러한 문제를 방지하기 위해 검색 엔진은 다양한 조건으로 웹 페이지를 평가하고, 순위를 매겨 사용자에게 보여주고 있습니다. 그 세부적인 기준은 공개될 경우 어뷰징 위험이 높아지기 때문에 공개하고 있지 않습니다.
과거의 네이버 검색
카페와 블로그 검색에 치중
네이버 검색은 그동안 카페나 블로그 검색에 치중한 모습을 보였습니다. 네이버 카페나 네이버 블로그를 중심으로 한 검색 결과를 보여주는 것이 대부분이었습니다. 자사 서비스 내에서 만들어진 컨텐츠만을 검색에 표출해 준 것이죠.타사 서비스의 경우 검색이 잘 되지 않았습니다. 그나마 티스토리나 다음 블로그 등 국내의 블로그는 그나마 '블로그' 메뉴에서 볼 수 있었습니다. 그러나 제가 사용하고 있는 블로거닷컴과 같은 외국 블로그의 경우 블로그 메뉴에서 검색되지도 않습니다. 웹문서 메뉴에서 검색되었습니다.
웹문서 메뉴에서라도 검색이 되면 다행인 것 아니냐고 할 수 있습니다. 그러나 위에서 제가 '카페나 블로그 검색에 치중한 모습'이라고 말한 것을 다시 기억해 보세요. 웹문서는 검색 결과 밑에 있을 뿐입니다. 사이트 이름 자체를 검색하면 위쪽에 '사이트' 주소가 뜨긴 합니다. 그러나 일반적인 키워드로 검색하면 위쪽에 카페와 (네이버) 블로그 검색 결과가 뜨는 만큼, 웹문서 검색 결과는 검색 결과 제일 밑부분에 있는 경우가 많았습니다.
블로그 메뉴에 들어가지 못하는, 제가 사용하고 있는 블로거닷컴 블로그는 웹문서 메뉴에만 표출이 됩니다. 그렇기 때문에 사실상 네이버 검색으로 제 블로그를 찾아 오는 것은 어려웠을 것입니다.
과도한 마케팅 포스트
네이버에서 검색을 하면 '마케팅 업체'에서 틀로 찍어낸 듯한 느낌이 드는 포스트가 많이 나왔습니다. 마케팅 업체에서 '자사만의 비법'을 이용하여 페이지 순위를 높이는 경우가 많았습니다. 마케팅용 블로그가 검색 결과 위쪽에 떠야 마케팅 효과가 크기 때문에 별별 편법을 동원하여 순위를 조작하기도 합니다.그 예를 하나 들어보면 안녕하세요부터 시작해서 날씨 이야기도 하고 일상 이야기도 한 뒤에 정보 몇 줄 적는 포스트입니다. 찾고 싶은 정보는 몇 줄 뿐인데, 그 정보를 얻기 위해 스크롤을 많이 내려야 하는 불편한 포스트이지요.
이 외에도 좋은 점을 부풀려서 소개하는 리뷰, 광고인지 블로그인지 잘 구분이 안 가는 것들 등등 수많은 패턴이 있습니다. 그렇기 때문에 저는 네이버 검색보다는 구글 검색을 선호하게 되었습니다.
네이버 검색의 개선
그동안 네이버 검색은 여러 의미로 악명이 많았지만, 네이버 측은 이미 몇년 전부터 자사의 검색 서비스에 대한 비판을 인지하고 있으며 그 문제점을 고치기 위해 노력하고 있었습니다.
네이버가 생각하는 좋은 컨텐츠, 나쁜 컨텐츠 기준을 먼저 소개하겠습니다. 그리고 이 기준에 맞추어 검색 결과를 제공할 수 있도록 네이버가 해 온 노력들(C-Rank, 웹 문서 검색 강화)에 대해서도 소개하겠습니다.
네이버가 생각하는 컨텐츠 기준
네이버가 생각하는 좋은 컨텐츠의 기준은 네이버 Search & Tech 블로그를 통해 간접적으로나마 확인할 수 있습니다. 두 포스트를 소개할 것인데, 각각 네이버가 선호하는 글과 선호하지 않는 글입니다. 선호한다는 것은 제가 비유를 든 것으로, 선호할수록 검색 결과 위쪽에 뜬다고 이애하시면 됩니다.
네이버가 선호하는 컨텐츠
2016년에 네이버 검색 블로그에 올라온 포스트인 "'이달의 블로그'를 통해 알아보는 블로그 운영 노하우"는 네이버가 선호하는 컨텐츠를 설명합니다. 네이버 검색은 사람들이 선호하는 컨텐츠를 보여주려고 합니다. 따라서, 네이버검색은 특정 주제를 전문적으로 다루는(특화된) 블로그, 다른 블로그와 비교해 보았을 때 특별함이 있는 블로그, 그리고 차별성이 있는 컨텐츠를 선호합니다.차별성이 있는 컨텐츠가 무엇인지 구체적으로 나와 있지는 않습니다. 그러나 네이버 이달의 블로그를 참고할 수 있습니다. 네이버는 이런 기준으로 검색 결과에서 다양한 정보를 제공할 수 있도록 검색을 개선해 나가고 있습니다.
네이버가 생각하는 좋지 않은 컨텐츠
한편, "검색어를 고려한 블로그 글쓰기"(2016년) 포스트에서는 네이버가 생각하는 좋지 않은 컨텐츠의 기준을 알려 주고 있습니다. 부자연스럽게 검색어가 제목이나 본문에 과도하게 적힌 경우, 여러 검색어를 단순히 나열한 경우를 싫어합니다. 본문 내용과 상관없는 제목을 사용한 경우, 한 블로그의 모든 포스트 제목에 특정 키워드를 반복(기업명 등)한 경우, 불필요한 특수문자를 많이 사용한 경우도 싫어합니다.이 포스트에서는 정상적이지 않은 포스트 예시도 소개하고 있습니다. 프로그램을 통한 기계적 포스팅, 본문에 검색어를 의미 없이 나열하고 사용자에게는 안 보이게 한 경우입니다. 스팸문서로 간주되어 해당 블로그 글 전체가 검색에서 내려갈 수 있습니다.
네이버가 생각하는 좋지 않은 컨텐츠에 대해 더 알고 싶으신 분들은 위에 제가 링크를 건 네이버 Search & Tech 블로그의 댓글들을 잘 살펴 보시는 것을 추천드립니다. 담당자의 댓글을 통해 어떤 부분이 검색에서 불이익을 줄 수 있는지 정보를 얻을 수 있습니다. 항의성 댓글이 많이 달려서 더이상 댓글에 대한 답변은 하지 않습니다.
전문적이고 차별성이 있는 컨텐츠를 만들어야 검색 결과 위쪽에 뜰 수 있습니다. 제목이나 본문을 부자연스럽게 쓰면 검색 결과에서 불이익을 받습니다.
C-Rank
네이버는 위와 같은 문제를 해결하기 위해 C-Rank라는 것을 도입했습니다. C-Rank는 특정 관심사에 대하여 좋은 품질을 가진 컨텐츠를 생산해 내는가를 중심으로 블로그(혹은 카페 등)의 신뢰도와 인기도를 측정하는 방법입니다. 사용자들이 전문성 있는 블로그를 선호한다는 통계에 기반한 방법입니다.
C-Rank를 통해 검색 결과의 질적인 품질은 개선이 되었습니다. 네이버 측에서 든 예시를 가져오면, 기존에는 산후다이어트를 검색하면 '한약으로 다이어트' 등의 결과가 나왔으나 적용 이후에는 '다이어트 성공 노하우' 등 사용자가 찾을 만한 검색 결과가 나오게 된 것입니다.
그러나 C-Rank에도 블로그의 신뢰도와 인기도를 측정하는 만큼 한계는 분명히 있습니다. C-Rank를 많이 이용할수록 글 자체의 품질보다는 출처의 신뢰도와 인기도에 더 많은 영향을 받게 되는 것입니다. 처음 블로그를 만든 사람이 훌륭한 글을 쓰더라도 신뢰도와 인기도가 높은 블로그에 대충 쓴 글이 더 위쪽에 나올 가능성은 분명히 있는 것이죠.
C-Rank는 이미 수집한 글 중에서 잘 골라내는 것이기 때문에 네이버가 수집하지 않은 글이 많으면 많을수록 검색 결과 향상에는 한계가 있습니다. 아무리 잘 골라내는 기술이 있더라도 네이버가 가지고 있는 웹페이지가 적다면 좋은 글을 사용자에게 보여주는 것은 불가능합니다.
웹문서 검색 기능 강화
네이버는 웹문서 검색 기능을 지속적으로 향상시키고 있습니다. 이러한 노력을 통해 네이버는 사용자에게 더 많은 사이트를, 사용자가 찾고 싶어하는 페이지를 보여 주게 됩니다. 한마디로 양질의 컨텐츠를 사용자에게 보여 주는 것을 목표로 하고 있습니다.
네이버의 그리핀 프로젝트 또한 네이버 검색 성능을 높이는 데 도움을 주고 있습니다. 모든 웹 페이지를 수집하는 것은 불가능합니다. 그러나 검색 시점을 기준으로 사람들이 많이 찾을만한 웹 페이지를 신속하게 수집합니다. 해외 학술 사이트도 수집하는 등 검색 수집 범위를 넓혔습니다. 딥러닝 기술을 이용해서 스팸 문서를 걸러내고, AI를 이용해 사용자의 검색 의도를 파악하여 사용자가 의도한 정보를 보여주게 됩니다.
그리핀 프로젝트의 일환으로 사이트 검색과 웹문서 검색을 통합합니다. 웹 사이트 구조가 복잡해지고, 원하는 정답형 정보를 찾는 비율이 높아지고, AI를 통한 검색 기술 향상이 되었기 때문입니다. 사용자는 통합된 검색 결과에서 보다 빠르게 원하는 정보를 찾을 수 있게 됩니다. 또한, 사용자의 니즈를 충족할 수 있는 글을 더 많이 보여줄 수 있게 됩니다.
구글 정책과의 비교
구글 웹마스터 가이드라인도 위와 비슷한 내용을 담고 있습니다. 사용자를 위한 페이지를 만들고, 검색 엔진 순위를 높이기 위한 속임수를 쓰지 말아야 합니다. 본인의 웹사이트를 고유하고 가치 있게, 전문 분야에서 다른 경쟁자와 차별화되도록 해야 합니다.
네이버가 선호하는 컨텐츠가 특정 주제를 전문적으로 다루고 차별성이 있는 컨텐츠라는 점에서 구글 정책과 비슷하다고 할 수 있습니다. 네이버가 생각하는 좋지 않은 컨텐츠도 구글이 선호하지 않는다는 것을 구글 웹마스터 가이드라인에서 확인하실 수 있습니다.
어떤 컨텐츠를 써야 하는가
독자가 원하는 컨텐츠를 생산해야 검색 엔진 순위를 높일 수 있습니다. 다른 컨텐츠와 차별화되고 전문성 있는 컨텐츠를 사용자들이 선호하기 때문에 컨텐츠를 만들 때 이 점을 주의할 필요가 있습니다.
단순히 인터넷에 있는 정보를 따라 적을 것이 아니라, 충분한 사전 조사와 자료 수집을 거쳐서 전문성 있는 글을 쓰는 것이 중요하다고 생각합니다. 일제 강점기 때 한반도의 철도를 조사하기 위해서 당시 시간표를 e-book으로 구매해서 분석하는 것도 이에 해당될 수 있습니다.(당시 시간표 포스트)
사람들이 읽기도 쉬워야 블로그에서 정보를 얻어 갈 수 있을 것입니다. 글을 쓰고 바로 올리는 것이 아니라 다시 한번 검토하고, 필요 없는 부분은 지우고 오탈자를 수정하는 과정을 거쳐서, 글의 전문성을 해치지 않는 선에서 최대한 읽기 쉽게 글을 써야 할 것입니다.
이러한 사실에 기반하여 앞으로도 알차고 전문성 있는 포스트를 제공하도록 노력하겠습니다.
댓글 0
댓글 쓰기
취소댓글 작성이 안 되실 경우 아래 링크를 이용해 주십시오.
댓글 달기