본문 바로가기

StoreHouse/Marketing

인터넷 순위 비교 사이트의 ‘허와 실’

인터넷 순위 비교 사이트의 ‘허와 실’


마켓팅의 홍수 속에서 참으로 많은 선전문구들을 접하게 된다. 특히 학생 때부터 등수 비교에 익숙해 있던 우리네들은 웹사이트의 홍보문안에서도 OO분야 1위 업체라거나 최초 업체라는 부분을 강조하곤 한다. 상식적으로는 1위가 한 개 업체 뿐이어야 하겠지만, 장충동에 원조가 아닌 족발집이 없듯 어지간한 웹사이트 중에선 1위 업체가 아닌 사이트가 없다. 특히 다음과 네이버는 서로 검색부문 1위 업체라고 주장하고 있고, 커뮤니티 분야에는 네이트닷컴까지 가세하여 자신들이 1위라며 다툼이 대단하다.

그렇다면, 어떻게 이런 비교가 이루어지고 있으며 제각기 다른 주장을 펼칠 수 있는지 각 조사방법, 순위비교 사이트에 따른 차이점을 살펴보도록 하자.



웹사이트 사용량 분석의 다양한 방법
웹사이트를 운영한다는 의미는 단순히 사이트를 열었다는데서 끝나는 것이 아니다. 웹사이트가 아무에게도 보여지지 않는다면 그 사이트는 자신의 PC내에 있는 수많은 텍스트파일과 전혀 다를 바가 없는 것이다. 따라서, 웹사이트를 운영한다는 의미는 그 콘텐트를 만들 뿐만 아니라, 많은 사람들에게 보여지도록 관리하는 데까지를 포함하는 것이다. 내 웹사이트가 얼마나 많은 사람들에게 보여지고 있는지, 사용자가 어떤 반응을 보이는지를 유의 깊게 살펴보아야만 웹사이트를 운영하고 있다고 할 수 있을 것인데, 그렇기 때문에 그러한 분석을 위해 다양한 방법이 개발 되었다.



로그파일 분석방식
현존하는 대부분 웹서버는 자신이 서비스한 웹페이지와 그에 따른 정보를 특정 로그파일에 저장하도록 만들어져 있다. 그만큼 웹페이지는 만드는 것 못지않게 서비스가 어떻게 되는지를 살펴보는 것이 중요하다는 것이다.

로그파일 분석방식은 이처럼 로그파일을 뒤져서 보기 쉽게 나열하는, 사용량 분석 방법중 가장 전통적인 방식으로 웹서비스에 대한 모든 정보를 세밀하게 기록하여 서비스 하기 때문에 그 어떤 분석방법보다 정확하게 분석할 수 있다.

대체로 자사의 웹사이트 사용량을 분석하는데 활용된다. 이를 위한 솔루션으로는 NetIQ의 WebTrends 라는 로그분석툴이 일반적으로 사용되는데, 공공기관 같은 경우 간혹 국산솔루션인 WebLog 라는 프로그램을 사용하기도 하고, 작은 규모의 사이트나 혹은 대단히 큰 규모의 사이트는 일반적인 솔루션을 사용하지 않고 전용 솔루션을 자체 개발하여 사용하는 경우도 많다.

로그분석 방식의 장점 못지 않게 로그파일 분석 방식의 단점도 상당수 있다. 우선, 사이트의 규모에 따라 분석 시간이 수시간~수십시간씩 소요되는 경우도 있다. 또한 분석 프로그램의 종류나 셋팅에 따라 다소 다른 결과를 내놓을 수가 있으므로 서로 다른 회사의 웹사이트를 비교하는 자료로 사용하기는 어렵다.



패널방식
패널방식은 자사의 웹사이트 분석보다는 주로 인터넷 조사업체가 사용하는 방식이다.

각 업체가 자사 웹서버에서 나온 로그파일을 공개하고 조사업체가 한데 모아 분석하는 방법을 시행할 수 있다면 그것이 가장 바람직 하겠으나, 현실적으로 자사의 로그파일을 외부에 공개하는 업체는 흔치 않다. 따라서, 조사업체들은 표본 사용자(패널)의 PC에 프로그램을 설치하여 표본 사용자들이 어떤 사이트를 들어가는지 확인하고, 이 표본 사용자를 기준으로 전체 사용자가 어떤 사이트에 얼마나 접속하는지를 통계적으로 파악한다.

코리안클릭, 인터넷매트릭스 등의 업체는 특정 인터넷 사용자에 편향되지 않도록 불특정 다수에게 전화를 걸어 패널을 모집하고, 이 패널들이 프로그램을 설치하도록 하는 사용자에게 돈을 지불하여 사용자들이 프로그램을 설치하도록 하고 있으며, 랭키닷컴이나 미국의 Alexa 등의 경우는 뉴스나 검색등 사용자에게 편의를 주는 기능을 가진 툴바를 설치하도록 하여, 사용자의 이동 경로를 서버에 전송하도록 하고 있다.

패널방식은 이렇듯 다양한 형태로 발전해 왔지만, 실제로는 큰 문제를 내포하고 있다. 코리안클릭이나 인터넷매트릭스는 표본 사용자의 수가 1만~2만명 정도이고, 랭키의 경우 표본 사용자수가 6만명 정도 되는데, 이는 실제 인터넷 사용자수에 비하면 턱없이 부족한 수이다. 흔히 조사업체에서는, 대통령 선거 조사 때에도 표본 5000명 정도로도 대통령을 가려낼 수 있다고 말하지만, 대통령선거의 경우 선택의 폭이 2후보~4후보에 지나지 않아 1후보가 가져갈 표본이 1000이상이지만, 웹사이트 사용량 조사의 경우 수백~수천 사이트를 대상으로 하고 있으므로, 한 개 사이트가 가져갈 표본은 얼마 되지 않아, 패널들의 변경 때마다 결과 데이터에 엄청난 차이를 보이며, 패널들의 기분과 움직임에 따라 데이터의 변동폭이 지나치게 커서 15위의 업체가 다음주에는 26위로 11단계 정도 오르내리는 일은 비일비재 하다.



테그 방식
서버의 웹페이지내에 HTML 테그를 붙여 이것이 로딩될 때마다 DB에 저장하도록 하는 이 방식은 로그파일을 모았다가 한꺼번에 분석하는 것이 아니기 떄문에, 실시간으로 로그 분석 결과를 보여주도록 할 수 있으며, 불필요한 로그파일을 남기지 않기 때문에 디스크 공간 절약에 도움이 될 뿐 아니라, 여러 서버에서 같은 웹페이지를 운영하는 등 다양한 운영환경에서도 쉽게 정확한 결과를 얻을 수 있다는 장점이 있다. 웹트랜즈도 최근 버전부터는 이러한 테그 방식을 지원하고 있어 자사의 웹로그를 분석하는데 사용할 수도 있으며, 최근 NetRating 이라는 업체 등은 공통된 표준 모듈을 각 서버에 설치해 서버마다의 트래픽을 객관적으로 파악하고 비교할 수 있도록 하였다. 조사 업체가 패널을 이용하여 조사하는 경우 인터넷 사용인구에 비해 패널이 턱없이 부족하기 떄문에, 패널의 선정에 따라 편차가 매우 심각하여 조사결과를 신뢰할 수 없다는 단점이 있으며, 로그파일 분석방식은 업체별로 데이터저장방식과 분석방법을 각기 다르게 사용하고 있으므로 서로 비교하여 순위를 매기는 것이 불가능 한 상태이다. 따라서 NetRating 이라는 업체는 각 업체별로 동일한 모듈을 설치하도록 하고 있으나, 이러한 사업이 성공하기 위해서는 각 모든 업체들이 테그를 붙이고 데이터를 공개하는 것에 대하여 긍정적으로 인식하고 참여하여야만 분석이 가능하다. 따라서 아직 가능성을 제시했을 뿐, 실제로 유의미한 데이터로 받아들여지고 있지는 않다.



UV, PV, USV ?
로그분석의 방법은 각기 다르더라도 그 결과로 나타나는 수치는 크게 이러한 3가지 종류가 있다.



UV(Unique Visitors: 순방문자수)
조사기간 동안 얼마나 많은 사람이 접속하였는가를 나타내는 절대적인 수치이다. 같은 사용자가 여러 번 접속하여도 1번으로 카운트 되므로 특정 사용자의 조작 우려가 없으며, 서비스 제공자가 페이지를 작게 구성하여 고의로 여러 번 클릭을 해야 하도록 만드는 경우나, 프레임을 나누는 경우에도 1차례로 카운트 되므로, 서비스제공자가 조작할 우려도 적다. 따라서 주로 이것을 각 사이트 별 순위 비교의 기준으로 삼는 경우가 많다.

그러나 사용자가 조사기간 동안에 한번만 접속을 하거나 여러 차례접속을 하는 경우가 동일하게 1번으로 카운트 되므로, 사용자의 충성도를 반영하지 못한다는 단점이 있다. 예를 들어 100명의 사용자가 한달 30일 동안에 한번만 들어온 사이트보다 90명의 사용자가 30일동안 하루도 빠짐없이 접속한 사이트가 순위가 낮게 나타난다는 것이다. E-mail 서비스나, 검색 서비스등 남녀노소를 불문하고 많은 인구가 사용하는 서비스의 경우 UV가 높게 나타나는 반면, 게임이나 커뮤니티등 특정 계층이 열성적으로 사용하는 서비스들의 경우 실제 사용량에 비해 수치가 낮게 나온다는 문제점이 있다.



PV(Page Views)
사용자가 얼마나 많은 페이지를 보았는지를 나타내는 수치이다. 사용자의 충성도를 보여줄 수 있는 수치이지만, 프레임의 구성을 여러개로나누거나, 자동 리프래시 기능을 사용하면 수치가 지나치게 많이 나오게 되는 경우가 있다.

또한 특정사용자가 지나치게 많은 사용량을 보이는 경우에 이를 반영하여 수치가 변동되는 등, 왜곡 될 우려가 많아 순위 비교에는 반영되지 않는 것이 일반적이다.



USV(User Session Visits) 혹은 Visits
UV와 PV의 단점들을 보완하고자 만들어진 수치로, 사용자가 1시간 내에 여러 번을 방문해도 1회 방문으로 카운트 한다. 하루 24시간 내내 방문한 사용자는 24회 카운트 될 것이다.

이런 방식이라면 프레임이나 자동 리프래시 기능으로 카운트가 늘어나지 않는 등, 왜곡을 막을 수 있으면서도 사용자의 충성도를 반영할 수 있다. 다만 1시간이라는 기준을 설정하는데 다소 인위적인 요소가 개입될 여지가 있다.

1시간을 기준으로 하는 USV는 랭키닷컴이 만들어낸 지표이고, 웹트랜즈 등에서는 30분을 기준으로 하여 Visits(한글버전에서는 ‘방문들’) 이라는 지표로 나타난다.

인터넷 순위 비교 업체
국내에서 순위 비교 분석은 크게 인터넷매트릭스, 코리안클릭, 랭키닷컴 등의 업체가 패널 조사 방식을 이용하여 조사하고 있는데, 각 업체들이 약간씩 다른 방법으로 조사를 하고 있어서 그 결과치 또한 큰 차이를 보이고 있다. 최근에는 이러한 업체들이 갖는 문제점을 보완하고자 여러가지 방식을 고안한 업체들이 나타나고 있다.