블로그 전문검색엔진을 표방하는 '나루'가 오픈한지 1주일이 지났다.
블로그 컨텐츠를 접하는 방법이 네이버/다음 블로그나 올블로그로 양분되어 있는 블로고스피어에 나루의 등장은 양질의 블로그 컨텐츠를 한 곳에서 검색하고자 하는 블로그 유저들에게 반가운 소식이라고 생각된다.
올블로그가 가입형 메타블로그 서비스를 제공하고 있는데 반해 나루는 RSS 피드주소가 대부분 공개되어 있다는 점에 착안하여 RSS 공개 허용 블로그의 포스트를 수집/인덱싱한다는 아이디어에 기반하고 있다. 특정 사이트 가입이라는 장애물 없이 자유롭게 한국에 널리 퍼져 있는 RSS 공개 블로그 포스트 전체를 대상으로 한다는 점은 기존의 포탈형, 메타블로그형 서비스에서 제공하는 컨텐츠 다양성의 제약을 뛰어넘을 수 있는 potential을 갖고 있다고 판단된다. (물론 포탈사이트에서 자체 블로그 컨텐츠의 웹크롤링을 막는다면 컨텐츠 다양성 확보에 제동이 걸릴수도 있음)
나루는 기존 검색엔진들이 구글과 같이 웹페이지 간의 link 관계에 기반한 랭킹을 가져가는 것에 반해 '관심도'라는 새로운 컨셉을 제시하고 있다. 나루를 오픈한 온네트는 RSS 리더기 'Fish'를 개발한 바 있는데 나루는 Fish에 쌓인 블로그 구독 데이터를 해당 블로그의 컨텐츠 퀄리티를 가늠하는 잣대로 사용하고 있다. 이는 펌글로 인한 블로그 검색 정확도 저하를 막기 위한 장치라고 보여진다. 결국 구독자수가 많은 블로그는 좋은 포스팅을 담고 있을 가능성이 높으니 가산점을 많이 주자는 컨셉이다.
아직 서비스 초기단계이기 때문에 현재 제공되고 있는 검색결과를 갖고 검색 퀄리티를 논하긴 매우 이르다고 생각하지만 현재까지 드러난 나루의 블로그 검색 메커니즘을 보면 다소 개선이 필요한 부분이 엿보이는 것 같다.
나루는 '관심도'를 가장 중요한 데이터로 규정하고 이를 검색결과 랭킹에 적극 반영하고 있다. 나루의 '관심도'는 Fish에서 수집한 RSS 구독자수, 북마크/관심키워드, 포스팅의 빈도/시간 등으로 구성되어 있고 이를 통해 해당 블로그의 레벨을 정의하고 랭킹에 반영하게 되는데.... 내 개인적인 의견으론 현재 나루의 관심도 및 블로거 레벨 측정엔 아래와 같은 문제점이 있다고 생각한다.
1. 관심도 측정을 위한 기초 데이터의 coverage 빈약
블로거 레벨 측정을 Fish RSS 구독 데이터에 전적으로 의존한다는 것은 너무 적용범위가 좁아 보인다. 추후에 나루 팩토리를 통한 다양한 도구를 배포한다고 하나 이것으로도 coverage 문제가 해결될 것 같진 않다. 기본적으로 구독이나 도구 사용은 사용율의 한계가 있기 마련이다. 인덱싱은 크롤링 방식으로 하고 블로거 레벨은 Fish 데이터로 측정한다는 것은 앞뒤가 맞지 않는다.
2. 블로고스피어의 특성을 칼같이 반영한 로직 수립 필요
설사 나루가 모든 RSS 구독 데이터를 수집할 수 있다고 해도 RSS 구독 데이터를 검색랭킹에 반영하는 것엔 문제가 있어 보인다. 유저들은 블로그 검색창에 특정 키워드를 입력할텐데 해당 키워드에 대한 정확한 블로그 검색결과와 RSS 구독자수 간의 상관관계는 다소 고리가 느슨해 보인다. 차라리 테크노라티가 최근에 도입한 authority 기반의 검색로직이 블로고스피어의 특성에 더 가까운 것 같다. 테크노라티의 authority는 특정 블로그 포스팅에 링크를 건 블로그의 갯수를 의미한다. (원래는 특정 블로그 포스팅에 링크를 건 포스팅의 갯수였다) 결국 블로그 검색결과는 포스팅들로 나열되므로 특정 포스팅이 얼마나 많은 링크를 받는가가 그 포스팅에 대한 관심을 대변한다고 할 수 있을 것이다. 테크노라티의 최근 검색로직 개선이 어떤 결과를 가져올지 지켜보는 것도 의미가 충분할 것 같다.
3. 올블로그의 태그 활용 벤치마킹 필요
결국 나루는 블로그 유저들의 마음 속에서 올블로그와 경쟁하는 구도가 펼쳐질 가능성이 높은데 올블로그가 쌓고 있는 태그 데이터에 관심을 기울일 필요가 있다고 생각한다. 7500만개 블로그를 인덱싱하고 있는 테크노라티나 7만개 블로그가 가입되어 있는 올블로그나 모두 태그 데이터가 차곡차곡 쌓이면서 유저들에게 밸류를 줄 수 있는 핵심 검색 채널 역할을 톡톡히 해내고 있다. 테크노라티의 authority가 관심도의 반영이듯이 블로거들이 자체 생성해 내고 있는 태그야말로 블로거들의 관심도라고 생각한다. 이 관심도 데이터를 잘 쌓고 가중치나 연관성 분석 노하우를 발전시키는 것은 블로그 검색엔진으로써 당연히 해야 할 일이라고 생각한다.
결국, 테크노라티와 같은 포스팅 간의 link structure에 근거하면서 블로고스피어의 특성을 반영한 랭킹로직이 나와야 블로그 검색엔진의 정확도가 제고될 것으로 생각한다.
나루는 이제 론치 초기 단계이니 많은 블로거들의 피드백을 더 받아야 할 것 같다. 나루가 블로거들의 다양한 피드백을 잘 소화하면 현재 잘 채워지지 않고 있는 블로거들의 니즈를 해소시키면서 메타 블로그계의 새로운 강자로 떠오를 수 있을 것이다.
Trackback Address :: http://read-lead.com/blog/trackback/315