Google의 알고리즘의에 대한 이해 – SEO기초를 다지자[1편]
|Google의 알고리즘의에 대한 이해 – SEO기초를 다지자[1편]
구글 알고리즘이라는 용어는 SEO를 배우고자 하는 사람들에게는 참으로 알쏭 달쏭한 단어입니다. 구체적으로 보이는 물건이나 상품이 아닌 무형의 것이기 때문에 더욱 우리가 이해하는데 어려움을 겪습니다. 하지만 쉽게 이야기하면 구글 알고리즘이란 수집된 웹문서를 INPUT하면 프로그래밍된 시스템을 거쳐 OUTPUT하면서 웹문서의 순위를 정하는 소프트웨어라고 이해하면 좋을 것 같습니다. 이것이 하는 일은 어떤 검색어에 대하여 순위를 결정하여 검색결과에 내보내는 일을 합니다. 내부에는 상당히 복잡한 체계를 갖추고 있다지만, 밖에서 볼 때에는 검색하면 결과가 나온다고 단순하게 생각 할 수 있습니다. 구글은 이 알고리즘을 잘 개발하여, 현재 글로벌 거대 기업이 되었어요. 우리가 검색해서 찾아보는 많은 정보를 고객에게 만족스럽게 제공하고 있는 것은 다 이 알고리즘이라는 것에 있답니다.
검색엔진최적화에 관심이 많은 분이라면 이러한 알고리즘을 제대로 이해하여 상대적으로 자신의 사이트를 상위에 나타나게 하려고 할 것입니다. 검색의 순위를 올린다든지, 구글 검색 결과에 다양한 검색어가 노출되도록 할 수도 있을 것입니다. 그 결과로는 자신의 비즈니스를 성공적으로 정착 시킨다거나, 홍보하거나, 고객 문의 등을 이전 보다 늘릴 수 있게 됩니다.
이러한 알쏭달쏭한 알고리즘에 대하여 보다 쉽게 이해 할 수 있는 방법은 없을까요? 알고리즘을 구글이 공개하지 않기 때문에 사람들마다 자신의 경험을 의지하여 검색엔진최적화를 하는 경향이 특히 한국에서 많이 보여지고 있구요, 실력은 그야말로 천차만별 이랍니다. 검색엔진최적화를 진행하다 보면 알고리즘을 이해하기 보다는 상위에 올라가는 테크닉만을 알고 있는 곳과, 전체적으로 검색엔진최적화를 컨설팅해주고 상위노출 해주는 크게는 2개의 분류가 있는 것 같습니다.
어쨌든 여기서는 알고리즘에 대한 원리를 어느정도 이야기 해나가면서 구글검색엔진최적화에 대해 다음단계로 올라갈 수 있도록 기초를 잡아가며, 검색엔진에 대한 이해를 깊이 할 수 있도록 안내해 드릴 것입니다. 알고리즘은 수백개 이상의 조합으로 이루어진 복잡한 프로그램으로, 단순히 이렇게 하면 어쩌고, 저렇게 하면 어떻다는 공식적인 이야기는 알고리즘이 점점 보완되고 향상됨에 따라 향후 구글 검색에서의 점점 예측하기 어려워져 갈 것입니다. 하지만 알고리즘에 대한 근본적인 내용을 알아둔다면, 향후에 변화되는 수많은 알고리즘 업데이트에도 빠른 이해와 적용이 가능해 질것입니다. 역시 원리를 이해해야만 응용할 수 있게 되고, 확장될 수 있다고 생각합니다.
구글 알고리즘의 이해에 대한 글을 쉽게 풀어 쓰다보니 다소 길어지는 부분이 없지 않습니다만, 그만큼 쉬운 말로 쓰려는 노력으로 이해하기는 더 쉬워지지 않을까 하는 기대를 해봅니다. 웹마스터, 웹제작자, 취준생, 현역 기업의 마케팅 담당자라면 이제 필수 지식이 되어야 할것입니다. 또한 자신의 회사 사이트를 개선하고, 문의를 늘리는 스킬을 갖추고 있다면 어느지장에서든 환영하고 반길 수 있는 인재로 거듭난다고 생각하기 때문에 공부해둬서 손해 볼 일은 없을 것 같습니다. 또한 검색엔진최적화가 국내뿐 아니라 해외마케팅에도 중요한 축을 이루기 때문에 기업의 마케터는 자신의 현재 상황에 만족하지 말고, 좀더 레벨업 할 수 있는 기회가 되었으면 합니다.
1-1 구글의 핵심 기술, 그것은 알고리즘
우리는 삶속에 컴퓨터라는 것이 들어오면서 검색포털, 검색엔진은 우리 삶속에서 떼어 놓을 수 없는 어떤 것 이 되었습니다. 특히 요즘 같은 스마트폰 시대에는 걸어다니면서 정보를 검색하고 길을 찾고 네비게이션을 사용합니다. 한국은 네이버를 가장 많이 사용하는데, 이것은 네이버가 한국의 사용자에게 가장 편안한 서비스를 제공하고 있기 때문이라고 생각해요. 검색엔진서비스는 검색 자체의 성능과 함께 검색 엔진을 사용하는 유저에게 도움이 되는 정보를 잘 찾아주는 것이 서비스를 이용하게 하는 핵심이기 때문에, 한국의 네이버는 최소한 한국의 유저에게 만족할 만한 검색결과를 잘 표시해 준다고 이야기 할 수 있습니다. 하지만 이 부분에서 경계해야 할 것이 한가지 있는데요, 많이 사용하기 때문에 모든 서비스나 검색 쇼핑 기타 여러가지 온라인 서비스가 네이버로 몰리고 있기는 하지만, 실제로는 검색 품질이 구글에 비하여 좋지 않을 수도 있습니다. 좋다 좋지 않다는 상대적 개념인 것으로 사용자만이 느끼는 부분인데요, 여러분은 어떻게 생각하고 있나요?
해외 검색엔진의 경우 Google 이외에도 수많은 검색 엔진이 나타났다 사라졌다 하는 역사가 있었지요. 그러나 이제 전세계적으로 사용하는 검색엔진은 구글이 되어버린 이유는 무엇일까요? 몇개 국가를 제외하고는 검색엔진 사용자의 95%가 구글을 사용하게 되면서 온라인 검색의 제왕으로 자리잡은 구글, 그것은 위에서 이야기한 사용자의 편의성 및 사용자의 정보 검색만족도 때문이라고 할 수 있답니다.
참고로, 한국Naver.com · 중국Baidu.com · 러시아Yandex.com 등 극히 일부 국가를 제외하고는 Google검색엔진의 점유율 90% 이상 된다고 생각하시면 됩니다. 이것은 결국 우리가 마케팅 해야하는 대상(매체) 중 한가지가 구글이라는 점을 반증해 주고 있습니다. 한국 네이버의 검색광고를 안하면 한국에서 마케팅을 할 수 없는 것처럼, 검색점유율 90%~95% 이상인 검색엔진을 제외하고 해외마케팅을 진행한다는 것은 말이 안되는 일이지요.
구글은 이렇게 전세계에서 유일무이한 검색 엔진이 된 이유는 위에서도 몇번 이야기 했지만, Google의 알고리즘이 뛰어나 다른 검색 엔진을 사용할 의미가 없어졌기 때문입니다. 즉 고객이 만족할 만한 웹문서를 상위에 표시하게 하고, 그것을 보고 고객이 상당부분 만족했다는 것이 이유일 것입니다.
갑자기Google의 알고리즘이 궁금해지네요?
알고리즘은 누군가 무엇을 검색 했을 때, 보다 좋은 결과를 표시하고자 하는 검색엔진측의 개발 노력에 따라 만들어지고 업데이트 되고 있습니다.
어떻게 알고리즘에 잘 검색되도록 검색결과 상위에 표시되는 페이지를 만들 수 있을까요? 라는 질문을 받는데요, 최근들어 더욱 이러한 경향이 강해 지고 있습니다만, 정답은 “검색에서 상위 표시는 다른 웹문서보다 사용자에게 유익한 정보, 가치있는 내용, 사용자가 찾는 핵심 정보가 담겨있을것” 입니다.
너무 막연한 이야기입니다 라고 반문할 수 도 있을것입니다. 그러나 이것이 정답에 가장 가까우며 앞으로도 이것은 변하지 않는 구글 알고리즘의 중요한 하나의 축이 될것입니다. 그 이유는 이렇습니다. Google은 인간보다는 기계에 가깝지요. 하지만 기술이 발달하고 알고리즘이 업데이트 되면서 이러한 구글의 웹문서에 대한 인식의 정밀도는 사람이 인식하는 레벨까지 근접해 오게 되었습니다. 컴퓨터이지만 웹문서를 보고, 읽고, 해석하는 것이 사람과 비슷한 수준까지 왔다라는 것입니다.
그 가치를 판단하고, 유저가 볼 때 사이트가 편리하게 구성되어있는지, 표시속도는 너무 느리지 않는지 종합적으로 판단하기에 이른 것입니다. 그래서 예전에는 몇가지 테크닉으로는 SEO를 했던 것들은, 이제 영향력을 발휘 할 수 없게 되었습니다. (모두 그런 것은 아니지만 많은 부분 그렇게 되어 가고 있답니다.)
하지만 구글은 기계이기 때문에 사람과 다른 방식으로 웹페이지의 내용을 읽고, 분석하고, 판단합니다. 이것은 웹문서를 만들때, 사이트를 만들 때 구글이 좋아하는 형태(정보수집이 용이한)의 코딩방법에 따라 같은 문서라 할지라도 인식하는 차이가 생길 수 있다는 점입니다. 어쨌든 웹페이지의 내용이 사람이 보기에도 구글이 보기에도 동일하게 읽혀지고 이해되어지도록 표시하는 작업은 상당히 비중있는 작업이 되는것입니다.
많은 자본과 시간을 투자하여 만든 홈페이지가 정작 내용은 좋으나, 구글이 인식하지 못하는 내용으로 되어있어 구글에 검색이 안된다면 어떨까요? 아쉽게도 이러한 경우가 한국에서는 비일비재 하답니다. 대략 감으로 최소 90%정도는 될거에요. 대기업 부터 중소기업 개인기업까지 막론하고 상당히 많아요. 최근에 워드프레스등이 보편화되면서 개선되어 가고 있는부분은 긍정적이라 할 수 있습니다. 그렇지만 아직 많이 멀었죠.
다시 이야기 하면, 홈페이지를 제작할때 만드는 웹문서를 작성 할때에는 구글이 정보 수집하기 쉽고, 사람도 읽기 쉽게 만들어야 한다는 것입니다.
Google이 다양한 페이지를 수집하고 그 가치를 어떻게 판단하고 있는가?에 대한 본질적인 부분과 동작하는 원리를 기억 해둔다면, 검색엔진최적화하는 입장에서 좀더 유리한 고지에 오를 수 있는데요, 앞으로 이러한 부분에 대해 몇 개의 글로 나누어 전할거에요. 구글은 지금 이순간에도 알고리즘을 업데이트 해나가면서 더욱 정교한 검색프로그램을 구축해 나가고 있는데요 하지만 걱정하지 마세요. 우리는 변화하는 부분보다 변화하지 않는 핵심 줄기를 다루기 때문에 개념을 잡아가면서 살을 붙여나간다면 모두다 웹과 검색을 볼 수 있는 안목이 넓어질 거에요.
많은 분들이 알고리즘의 세세한 내용에 관심이 많은 것 같습니다. 하지만 이제 이러한 내용들은 중요하지만 예전만큼은 아닙니다. 우리가 검색엔진최적화 하면 가장 기본이 되는 몇가지 항목이 있는데 이 항목들만 잘 지키고, 컨텐츠의 내용이 충실하다면 검색엔진에서의 순위개선 효과는 크게 나타난답니다. 검색엔진에 대한 곁가지 보다 “본질적인 부분“을 이해한다면 커다란 시행착오 없이도 검색에 잘 노출 될 수 있습니다. 다음은 알고리즘에 대한 주요한 분류에 대하여 이야기 하고자 합니다.
1-2. 알고리즘의 주요 분류
- 내 페이지의 링크가 외부사이트에 붙어져 있는 것을 평가하는 알고리즘 – 외부 요인
- 내 페이지의 링크가 사이트 내부에서 붙어져 있는 것을 평가하는 알고리즘 – 내부 요인
우리는 우선 이 두 가지를 축으로 알고리즘에 대한 이해의 기초를 마련했으면 합니다. 검색엔진은 이 두가지 요소를 가지고 웹문서를 판단합니다. (이외에도 수백가지가 있지만 이것이 가장 비중이 높은 부분입니다.) 우리가 검색결과에서 순위를 높이려면 이렇게 다양한 곳에서 링크가 연결되어 있어야 합니다. 이것이 구글 SEO검색엔진최적화의 근간을 이룹니다. 즉 페이지와 페이지간의 링크를 그 페이지의 척도를 측정하는데 중요한 요소로 사용하고 있다는 것입니다.
여러분도 들어보았던 구글 PR (PageRank)라는 용어도 이러한 링크라는 것을 정량화 하기위한 수치로 나타나는 것이랍니다. PR은 보통 0~10까지 있는데 모든 사이트는 구글에 의해 PR이 측정되어 있습니다. 이것은 변화하는 수치 입니다. 페이지간의 다양한 링크 값을 계산하기 위해서는 각각의 사이트의 PR수치값과 페이지별 PR값들이 있어야만 한다는 것이 이해가 될 것입니다.
상기 두 가지에 이외에도 알고리즘은 상당히 많고 앞으로도 더 많아집니다. 그러나 이 2가지, 사이트 외부 링크와 내부 링크에 의한 평가를 축으로 다양한 곁가지들(요소)이 복합되어 사이트의 순위가 결정되는 것입니다.