컴퓨터 과학(CS, Computer Science)/알고리즘(Algorithm)

[알고리즘, Algorithm] PageRank, Google Assessment Importance

HiEarth_HH 2025. 4. 14. 12:45

PageRank 알고리즘은 구글의 공동 창립자인 래리 페이지(Larry Page)와 세르게이 브린(Sergey Brin)이 1998년에 개발한 웹페이지 중요도 평가 알고리즘입니다. 이 알고리즘은 웹페이지 간의 링크 구조를 분석하여 각 페이지의 상대적 중요도를 계산하며, 구글 검색 결과의 순위 결정에 핵심적인 역할을 했습니다.


🔍 PageRank의 핵심 개념

PageRank는 웹을 하나의 거대한 그래프로 보고, 각 웹페이지를 노드(node), 하이퍼링크를 엣지(edge)로 간주합니다. 기본 아이디어는 "중요한 페이지는 다른 중요한 페이지로부터 많은 링크를 받는다"는 것입니다. 즉, 단순히 링크 수가 많은 페이지뿐만 아니라, 신뢰도 높은 페이지로부터 링크를 받은 페이지가 더 높은 순위를 갖게 됩니다 .​VelogBrunch Story


🧮 PageRank 계산 방식

PageRank는 다음과 같은 수식을 통해 계산됩니다:

PR(A) = (1 - d) / N + d × Σ [PR(B) / L(B)]

여기서:

  • PR(A): 페이지 A의 PageRank 값​
  • d: 감쇠 계수(damping factor), 일반적으로 0.85로 설정​
  • N: 전체 웹페이지 수​
  • PR(B): 페이지 B의 PageRank 값​
  • L(B): 페이지 B에서 다른 페이지로의 링크 수

이 수식은 페이지 A로 향하는 모든 페이지 B의 PageRank를 고려하여 A의 PageRank를 계산합니다. 감쇠 계수 d는 사용자가 무작위로 다른 페이지로 이동할 확률을 나타내며, 일반적으로 0.85로 설정됩니다 .​


🔁 반복 계산과 수렴

PageRank 값은 초기에는 모든 페이지에 동일한 값을 할당하고, 위의 수식을 반복적으로 적용하여 값이 수렴할 때까지 계산합니다. 이러한 반복 과정을 통해 각 페이지의 최종 PageRank 값을 얻습니다 .​


🧠 PageRank의 활용 분야

PageRank는 웹페이지 순위 결정 외에도 다양한 분야에서 활용됩니다:

  • 검색 엔진 최적화(SEO): 웹사이트의 중요도를 평가하여 검색 결과 순위에 반영
  • 학술 논문 평가: 논문의 인용 관계를 분석하여 중요도 평가
  • 소셜 네트워크 분석: 사용자 간의 연결 구조를 분석하여 영향력 있는 사용자 식별
  • 추천 시스템: 사용자와 아이템 간의 관계를 분석하여 개인화된 추천 제공