H

Algoritmo HITS

ACERTOS

El algoritmo HITS clasifica las páginas web en función de sus puntuaciones de autoridad y de hubs.

El HITS (Hyperlink-Induced Topic Search) Algoritmo is a análisis de enlaces algorithm used to rank web pages based on their importance in the context of a specific topic. Developed by Jon Kleinberg in 1998, the HITS algorithm distinguishes between two types of web pages: hubs and authorities.

Centros are pages that link to many other pages, while authorities are pages that are linked to by many hubs. The HITS algorithm operates on the principle that a good hub should point to many high-quality authority pages, and a good authority should be pointed to by many high-quality hubs.

El algoritmo funciona primero identificando un conjunto de páginas relevantes relacionadas con una consulta. Luego asigna dos puntuaciones a cada página: una puntuación de hub y una puntuación de autoridad. Estas puntuaciones se actualizan de forma iterativa en función de la estructura de enlaces de la web. El proceso continúa hasta que las puntuaciones convergen, es decir, se estabilizan y no cambian significativamente con nuevas iteraciones.

Para calcular las puntuaciones, el algoritmo utiliza los siguientes pasos:

  • Inicializar todas las puntuaciones de hubs y autoridades a 1.
  • Para cada página, actualizar its la puntuación de autoridad sumando las puntuaciones de hubs de todas las páginas que enlazan a ella.
  • Para cada página, actualizar su puntuación de hub sumando las puntuaciones de autoridad de todas las páginas a las que enlaza.
  • Normalizar las puntuaciones para asegurar que permanezcan dentro de un rango determinado.

The HITS algorithm is particularly useful for finding expert content within a specific topic, making it valuable for motores de búsqueda and recuperación de información systems. However, it can be sensitive to noise and spam links, which may distort the true importance of pages. Despite its limitations, the HITS algorithm laid the groundwork for many modern link analysis and ranking techniques.

oEmbed (JSON) + /