Ordenando las páginas por importancia: el concepto de popularidad
Cuando Google apareció en la web, allá por el 2000, la nueva se
transmitió rápidamente por el viejo sistema del boca a boca. Expertos y
usuarios finales, cantamos alabanzas y pensamos que por fin había alguien al
otro lado que entendía y sabía implementar lo que realmente se esperaba de
un motor de búsqueda. ¿Por qué?. Sobre todo por su capacidad para
jerarquizar resultados.
Hasta entonces, el lugar en la lista de resultados venía dado exclusivamente
por el grado de asociación de la página al término de búsqueda en la base de
datos del buscador (en los buenos buscadores) o incluso por la antigüedad (en
los malos)
Google fue el primero en completar la asociación con un criterio jerárquico
completamente diferente e independiente de los componentes del código: la
"popularidad".
¿Qué significa esto? De un modo muy sencillo podríamos decir que tu página
será tanto más importante a la hora de ordenar resultados, cuantas más
enlaces en otras páginas indexadas le apunten.
¿Eso era todo? Realmente no. Si el "índice de popularidad" fuera igual a la
suma del número de enlaces que nos apuntan, bastaría con crear una multitud
de páginas que apuntaran a la nuestra para mejorar su posicionamiento. Los
algoritmos de "popularidad" se defienden de un modo sencillo pero efectivo de
esta posible trampa:
El "índice de popularidad" es en realidad la suma del número de páginas que
nos apuntan ponderada por el índice de popularidad de cada una de ellas
(medido en porcentaje sobre la máxima puntuación alcanzable).
Podríamos resumirlo en la siguiente fórmula:
P(x) = 1/P(1) + 1/P(2) + ..... + 1/P(n)
Esta fórmula se ve ponderada según el término de búsqueda por el grado de
relación con los términos buscados de las páginas que nos apuntan, de modo
que la fórmula de ordenación final de resultados sería un poco más compleja y
sería parecida a:
F (x) = G(x) *(1/G(1)*P(1) + 1/G(2)*P(2) + ..... + 1/G(n)*P(n) )
Siendo G el algoritmo que en función del análisis del código de una página y
del texto del enlace que nos apunta establece el grado de relación de esta con
el término de búsqueda y que se mide también como un porcentaje del máximo
alcanzable.
Es decir, Google representa un avance en las herramientas de indexación y
búsqueda en la WWW porque cuando solicitas una búsqueda realiza un trabajo
en cuatro fases:
1. Busca en su base de datos aquellas URLs asociadas a la palabra criterio
de búsqueda
2. Calcula sus distintos grados de asociación
3. Ordena las URL en función de su popularidad ponderada con el grado
de asociación de las páginas que le apuntan y del texto del enlace que
nos apunta desde ellas
4. Presenta los resultados
Hay que señalar sin embargo que aunque las tecnologías basadas en la
popularidad se van extendiendo, ni siquiera Google las incorpora
homogéneamente: por ejemplo, en la ordenación de resultados de su directorio
(en realidad una versión del DMOZ de la que hablaremos más adelante)
simplemente ordena dentro de cada categoría en función del índice de
popularidad (representado por una barrita verde). Si lo pensamos esto tiene su
lógica, ya que se supone que el criterio que nos lleva a una categoría
determinada de un directorio es el mismo para todas las webs incluidas en él,
lo que le exime de realizar el trabajo de asociación URL/criterio de búsqueda.
Otra nota importante es la importancia del “qué” nos apunta. El texto del enlace
puede, si el número de enlaces es suficiente, llegar a determinar la asociación
de una página con un término de búsqueda que ni siquiera contenga en su
contenido.
Como escribe Adam Mathes:
Descubrí que cuando buscaba el término "internet rockstar" devolvía la
página de Ben [Brown]. En aquel momento, sin embargo el ni siquiera
tenía la frase en su página aunque la legión de bloggers quinceañeros
que le enlazaban siempre usaban esa frase en sus enlaces
Este hecho, recientemente comprobado en Google, implica no sólo la inutilidad
de las tradicionales campañas de banners de cara a la popularidad (ya que los
enlaces pasan por un servidor intermedio), sino también que frente al
tradicional énfasis en los gráficos, el elemento clave del enlace vuelve a ser el
texto.
De: El libro del posicionamiento en buscadores por David de Ugarte