PageRank estuvo una vez en el corazón de la búsqueda y convirtió a Google en el imperio que es hoy.
Incluso si cree que la búsqueda se ha alejado de PageRank, no se puede negar que ha sido durante mucho tiempo un concepto omnipresente en la industria.
Cada profesional de SEO debe tener una buena comprensión de lo que solía ser PageRank y lo que sigue siendo hoy.
En este artículo cubriremos:
- ¿Qué es PageRank?
- La historia de cómo evolucionó PageRank.
- Cómo PageRank ha revolucionado la búsqueda.
- Barra de herramientas PageRank vs. Rango de página.
- Cómo funciona PageRank.
- Cómo fluye PageRank entre las páginas.
- ¿Se sigue utilizando PageRank?
vamos a bucear
¿Qué es PageRank?
Creado por los fundadores de Google, Larry Page y Sergey Brin, PageRank es un algoritmo basado en las fortalezas relativas combinadas de todos los hipervínculos en Internet.
La mayoría de la gente dice que el nombre se basó en el apellido de Larry Page, mientras que otros sugieren que «Page» se refiere a una página web. Ambas posiciones son probablemente verdaderas y la superposición probablemente fue intencional.
Cuando Page y Brin estaban en la Universidad de Stanford, escribieron un artículo titulado: Ranking de citas de PageRank: poner orden en la web.
Publicado en enero de 1999, el documento demuestra un algoritmo relativamente simple para evaluar la fuerza de las páginas web.

El trabajo se ha convertido en un patentar en los Estados Unidos (pero no en Europa, donde las fórmulas matemáticas no son patentables).

La Universidad de Stanford posee la patente y se la ha otorgado a Google. Actualmente, la patente expirará en 2027.

La historia de cómo evolucionó PageRank
Durante su tiempo en Stanford a fines de la década de 1990, tanto Brin como Page buscaban métodos de recuperación de información.
En ese momento, usar enlaces para averiguar qué tan «importante» era cada página en comparación con otra era una forma revolucionaria de ordenar las páginas. Fue computacionalmente difícil, pero no imposible.
La idea se transformó rápidamente en Google, que en ese momento era pequeño en el mundo de las búsquedas.
Hubo tanta confianza institucional en el enfoque de Google de algunos sectores que la empresa lanzó inicialmente su motor de búsqueda sin poder generar ningún ingreso.
Y mientras que Google (conocido como «BackRub» en ese momento) era el motor de búsqueda, PageRank era el algoritmo utilizado para clasificar las páginas en las páginas de resultados del motor de búsqueda (SERP).
Googlebaile
Uno de los desafíos de PageRank era que las matemáticas, aunque simples, tenían que resolverse iterativamente. El cálculo se realiza varias veces, en cada página y en cada enlace de Internet. En el cambio de milenio, estas matemáticas tardaron días en resolverse.
Los SERP de Google se han movido hacia arriba y hacia abajo durante este tiempo. Estos cambios a menudo eran erráticos, ya que se calculaban nuevos PageRanks para cada página.
Esto se conocía como el «Google Dance» y era famoso por interrumpir a los profesionales de SEO del momento cada vez que Google lanzaba su actualización mensual.
(Más tarde, Google Dance se convirtió en el nombre de una fiesta anual organizada por Google para expertos en SEO en su sede en Mountain View).
semillas de confianza
Una iteración posterior de PageRank introdujo la idea de un conjunto de «semillas de confianza» para iniciar el algoritmo, en lugar de dar a cada página en Internet el mismo valor inicial.
surfista razonable
Otra iteración del modelo introdujo la idea de un «navegador razonable».
Este modelo sugiere que es posible que el PageRank de una página no se comparta por igual con las páginas a las que enlaza, pero puede ponderar el valor relativo de cada enlace en función de la probabilidad de que un usuario haga clic en él.
Retiro de PageRank
Inicialmente se creía que el algoritmo de Google no podía ser «spam» internamente, porque la importancia de una página no solo la dictaba su contenido, sino también una especie de «sistema de votación» generado por los enlaces a la página.
Sin embargo, la confianza de Google no duró.
PageRank comenzó a volverse problemático a medida que crecía la industria de backlinks. Así que Google lo retiró de la vista del público, pero siguió confiando en él para sus algoritmos de clasificación.
La barra de herramientas de PageRank quedó obsoleta en 2016 y finalmente se redujo todo el acceso público a PageRank. Pero hasta este punto, Majestic (una herramienta de SEO) en particular ha podido correlacionar bastante bien sus cálculos con el PageRank.
Google pasó muchos años alentando a los profesionales de SEO a no manipular los enlaces a través de su documentación de «Directrices de Google» y los consejos de su equipo antispam, dirigido por Matt Cutts, hasta enero de 2017.
Los algoritmos de Google también cambiaron durante este tiempo.
La empresa se basó menos en PageRank, y luego de la adquisición de MetaWeb y la propiedad Knowledge Graph (rebautizada como «Freebase» en 2014), Google comenzó a indexar la información del mundo de diferentes maneras.
Barra de herramientas PageRank vs. Rango de página
Inicialmente, Google estaba tan orgulloso de su algoritmo que estaba feliz de compartir públicamente el resultado de su cálculo con cualquiera que quisiera verlo.
La representación más notable fue una extensión de barra de herramientas para navegadores como Firefox que mostraba una puntuación entre 0 y 10 para cada página en Internet.
De hecho, PageRank tiene una gama mucho más amplia de puntajes, pero 0-10 ha brindado a los profesionales y consumidores de SEO una forma instantánea de calificar la importancia de cualquier página en Internet.
La barra de herramientas de PageRank hizo que el algoritmo fuera muy visible, lo que también trajo complicaciones. En particular, significaba que estaba claro que los enlaces eran la forma más fácil de «engañar» a Google.
Cuantos más enlaces (o, más exactamente, cuanto mejor sea el enlace), mejor se clasificará una página en los SERP de Google para cualquier palabra clave específica.
Esto significaba que se había formado un mercado secundario, que compraba y vendía enlaces clasificados en el PageRank de la URL donde se vendió el enlace.
Este problema se agravó cuando Yahoo lanzó una herramienta gratuita llamada Yahoo Search Explorer que permitía a cualquier persona comenzar a encontrar enlaces a una página en particular.
Posteriormente, dos herramientas, Moz y Majestic, se basaron en la opción gratuita, construyeron sus propios índices de Internet y evaluaron los enlaces por separado.
Cómo PageRank ha revolucionado la búsqueda
Otros motores de búsqueda se han basado en gran medida en el análisis del contenido de cada página individual. Estos métodos no podían diferenciar entre una página influyente y una escrita simplemente con texto aleatorio (o manipulador).
Esto significaba que los métodos de búsqueda de otros motores de búsqueda eran extremadamente fáciles de manipular para los profesionales de SEO.
El algoritmo PageRank de Google fue revolucionario en ese momento.
Combinado con un concepto relativamente simple de «ngramaPara ayudar a establecer la relevancia, Google ha ideado una fórmula ganadora.
Pronto superó a los principales titulares de la época, como AltaVista e Inktomi (que impulsaron a MSN, entre otros).
Operando a nivel de página, Google también encontró una solución mucho más escalable que el enfoque de «directorio» adoptado por Yahoo y más tarde DMOZ, aunque DMOZ (también llamado Open Directory Project) pudo proporcionar inicialmente a Google un código abierto. propio director.
Cómo funciona PageRank
La fórmula para PageRank viene en muchas formas, pero se puede explicar en unas pocas oraciones.
Inicialmente, a cada página de Internet se le asigna una puntuación de PageRank estimada. Esto podría ser cualquier número. Históricamente, PageRank ha sido presentado al público como una puntuación entre 0 y 10, pero en la práctica no es necesario que las estimaciones comiencen en este rango.
Luego, el PageRank de esa página se divide por la cantidad de enlaces en la página, lo que da como resultado una fracción más pequeña.
Luego, PageRank se distribuye a las páginas vinculadas y se hace lo mismo con todas las demás páginas de Internet.
Luego, para la próxima iteración del algoritmo, la nueva estimación de PageRank para cada página es la suma de todas las fracciones de páginas que se vinculan a cualquier página determinada.
La fórmula también contiene un «factor de amortiguamiento», que se ha descrito como la posibilidad de que un navegante deje de navegar por completo.
Antes de comenzar cada iteración posterior del algoritmo, el nuevo PageRank propuesto se reduce por el factor de amortiguamiento.
Esta metodología se repite hasta que las puntuaciones de PageRank alcanzan un cierto equilibrio. Los números resultantes generalmente se transponen a un rango más reconocible de 0 a 10 por conveniencia.
Una forma de representar esto matemáticamente es:
-
Imagen del autor, abril de 2023
Dónde:
- PR = PageRank en la próxima iteración del algoritmo.
- d = factor de amortiguamiento.
- j = número de página en internet (si cada página tiene un número único).
- n=número total de páginas en internet.
- i = iteración del algoritmo (inicialmente establecido en 0).
La fórmula también se puede expresar como una matriz.
Problemas de fórmula e iteración.
La fórmula tiene algunos desafíos.
Si una página no enlaza con ninguna otra página, la fórmula no será equilibrada.
En este caso, por tanto, el PageRank se distribuirá entre todas las páginas de Internet. De esta forma, también podría llegar a una página sin enlaces entrantes Alguno PageRank, pero no se acumularía lo suficiente como para ser significativo.
Otro desafío menos documentado es que las páginas más nuevas, aunque potencialmente Además importante que las páginas más antiguas tengan un PageRank más bajo. Esto significa que, con el tiempo, el contenido antiguo puede tener un PageRank desproporcionadamente alto.
El tiempo de publicación de una página no se considera en el algoritmo.
Cómo fluye PageRank entre las páginas
Si una página comienza con un valor de 5 y tiene 10 enlaces, cada página a la que enlaza recibe 0,5 PageRank (menos el factor de amortiguamiento).
De esta forma, PageRank circula por Internet entre iteraciones.
Cuando aparecen nuevas páginas en Internet, comienzan con solo una pequeña cantidad de PageRank. Pero cuando otras páginas comienzan a hacer referencia a estas páginas, su PageRank aumenta con el tiempo.
¿Se sigue utilizando PageRank?
Aunque el acceso público a PageRank se eliminó en 2016, todavía se cree que la puntuación está disponible para los ingenieros de búsqueda de Google.
Una filtración de los factores usados por Yandex mostró que PageRank seguía siendo un factor que podían usar.
Los ingenieros de Google han sugerido que la forma original de PageRank ha sido reemplazada por una nueva aproximación que requiere menos poder de procesamiento para calcular. Si bien la fórmula es menos importante en la forma en que Google clasifica las páginas, sigue siendo una constante para cada página web.
E independientemente de los otros algoritmos que Google pueda optar por invocar, es probable que PageRank permanezca integrado en muchos de los sistemas del gigante de las búsquedas hasta el día de hoy.
Dixon explica cómo funciona PageRank con más detalle en este video:
Patentes y documentos originales para más información:
Otros recursos:
Imagen destacada: VectorMine/Shutterstock
Fuente: searchenginejournal
Hashtags: #Google #PageRank #explicado #para #principiantes #SEO
Comentarios recientes