John Mueller de Google plus respondió últimamente a el interrogante de si hay un umbral porcentual para el contenido duplicado que usa Google plus para detectar y filtrar el contenido duplicado.

¿Qué porcentaje se ajusta a contenido duplicado?

En verdad, la charla empezó en Fb en el momento en que Duane Forrester (@DuaneForrester) preguntó si alguien sabe si los buscadores han anunciado una tasa de superposición de contenido donde el contenido se considera duplicado.

Bill Hartzer (bhartzer) recurrió a Twitter para hacerle una pregunta a John Mueller y consiguió una contestación prácticamente instantánea.

Bill tuiteó:

“Oye, @johnmu, ¿hay un porcentaje que represente contenido duplicado?

Por poner un ejemplo, ¿deberíamos intentar confirmarnos de que las páginas sean por lo menos un 72,6 % exclusivas de otras páginas de nuestro lugar?

¿Google plus asimismo mide?”.

John Mueller de Google plus respondió:

¿De qué forma descubre Google plus el contenido duplicado?

La metodología de Google plus para advertir contenido duplicado se mantuvo claramente afín a lo largo de varios años.

En 2013, Matt Cutts (@mattcutts), un ingeniero de programa de Google plus en ese instante publicó un vídeo oficial en Google plus describiendo de qué forma Google plus descubre contenido duplicado.

Empezó el vídeo aseverando que una gran parte del contenido en Internet está duplicado y que o sea habitual.

“Es esencial percatarse de que si mira el contenido en la página web, precisamente el 25 % o el 30 % de todo el contenido en la página web es contenido duplicado.

… La multitud citará un parágrafo de un blog y después vinculará al blog, algo de este modo.

Continuó diciendo que ya que una gran parte del contenido duplicado es inocente y no es contenido publicitario, Google plus no penalizará ese contenido.

Penalizar webs por tener contenido duplicado, ha dicho, tendría un efecto negativo en la calidad de los resultados de la búsqueda.

Lo que hace Google plus en el momento en que halla contenido duplicado es:

«… intente reunirlos a todos juntos y trátelos tal y como si fuesen únicamente una parte de contenido».

Matt continuó:

“Sencillamente se habla como algo que requerimos agrupar apropiadamente. Y debemos confirmarnos de que clasifica apropiadamente».

Explicó que Google plus entonces escoge qué página enseñar en los resultados de la búsqueda y filtra las páginas repetidas para prosperar la experiencia del usuario.

De qué manera administra Google plus el contenido duplicado: versión 2020

Avance veloz hasta 2020, y Google plus lanzó un episodio del podcast Search Off the Record donde se detalla exactamente el mismo tema en un lenguaje claramente afín.

Aquí está la sección importante de ese podcast del minuto 06:44 del episodio:

“Gary Illyes: Y en este momento nos encontramos en el próximo paso, que de todos modos es la canonización y la detección de estafa.

Martin Splitt: ¿No es exactamente lo mismo, en determinado sentido, la detección de trampas y la canonización?

Gary Illy: [00:06:56] Bueno, no es así, ¿verdad? Pues primero hay que advertir las estafas, esencialmente agruparlas, diciendo que todas y cada una estas páginas son estafas entre sí,
y después esencialmente debes conseguir una página primordial para todos ellos.

… Y o sea canonización.

Conque tienes duplicación, que es todo el término, pero en él tienes la creación de conjuntos, como la creación de conjuntos y la canonización. «

Gary sigue enseñando en términos profesionales de qué forma hacen precisamente eso. Esencialmente, Google plus no mira los porcentajes precisamente, sino equipara las cantidades de verificación.

Se puede decir que una suma de verificación es una representación del contenido como una sucesión de números o letras. Entonces, si el contenido está duplicado, la secuencia numérica de la suma de control va a ser afín.

Es de este modo como Gary lo explicó:

“Entonces, para la detección de estafa, lo que hacemos es, bueno, intentamos de advertir el estafa.

Y la manera en que hacemos o sea probablemente la manera en que lo realiza la mayor parte de la gente en otros buscadores web, esencialmente reducimos el contenido a un hash o suma de verificación y después equiparamos las cantidades de verificación».

Gary mencionó que Google plus lo realiza así por el hecho de que es mucho más fácil (y por supuesto exacto).

Google plus descubre contenido duplicado con cantidades de verificación

Entonces, tratándose de contenido duplicado, probablemente no sea un umbral de porcentaje, donde hay un número en el que diríase que el contenido está duplicado.

Mucho más bien, el contenido duplicado se descubre con una representación de suma de verificación del contenido y después se equiparan esas cantidades de verificación.

Otra conclusión es que semeja haber una distinción entre cuándo se duplica una parte del contenido y cuándo se duplica todo el contenido.


Imagen cortesía de Shutterstock / Ezume Images

Fuente: searchenginejournal

Hashtags: #porcentaje #Google plus #representa #contenido #duplicado