Google utiliza un sistema de inteligencia artificial de aprendizaje de máquinas llamado “RankBrain” para ayudar a ordenar sus resultados de búsqueda.

¿Te preguntas cómo funciona y se ajusta al sistema de clasificación general de Google? Esto es lo que se sabe sobre RankBrain.

La información que se incluye a continuación proviene de tres fuentes originales y se ha actualizado con el tiempo. Estas son las fuentes:

Primero es un artículo en la revista Bloomberg que dio la noticia sobre RankBrain.

Segundo, información adicional que Google ha proporcionado directamente a Search Engine Land.

En tercer lugar, suposiciones basadas en mi experiencia donde Google no está proporcionando respuestas claras.

¿Qué es RankBrain?

RankBrain es el nombre de Google para un sistema de inteligencia artificial de aprendizaje automático que se utiliza para ayudar a procesar sus resultados de búsqueda, según informó Bloomberg y también confirmado por Google.

¿Qué es el aprendizaje automático?

Aprendizaje automático se refiere a cuando una computadora se enseña a sí misma a hacer algo, en lugar de que un humano le enseñe a hacer algo o la programe para una tarea específica.

¿Qué es la inteligencia artificial?

La verdadera inteligencia artificial, o AI para abreviar (de sus siglas en inglés), se refiere a cuando una computadora puede ser tan inteligente como un ser humano, al menos en el sentido de adquirir conocimiento tanto aprendido como construido a partir de lo que sabe y hacer nuevas conexiones de datos.

La verdadera AI sólo existe en las novelas de ciencia ficción, por supuesto. En la práctica, AI se utiliza para referirse a sistemas informáticos diseñados para aprender y establecer conexiones de datos.

¿Qué diferencia hay entre la IA y el aprendizaje automático? En términos de RankBrain, parece que son bastante similares. Puedes oír que ambos se usan indistintamente, o puedes escuchar el aprendizaje automático usado para describir el tipo de enfoque de inteligencia artificial que se está empleando.

¿Es RankBrain la nueva forma en la que Google clasifica los resultados de búsqueda?

No. RankBrain es parte del algoritmo general de búsqueda de Google, un programa de computadora que se utiliza para clasificar los miles de millones de páginas que conoce y encontrar las que se consideran más relevantes para consultas individuales.

¿Cuál es el nombre del algoritmo de búsqueda de Google?

Se llama Hummingbird. Durante años, el algoritmo global no tenía un nombre formal. Pero a mediados de 2013, Google revisó ese algoritmo y le dio un nombre, Hummingbird.

¿RankBrain es parte del algoritmo de búsqueda de Hummingbird de Google?

Al parecer si. Hummingbird es el algoritmo de búsqueda general, al igual que un coche tiene un motor para moverse google.

El propio motor puede estar compuesto de varias partes, tales como un filtro de aceite, una bomba de combustible, un radiador y así sucesivamente. De la misma manera, Hummingbird abarca varias partes, con RankBrain ha dotado su motor de una nueva mejora.

En particular, se sabe que RankBrain es parte del algoritmo general de Hummingbird porque el artículo de Bloomberg deja claro que RankBrain no maneja todas las búsquedas, ya que sólo el algoritmo general lo hace.

Hummingbird también contiene otras partes con nombres familiares para aquellos en el espacio SEO, como Panda, Penguin y Payday diseñado para combatir el spam, Pigeon diseñado para mejorar los resultados locales, Top Heavy diseñado para rebajar las páginas ad-heavy, Mobile Friendly diseñado para recompensar las páginas Mobile-Friendly y Pirate diseñado para luchar contra la infracción de derechos de autor.

¿Pero no era PageRank el algoritmo de Google?

PageRank es parte del algoritmo general de Hummingbird que cubre una forma específica de dar crédito a páginas basándose en los enlaces de otras páginas.

PageRank es especial porque es el primer nombre que Google le dio a una de las partes de su algoritmo de clasificación, en el momento en que el motor de búsqueda comenzó, en 1998.

¿Qué pasa con las “señales” que Google utiliza para la clasificación?

Las señales son cosas que Google usa para ayudar a determinar cómo clasificar las páginas web.

Por ejemplo, leerá las palabras en una página web, por lo que las palabras son una señal.

Si algunas palabras están en negrita, esa podría ser otra señal que se tome en cuenta.

Los cálculos utilizados como parte de PageRank dan a una página una puntuación de PageRank que se utiliza como una señal.

Si se observa que una página es móvil, es otra señal registrada.

Todas estas señales son procesadas por varias partes dentro del algoritmo de Hummingbird para averiguar qué páginas muestra Google en respuesta a diversas búsquedas.

¿Cuántas señales hay?

Google ha hablado bastante de que tiene más de 200 señales de clasificación importantes que se evalúan, a su vez, podrían tener hasta 10.000 variaciones o sub-señales.

Más típicamente sólo dice “cientos” de factores, como lo hizo en el artículo de Bloomberg.

¿Es RankBrain la tercera señal más importante?

Está bien. De la nada, este nuevo sistema se ha convertido en lo que Google dice es el tercer factor más importante para la clasificación de páginas web.

Esta es una cita del artículo de Bloomberg:

“RankBrain es uno de los “cientos” de señales que entran en un algoritmo que determina qué resultados aparecen en una página de búsqueda de Google y donde se clasifican, dijo Corrado. En los pocos meses que se ha desplegado, RankBrain se ha convertido en la tercera señal más importante que contribuye al resultado de una consulta de búsqueda, dijo.”

¿Cuáles son las primeras y segundas señales más importantes para Google?

 

Los enlaces siguen siendo la señal más importante, la forma en que Google cuenta los enlaces es en forma de votos.

En cuanto a la segunda señal más importante, supongo que serían las “palabras”, donde las palabras abarcarían todo, desde las palabras de la página hasta cómo interpreta Google las palabras que las personas ingresan en el cuadro de búsqueda fuera del análisis de RankBrain.

Esto está confirmado, en marzo de 2016, Google reveló que los dos primeros factores eran el contenido y los vínculos. O enlaces y contenidos, porque no dijo que fue primero.

¿Qué hace exactamente RankBrain?

RankBrain se utiliza principalmente como una forma de interpretar las búsquedas que la gente realiza para encontrar las páginas que no son fáciles de encontrar con “Palabras Exactas”.

¿Google no tiene ya formas de encontrar páginas más allá de la “consulta exacta”?

Sí, Google ha encontrado páginas más allá de los términos exactos que alguien introduce desde hace mucho tiempo.

Por ejemplo, hace años , si introducías algo así como “zapato”, Google podría no haber encontrado páginas que decían “zapatos”, porque éstas son técnicamente dos palabras diferentes.

Pero el uso de “stemming” permitió a Google ser más inteligente, para entender que los zapatos es una variación de zapato, al igual que “correr” es una variación de “correr”.

Google también consiguió a través de mejoras en el algoritmo “sinónimos inteligentes”, de modo que si buscas “zapatos corrientes” podría entender que también quieres encontrar “zapatillas de deporte”.

Incluso ganó algunas inteligencias conceptuales, entender que hay páginas sobre “Manzana” que se refieren además de a la fruta a la Compañía “Apple”.

¿Qué pasa con el Knowledge Graph (Gráfico de conocimiento)?

El Knowledge Graph, lanzado en 2012, fue una forma en la que Google creció aún de forma más inteligente sobre las conexiones entre palabras.

Y lo que es más importante, aprendió a buscar “cosas que no sean cadenas”, como lo ha descrito Google.

Esto significa que Google entiende cuando alguien busca a “Obama”, probablemente significa el presidente de Estados Unidos, Barack Obama, una persona real con conexiones a Otras personas, lugares y cosas.

El Knowledge Graph es una base de datos de hechos sobre las cosas en el mundo y las relaciones entre ellos.

Es por eso que puedes hacer una búsqueda como “Cuándo nació la esposa de Obama” y obtener una respuesta sobre Michele Obama sin tener que usar su nombre completo para obtener un resultado.

Knowledge Graph de Google

¿Cómo está RankBrain ayudando a refinar las consultas?

Los métodos que Google ya utiliza para refinar las consultas es el trabajo de algún ser humano en algún lugar haciendo el trabajo, ya sea habiendo creado listas de derivación o listas de sinónimos o haciendo conexiones de base de datos entre cosas.

Claro, hay alguna automatización involucrada. Pero en gran medida, depende del trabajo humano.

El problema es que Google procesa tres mil millones de búsquedas diarias. En 2007, Google dijo que entre 20 y 25 por ciento de esas consultas nunca se habían visto antes.

En 2013, se redujo ese número al 15 por ciento, que fue utilizado de nuevo en el artículo de Bloomberg  y que Google ha confirmado. Pero el 15 por ciento de los tres mil millones sigue siendo un gran número de consultas nunca ingresadas por cualquier persona – 450 millones por día.

Entre las que pueden ser más complejas, están las consultas de varias palabras, también llamadas Long Tail (larga cola).

RankBrain está diseñado para ayudar a interpretar mejor estas consultas y traducirlas efectivamente para encontrar las mejores páginas para la persona que busca algo.

Como dice Google, puede ver patrones entre búsquedas complejas aparentemente no conectadas para entender cómo son de similares entre sí.

Este aprendizaje, a su vez, le permite comprender mejor las búsquedas complejas futuras y si están relacionados con temas particulares.

Lo más importante, se pueden asociar estos grupos de búsquedas con los resultados que cree que les gustará más a los usuarios.

Google no proporciona ejemplos de grupos de búsquedas o detalles sobre cómo RankBrain “adivina” cuáles son las mejores páginas. Es probable que sea porque si puede traducir una búsqueda ambigua en algo más específico dará mejor respuesta a una búsqueda concreta.

Si quieres ampliar información sobre RankBrain en Español aquí tiene las mejores referencias: