Inside Google. 5 preguntas y respuestas. ¿Cómo funciona el algoritmo de Google según Google? Inside Search.


Hoy en I love Google´s Robot, en cinco preguntas y respuestas, ¿Cómo funciona el algorítmo de Google según Google? Inside Search.

1.- ¿Cómo explica Google el funcionamiento de su legendario algoritmo?

Google acaba de estrenar Inside Search, una original web en la que podemos hacernos una idea muy precisa del funcionamiento del buscador siguiendo su propuesta interactiva y de cómo funciona su algoritmo. Os recomiendo que empleéis unos minutos en familiarizaros con una herramienta que tanto nos ayuda diariamente.

2.- ¿En cuántos sitios individuales afirma Google que realiza la búsqueda?

Actualmente, en el año 2013, en más de 30 trillones de páginas individuales.

3.- ¿Cuáles son las fases de la búsqueda de Google?

a) Crawling. (Gateando como los bebés)

Google va gateando de link a link, de enlace a enlace de los diferentes sitios individuales, sean webs o blogs, pero con la condición que ese sitio permita al buscador rastrear en el código fuente de su página.

I love Google´s robot

I love Google´s robot

b) Sort the pages and keep track of it all in the Index. Clasificación de los sitios o páginas almacenándolas y monitorizándolas en el Indice.

I love google´s robot

Google clasifica las páginas individuales según su contenido y otros factores y luego las indexa. Esto supone más de 100 millones de GB de contenido.

I love Google´s Robot

I love Google´s Robot

c) Algorithms Algoritmos.

Mediante los Algoritmos, es decir mediante la formulas que los ingenieros de Google desarrollan se trata de interpretar exactamente lo búsqueda que desea la persona qu introduce el dato. Para ello utiliza las funciones de autocompletar, busca sinónimos, utiliza Inside Google para comparar la búsqueda con otras búsquedas anteriores, busca en miles de libros almacenados en la Red, etc.

I love Google´s Robot

I love Google´s Robot

Es decir recopila toda la información disponible, utilizando más de 200 factores de búsqueda como la originalidad de la página, el diseño, la calidad, la frescura de sus contenidos, etc, y extrae los resultados más relevantes relacionados con la búsqueda.

Para uno de los fundadores de Google, Larry Page, el “perfecto motor de búsqueda entendería exactamente qué es lo que quieres decir y te daría exactamente lo que buscas”.

I love Google´s Robot

I love Google´s Robot

d) The Search Lab. El laboratorio de búsqueda.

Es el corazón del buscador. El laboratorio de búsqueda es el lugar físico donde los ingenieros de Google investigan, comparan e implementan las búsquedas reales de los usuarios para ir ajustandolas a la realidad y mejorandolas día a día. Por ello el algoritmo tiene vida propia y está en constante evolución y retroalimentación. Es como una bola de nieve que a medida que cae por la ladera de la montaña sea hace más grande.

I love Google´s Robot

I love Google´s Robot

De esa forma los resultados que suelen aparecer de media en 1/8 de segundo, se muestran en un abanico grande de posibilidades: Titulares, Noticias de medios de comunicación, vídeos, imágenes, etc, todo ello mezclado y por orden de importancia.

e) Fight Spam 24/7. Lucha 24 horas 7 días a la semana.

I love Google´s Robot

I love Google´s Robot

Si hay algo que obsesiona a los fundadores de Google y por lo tanto a todos sus empleados, especialmente a los ingenieros del Laboratorio de búsquedas es luchar contra el Spam.

Esta lucha incluso se hace manualmente en muchos casos y se notifica a los propietarios de la página para que corrijan el problema o de lo contrario afectará a la indexación de la página. En 2012 se llegaron a detectar casi 700 mil webs fraudulentas.

Ejemplos de Spam según Google:

  • Redireccionamientos encubiertos.

El sitio parece mostrar contenido distinto al que se muestra.

  • Sitio pirateados. (Por terceros de sitios web para mostrar sus enlaces o contenidos).
  • Texto oculto o con demasiadas palabras clav
  • Dominios aparcados. (Sitios con poco contenido único).
  • Sitios Spam en estado puro. (Contenido ininteligible generado automáticamente, encubrimiento, contenido extraído de otros sitios web o infracciones graves o reiteradas de las directrices para webmasters de Google)
  • Proveedores de DNS dinámicos y hosts gratuitos de contenido malicioso
  • Sitios con contenido poco relevante o copiado.
  • Enlaces no naturales de un sitio. (Como la venta de enlaces).
  • Spam generado a propósito por el usuario. (Cuando se crean enlaces artificiales en foros, páginas de libros de visitas, comentarios, etc.).

Así funciona el buscador, grosso modo. Espero que os haya resultado útil e interesante como a mí.

Carlos Arauz

Acerca de arauzcarlos

Licenciado en Derecho. Director de Seguridad. Master en Prevención de Riesgos Laborales. Community Manager. Carlos Arauz en Google
Esta entrada fue publicada en Inside Google y etiquetada , , , , , , , , , , , , , , , , , , . Guarda el enlace permanente.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s