Google utiliza un almacenamiento más rápido para páginas de alta demanda

Gary Illyes de Google revela que el índice de búsqueda utiliza un sistema por niveles donde el contenido más popular se indexa en un almacenamiento más rápido y costoso.

Este tema se trata en el último episodio de Google Búsqueda extraoficial podcast que trata las complejidades del idioma en la selección del índice de búsqueda.

Al explicar cómo Google crea su índice de búsqueda, Illyes dice que el contenido se indexa en tres tipos de almacenamiento:

  • RAM (Memoria de acceso aleatorio): el más rápido y el más caro
  • SSD (Unidad de estado sólido): muy rápido pero con un costo prohibitivo
  • HDD (Disco duro): más lento y menos costoso

Google reserva el almacenamiento más rápido para los documentos que probablemente aparezcan en los resultados de búsqueda con frecuencia.

Anuncio

Continuar leyendo a continuación

Illyes afirma:

“Y luego, cuando construimos nuestro índice, usamos todas esas señales que tenemos. Elijamos uno, digamos, rango de página, luego tratamos de estimar cuánto serviríamos esos documentos que indexamos.

Entonces, ¿será como cada segundo? ¿Tendremos una consulta que active esos documentos? ¿O será una vez a la semana o será una vez al año?

Y en base a eso, podríamos usar diferentes tipos de almacenamiento para construir el índice “.

Illyes continúa dando ejemplos de lo que se almacenaría en la RAM, lo que se almacenaría en los SSD y lo que se almacenaría en los HDD.

El contenido al que se accede cada segundo terminará almacenándose en RAM o SSD. Esto representa una pequeña cantidad del índice completo de Google.

Anuncio

Continuar leyendo a continuación

La mayor parte del índice de Google se almacena en discos duros porque, en palabras de Illyes, los discos duros son baratos, accesibles y fáciles de reemplazar.

“Por ejemplo, para los documentos que sabemos que pueden aparecer cada segundo, por ejemplo, terminarán en algo súper rápido. Y lo superrápido sería la RAM. Como si parte de nuestro índice de servicio estuviera en RAM.

Luego tendremos otro nivel, por ejemplo, para unidades de estado sólido porque son rápidas y no tan caras como la RAM. Pero aún no, la mayor parte del índice no estaría en eso.

La mayor parte del índice estaría en algo que sea barato, accesible, fácilmente reemplazable y que no arruine el banco. Y eso serían discos duros o disquetes “.

Por supuesto que Illyes está bromeando sobre los disquetes, ese es el tipo de humor seco que obtienes de él en el podcast.

Que yo sepa, esta es la primera vez que Google permite que el público acceda a información sobre sus niveles de almacenamiento de índices de búsqueda. Es interesante saber que el contenido más buscado se almacena en RAM y SSD.

El costo de almacenar incluso un porcentaje del índice de Google en RAM y SSD debe ser exorbitante. Aunque es probable que el costo de un almacenamiento más rápido se justifique por la importancia de los documentos que contiene para las personas.

La demanda del contenido debe ser tan alta que Google no quiera correr el riesgo de retrasar su distribución a los buscadores.

Anuncio

Continuar leyendo a continuación

En lo que respecta al SEO, no hay forma de optimizar un tipo de almacenamiento sobre el otro. Y no hay forma de saber en cuál de los niveles de almacenamiento está indexado su sitio.

Supongo que un porcentaje decididamente pequeño de páginas web están indexadas en RAM o SSD. Llevarlo de vuelta al SEO, esto es algo bueno, ya que significa que la mayoría de los sitios compiten en igualdad de condiciones en lo que respecta a la velocidad de almacenamiento de índices.