Guía sobre los sistemas de posicionamiento de la Búsqueda de Google
Google utiliza sistemas de posicionamiento automatizados que tienen en cuenta muchos factores y señales sobre los cientos de miles de millones de páginas web y otros contenidos de nuestro índice de la Búsqueda para mostrar los resultados más útiles y relevantes; todo ello en una fracción de segundo. Esta página sirve de guía para entender algunos de nuestros sistemas de posicionamiento más destacados. También explica algunos de los sistemas que forman parte de nuestros sistemas de posicionamiento principales, que son las tecnologías subyacentes que generan resultados de búsqueda en respuesta a las consultas, además de incluir otros sistemas relacionados con necesidades de posicionamiento específicas.
Nuestros sistemas de posicionamiento están diseñados principalmente para trabajar a nivel de página, y utilizan una serie de factores y sistemas para comprender cómo se deben clasificar páginas concretas. También se utilizan señales y clasificadores a nivel de sitio, que contribuyen a que entendamos mejor las páginas. Tener algunas señales buenas a nivel de sitio no significa que todo el contenido de un sitio vaya a obtener siempre un buen posicionamiento, del mismo modo que tener algunas señales deficientes a nivel de sitio no significa que todo el contenido de un sitio vaya a obtener un mal posicionamiento.
Mejoramos constantemente los sistemas de posicionamiento haciendo pruebas y evaluaciones estrictas e informamos de las actualizaciones de nuestros sistemas de posicionamiento cuando puedan resultar útiles para los creadores de contenido y otros usuarios.
Puedes visitar también el sitio Cómo funciona la Búsqueda para entender cómo se utilizan nuestros sistemas de posicionamiento, en combinación con otros procesos, para que la Búsqueda de Google cumpla nuestra misión de organizar la información mundial y hacerla universalmente accesible y útil.
BERT
Las representaciones de codificador bidireccional de transformadores (BERT) son un sistema de IA que usa Google que nos permite entender cómo las combinaciones de palabras pueden expresar diferentes significados e intenciones.
Sistemas de información sobre crisis
Google ha desarrollado sistemas para proporcionar información útil y oportuna en momentos de crisis, ya sean situaciones de crisis personales, desastres naturales u otras situaciones de crisis generalizadas:
- Crisis personales: nuestros sistemas detectan si las personas buscan información relacionada con una crisis personal. Por ejemplo, si hacen consultas sobre temas como el suicidio, la agresión sexual, la ingestión de sustancias venenosas, la violencia de género o la adicción a las drogas. En esos casos, los resultados de búsqueda mostrarán líneas de asistencia telefónica y contenido de organizaciones de confianza. Consulta cómo se muestra la información relacionada con crisis personales en la Búsqueda de Google.
- Alertas SOS: en situaciones de desastres naturales o crisis generalizadas, nuestro sistema de alertas SOS mostrará las últimas novedades de las autoridades locales, nacionales o internacionales. Pueden mostrarse números de teléfono y sitios web de emergencia, mapas, traducciones de frases útiles y oportunidades de donación, entre otras cosas. Consulta más información sobre cómo funciona Alertas SOS y su función en el sistema de alertas de crisis de Google que ayudan en situaciones de inundaciones, incendios forestales, terremotos huracanes y otros desastres.
Sistemas de anulación de duplicados
Una búsqueda en Google puede devolver miles o incluso millones de páginas web que coinciden, y algunas pueden ser muy parecidas entre sí. En esos casos, nuestros sistemas solo muestran los resultados más relevantes para evitar duplicados innecesarios. Puedes consultar más información sobre cómo funciona la anulación de duplicados y cómo ver resultados omitidos.
La anulación de duplicados también se aplica en los fragmentos destacados. Si la ficha de una página web acaba convirtiéndose en un fragmento destacado, no se volverá a mostrar esa ficha en la primera página de resultados. De este modo, se simplifican los resultados, y los usuarios pueden encontrar información relevante más fácilmente.
Sistema de dominios de concordancia exacta
Nuestros sistemas de posicionamiento tienen en cuenta las palabras de los nombres de dominio como uno de los muchos factores para determinar si el contenido es relevante para una búsqueda. Sin embargo, con nuestro sistema de dominios de concordancia exacta nos aseguramos de que no damos demasiado valor al contenido alojado en dominios que se hayan diseñado para coincidir exactamente con consultas concretas. Por ejemplo, alguien podría crear un nombre de dominio que contenga las palabras "mejores-sitios-para-comer" con la intención de que el contenido obtenga un mejor posicionamiento. Nuestro sistema se adapta a estas situaciones.
Sistemas de actualización
Disponemos de varios sistemas para "consultas que necesitan una actualización", diseñados para mostrar contenido más actualizado en las consultas que deberían mostrarlo. Por ejemplo, si alguien busca información sobre una película que se acaba de estrenar, seguramente quiera encontrar reseñas recientes en lugar de los artículos antiguos de la época del inicio de su producción. Otro ejemplo podría ser que normalmente, si alguien busca "terremoto" obtiene información sobre preparación y recursos. Sin embargo, si ha habido un terremoto recientemente, es posible que aparezcan noticias y contenido más reciente.
Sistemas de análisis de enlaces y PageRank
Tenemos varios sistemas que comprenden cómo se enlazan las páginas entre sí para determinar de qué trata cada una y cuáles pueden ser más útiles para responder a una consulta concreta. Uno de los principales sistemas de posicionamiento utilizado desde los inicios de Google es PageRank. Si quieres obtener más información puedes consultar el documento original de investigación de PageRank y la patente. El funcionamiento de PageRank ha evolucionado mucho desde entonces, y sigue siendo uno de nuestros sistemas de posicionamiento principales.
Sistemas de noticias locales
Tenemos sistemas que identifican y muestran las fuentes de noticias locales siempre que sean relevantes, por ejemplo utilizando nuestras funciones "Noticias destacadas" y "Noticias locales".
MUM
El modelo unificado de multitarea (MUM) es un sistema de IA capaz de comprender y generar idiomas. Por el momento, no se utiliza en el posicionamiento general de la Búsqueda, sino que se usa para algunos casos concretos, como mejorar las búsquedas de información sobre las vacunas contra el COVID‐19 y mejorar el texto destacado que mostramos de fragmentos destacados.
Coincidencia neuronal
La coincidencia neuronal es un sistema de IA que usa Google para comprender representaciones de conceptos en consultas y páginas, y relacionarlas entre sí.
Sistemas de contenido original
Tenemos sistemas que permiten asegurarnos de que el contenido original aparezca de forma destacada en los resultados de búsqueda (incluidos los reportajes originales) antes que las páginas que se limitan a citarlo. Esto incluye la compatibilidad con las etiquetas canónicas especiales que los creadores pueden usar para ayudarnos a comprender cuál es la página principal de una página que se ha duplicado en varios lugares.
Sistemas de disminución de posicionamiento basados en retiradas
Google tiene políticas que permiten la retirada de determinados tipos de contenido. Si procesamos un gran volumen de este tipo de retiradas en relación con un sitio determinado, las utilizaremos como indicador para mejorar nuestros resultados. En particular:
- Retiradas de contenido por motivos legales Cuando recibimos un gran volumen de solicitudes de retirada por infracción de derechos de autor válidas relacionadas con un sitio concreto, podemos usar este hecho para disminuir el posicionamiento de otros contenidos del sitio en nuestros resultados. De esta forma, si hay otro contenido infractor, es menos probable que los usuarios encuentren ese en vez del contenido original. Aplicamos señales de disminución de posicionamiento similares a las reclamaciones relacionadas con la difamación, los productos falsificados y las retiradas por resolución judicial. En el caso del material de abuso sexual infantil, siempre lo retiramos cuando lo identificamos y disminuimos el posicionamiento de todo el contenido de los sitios con un alto contenido de material de abuso sexual infantil.
- Retiradas de información personal Si procesamos un gran volumen de solicitudes de retirada de información personal relacionadas con un sitio en el que se llevan a cabo prácticas abusivas de retirada de contenido, disminuimos el posicionamiento de otros contenidos del sitio en nuestros resultados de búsqueda. También comprobamos si el mismo patrón de comportamiento se repite en otros sitios y, si es así, disminuimos el posicionamiento del contenido de dichos sitios. Podemos aplicar prácticas similares para disminuir la posición de los sitios que reciben un volumen de retiradas de contenido que incluya contenido de doxxing, imágenes explícitas creadas o compartidas sin consentimiento o contenido falso explícito no consentido.
Sistema de clasificación de fragmentos
La clasificación de fragmentos es un sistema de inteligencia artificial que utilizamos para identificar secciones o fragmentos concretos de una página web para comprender mejor su relevancia.
RankBrain
RankBrain es un sistema de IA que nos ayuda a comprender cómo se relacionan las palabras con los conceptos. Esto significa que podemos mostrar contenido relevante, aunque no contenga exactamente todas las palabras utilizadas en la búsqueda, cuando sabemos que el contenido está relacionado con otras palabras y conceptos.
Sistemas de información fiable
Tenemos varios sistemas que funcionan de formas diferentes para mostrar la información más fiable posible. Por ejemplo, para destacar páginas más fiables y disminuir el posicionamiento del contenido de baja calidad y para mejorar el posicionamiento de los artículos de calidad. En los casos en los que falta información fiable, nuestros sistemas muestran automáticamente advertencias de contenido sobre temas que cambian rápidamente y cuando no tienen están seguros de la calidad general de los resultados disponibles de la búsqueda. Estas advertencias proporcionan consejos sobre cómo hacer búsquedas para obtener resultados más útiles. Más información sobre cómo ofrecer información de alta calidad en la Búsqueda
Sistema de reseñas
El objetivo del sistema de reseñas es recompensar mejor las reseñas de mayor calidad, el contenido que ofrece análisis esclarecedores e investigaciones originales, y que está escrito por expertos o entusiastas que conocen bien el tema.
Sistema de diversidad de sitios
Nuestro sistema de diversidad de sitios se asegura de que nuestros principales resultados de búsqueda no muestren más de dos fichas de páginas web del mismo sitio, para que ningún sitio domine los resultados. Sin embargo, si nuestros sistemas determinan que es especialmente relevante para una búsqueda concreta, podemos mostrar más de dos fichas. Por lo general, una diversidad de sitios trata los subdominios como parte de un dominio raíz. Por ejemplo, se considerará que las fichas de un subdominio (subdominio.example.com) y del dominio raíz (example.com) son del mismo sitio. No obstante, a veces, los subdominios se tratan como sitios independientes por razones de diversidad cuando se considera que es relevante.
Sistemas de detección de spam
A nadie le gusta que su bandeja de entrada esté llena de spam. Por eso los filtros de spam son tan útiles. La Búsqueda se enfrenta a un reto similar, ya que Internet incluye una gran cantidad de spam que, si no se controlara, no se podrían mostrar los resultados más útiles y relevantes. Contamos con una amplia gama de sistemas de detección de spam, incluido SpamBrain, para hacer frente al contenido y los comportamientos que infrinjan nuestras políticas de spam. Estos sistemas se actualizan constantemente tener en cuenta las últimas tendencias relacionadas con el desarrollo de spam.
Sistemas retirados
Los siguientes sistemas se indican con fines históricos. Estos sistemas se han integrado en otros más recientes o han pasado a formar parte de nuestros sistemas principales de posicionamiento.
Sistema de contenido útil
Anunciado en el 2022 como la "actualización de contenido útil", se trata de un sistema diseñado para garantizar que los usuarios vean contenido original, útil y escrito por personas en los resultados de búsqueda, en lugar de en contenido creado principalmente para aumentar el tráfico de los buscadores. En marzo del 2024, evolucionó y se incorporó a nuestros sistemas de posicionamiento principales, ya que nuestros sistemas utilizan una gran variedad de señales y sistemas para mostrar resultados útiles a los usuarios.
Hummingbird
Este sistema supuso una mejora significativa de nuestros sistemas de posicionamiento general. Se introdujo en agosto del 2013. Nuestros sistemas de posicionamiento han seguido evolucionando desde entonces, tal y como habían hecho antes.
Sistema Panda
Este sistema se diseñó para asegurar que se mostrara contenido original y de alta calidad en los resultados de búsqueda. Se anunció en el 2011 como "Panda". Después, evolucionó y en el 2015 pasó a formar parte de nuestros sistemas de posicionamiento principales.
Sistema Penguin
Este sistema se diseñó para combatir el spam de enlaces. Se anunció en el 2012 como una "actualización de Penguin". En el 2016, se integró en nuestros sistemas de posicionamiento principales.