El rastreo de Google Noticias ahora con Googlebot

martes, 27 de septiembre de 2011

Google Noticias ha actualizado recientemente su infraestructura para poder rastrear con Googlebot , el user-agent principal de Google. ¿Qué significa esto? En realidad, este cambio apenas afecta a la mayoría de los editores. Cualquier medio de comunicación que quiera dejar de aparecer en Google Noticias, podrá hacerlo. Google Noticias seguirá respetando la entrada del archivo robots.txt para Googlebot-News , nuestro anterior user-agent, si bien esta entrada es más restrictiva que la entrada de robots.txt para Googlebot.

En nuestro Centro de asistencia, se ofrecen directrices detalladas sobre cómo utilizar el protocolo de exclusión de robots para Google Noticias. Además, los editores pueden ponerse en contacto con el equipo de asistencia de Google Noticias [ inglés ] si tienen preguntas, pero antes vamos a aclarar lo siguiente:
  • Aunque ahora solo verás el user-agent Googlebot en los registros de tu sitio, no debes preocuparte; el hecho de que aparezca Googlebot en lugar de Googlebot-News es independiente de nuestras políticas de inclusión. (Puedes comprobar en cualquier momento si tu sitio está incluido en Google Noticias realizando una búsqueda con el operador "site:". Por ejemplo, introduce "site:tusitiodenoticias.com" en el campo de búsqueda de Google Noticias y, si aparecen resultados, significa que estamos indexando tu sitio de noticias).
  • Tu herramienta analítica seguirá diferenciando el tráfico de los usuarios que llega a tu sitio web desde la Búsqueda de Google y el tráfico que llega desde Google Noticias, por lo que no deberías detectar ningún cambio. La principal diferencia es que ya no volverás a ver las visitas automatizadas que se realicen ocasionalmente a tu sitio desde el rastreador Googlebot-News.
  • Si actualmente sigues nuestras directrices para Googlebot , no será necesario que realices ningún cambio en el código de tu sitio. Los sitios que hayan implementado suscripciones mediante un modelo "medido" o los que hayan implementado First Click Free no experimentarán ningún cambio. En el caso de los sitios que requieran registro, pago o acceso a la cuenta antes de permitir la lectura de un artículo completo, Google Noticias solo podrá rastrear e indexar el título y el fragmento que se muestren a todos los usuarios que visiten la página. Las directrices para webmasters de Google ofrecen información adicional sobre el " encubrimiento o cloaking" (una práctica que consiste en mostrar a un robot una versión diferente de la que ven los usuarios). Para obtener más información sobre Google Noticias y los editores de suscripción, consulta este artículo del Centro de asistencia [ inglés ].
  • Puedes respirar tranquilo, ya que tu sitemap se seguirá rastreando. Este cambio no afecta a la forma en que rastreamos los sitemaps de noticias. Si eres editor de Google Noticias y todavía no has configurado un sitemap de noticias, haz clic en este enlace si quieres empezar a crearlo.
  • En el caso de los editores que quieran dejar de aparecer en Google Noticias y permanecer en la Búsqueda de Google, solo es necesario bloquear Googlebot-News y permitir el uso de Googlebot. Para obtener más información sobre cómo realizar esta acción, consulta la página del Centro de asistencia .
Al igual que ocurre con cualquier sitio web, es necesario actualizar nuestra infraestructura cada cierto tiempo. Al mismo tiempo, queremos seguir ofreciendo todo el control posible a los sitios web de noticias. Esperamos haber respondido a todas las preguntas que te hayan podido surgir con relación a esta actualización. Si tienes preguntas adicionales, consulta la página del Centro de asistencia [ inglés ].

(También publicado en el Blog de Google Noticias [inglés])

Publicado por David Smydra, especialista en productos de Google Noticias