Site Clinic I. Sitios web con marcos

martes, 27 de octubre de 2009

Es un placer ser el primero en colaborar en esta iniciativa del Site Clinic con el sitio web de la organización argentina Fundación Huésped (http://www.huesped.org.ar); espero que este artículo y los que vendrán a continuación sean útiles, no sólo para las páginas webs elegidas, sino también para todos los webmasters que leéis este blog y alguna vez os hayáis planteado si vuestro sitio web podría mejorarse y si es accesible y correctamente visualizado por los motores de búsqueda.




El uso de marcos

Al comenzar el análisis de huesped.org.ar , lo primero que salta a la vista es el uso de marcos “frames” en la página principal. Históricamente los marcos han causado muchos problemas a los motores de búsqueda (podéis encontrar más información en el Centro de Ayuda para webmasters ). Pero, resumiendo, el uso de marcos crea conflictos con la idea de que una página se corresponde con una sola URL (con el uso de marcos, una página puede mostrar contenidos de más de una URL).

Volvamos al ejemplo de la página principal y miremos que es lo que Google "ve" cuando el Googlebot rastrea la página principal de Fundación Huésped. Como esta página está formada sólo por dos marcos vemos que la "cache" de Google está vacía , no hay nada que Googlebot pueda rastrear. Esto tiene un efecto problemático en dicha página y, teniendo en cuenta que ésta es una de las páginas más importantes, este efecto se puede notar en todo el sitio web.


Código fuente de la página principal

Si bien es cierto que pueden tener su utilidad (y que a algunos webmasters y programadores les gustan) la mejor solución sería no usar marcos. Otra solución, menos efectiva, sería usar la etiqueta HTML <noframes> para mostrar al Googlebot algún contenido. Google acepta el uso de <noframes>, pero recuerda incluir la misma información que hay en la página, para evitar ir en contra de nuestras Directrices para webmasters . En este caso por ejemplo podríamos añadir el contenido en texto de los menús o del Flash en esta etiqueta.

Otro de los problemas del uso de marcos es que se indexan las URL que conforman los distintos "marcos" que constituyen la página y pueden servirse al usuario de manera independiente. Tomemos por ejemplo esta página con bastante contenido que puede ser útil y aparecer en Google:


Para esta URL, sí que tenemos contenido en la cache lo que significa que esta URL fue rastreada e indexada por Google y podría aparecer en los resultados. Sin embargo, cuando visualicen la página en su navegador, los menús que se mostraban en el otro marco, se habrán perdido y el usuario se encontrará "atrapado" en la página. Una solución puede ser enlazar a esa página con los marcos como opción alternativa para los usuarios. Aun así, en lo que respecta a indexación, posicionamiento y usabilidad, insistimos en la recomendación de no utilizar marcos siempre que sea posible.

Enlaces de retorno

Este punto está relacionado con el uso de marcos que comentamos anteriormente y aunque no queremos analizar problemas de usabilidad no puedo resistirme a comentar este. Puedo ver que algunos enlaces como el de "Volver" en esta página:


están implementados como funciones de JavaScript que hacen un retorno a la página anterior, lo cual da problemas si el usuario llega a esa página desde Google, desde un enlace de otro sitio web, o su navegador ha cargado el sitio en una ventana nueva.

<a href="javascript:history.go(-1);">Volver</a>

Podéis hacer la prueba: buscad en Google las noticias que hay alojadas en la página, con el operador de búsqueda "site:" . Ahora haced clic en una de ellas y después clic en "Volver". El usuario vuelve a la página de resultados de Google, cuando puede que haya otras páginas que puedan interesarle en vuestro dominio. Puede que esto sea difícil de cambiar, porque depende del CMS (Sistema de Gestión de Contenidos) que estéis usando, pero en este caso sería importante ofrecer al usuario, por lo menos, algún enlace al menú o página principal, para que se quede en el sitio si así lo desea.

Página principal canónica

Este es un tema del que ya se ha hablado mucho, en este blog , o en el de Matt Cutts [inglés] , así que intentaré no extenderme demasiado. Parece que www.huesped.org.ar/ es la URL canónica de este sitio web (es la que aparece si busco en google.com.ar [fundacion huesped]), así que lo mejor sería que las otras variantes que identifican a la página principal hagan una redirección 301 a www.huesped.org.ar/


Títulos en páginas

Tener títulos únicos y descriptivos en las páginas es importante para el posicionamiento, pero también para el usuario, los cuales le permitirán elegir la página que desee. En este caso, muchas de las páginas contienen un título genérico: Fundación Huésped, que identifica al dominio y no el contenido de dicha página. Otras páginas contienen el aún menos descriptivo "Untitled Document". Probad por ejemplo las siguientes búsquedas en Google:
  • [site:huesped.org.ar intitle:huesped]
  • [site:huesped.org.ar intitle:untitled]

Páginas como http://www.huesped.org.ar/site/secciones/forms/formulario_donacion.html podrían tener títulos más descriptivos como: Formulario de Donación de la Fundación Huésped, que ayudarían al usuario final a entender qué es lo que va a encontrar en dicha página.

Indexación: Sitemaps, robots.txt y páginas 404

Por último, aunque parece que el sitio tiene muchas páginas en el índice y casi todas tienen contenido, no está de más incluir un Sitemap que podéis mandar a través de las Herramientas para webmasters que facilite entender la estructura de vuestro sitio web.

Si hay páginas que ya no existen, en lugar de devolver un código de estado 200, como en este caso, es preferible devolver un error 404 con cierta información para el usuario, indicando que la página ya no está ahí y ofreciendo alguna alternativa, como por ejemplo volver a la página principal:


Google ofrece ayuda sobre cómo mejorar tus páginas "no encontradas" .

También podéis usar robots.txt , que ahora mismo me da un error cuando intento acceder al archivo robots.txt, para excluir páginas o directorios que no queréis que Google rastree; por ejemplo, veo que hay páginas como estos "banners" en Flash, que probablemente no merezca la pena que indexemos y sirvamos al usuario:


Un último apunte, he visto algunas URL obsoletas en el índice, si buscáis por [dona fundacion huesped] iréis a parar a la página https://www.huesped.org.ar/huespedweb/aeg/formulario_donacion.html
y que cuenta con imágenes con enlaces rotos. Sería mejor tener una redirección 301 entre estas páginas y hacer lo mismo con otras páginas obsoletas que tengamos.

Esto es todo, recordad que esto no es un estudio minucioso y exhaustivo sino una serie de recomendaciones generales. Si tenéis más preguntas o sugerencias sobre qué os parecen estos consejos, o tenéis sugerencias sobre cómo implementar algunas de las recomendaciones, podéis dirigirlas a nuestro foro o escribir en los comentarios.

Publicado por Oscar Calve, equipo de Calidad de búsqueda.