Breve análisis SEO de la web del Museo Reina Sofia en Madrid

El crawl SEO, proceso fundamental para recoger informaciones en internet

Para trabajar en profundidad y no perder el tiempo en implementaciones inútiles, necesitamos datos cifrados y exhaustivos de la página analizada.

Gracias a la herramienta SEO, Advanced SEO Toolbox, podemos sacar informes personalizados de indicadores fundamentales. En este artículo presentamos algunas sugerencias y ejemplos de mejoras en base a una muestra de datos sacados de un crawl.  El primer paso antes de conocer a un nuevo cliente consiste en realizar un breve análisis de su pagina con los KPIs mas llamativos.

Como ejemplo de este tipo de informe SEO, hemos elegido rastrear la página oficial del Museo de arte contemporáneo Reina Sofía en Madrid hasta el nivel 5 de profundidad (5 clics desde la página de inicio, 69.044 URLs). Esta página tiene mucho potencial SEO, por su autoridad, su popularidad y su antigüedad en la red. Pero sobre todo por sus contenidos de referencia. Es exactamente el tipo de pagina que gusta a los buscadores y a los consultores SEO porque cada integracion correctamente hecha genera casi automáticamente una subida de tráfico SEO. Además es una pagina multi-idioma, en la cual se supone que podemos tener acceso a un catálogo de obras de arte rico y singular.

Se puede descargar el informe SEO al formato PDF (2,4 Mo) o pinchando en la imagen de abajo.

Fortalezas del Museo Nacional Centro de Arte Reina Sofia

  • Catálogo de 20.000 obras del patrimonio artístico español e internacional (fuente www.museoreinasofia.es)
  • Contenidos multimedia de alto valor (radio, vídeos e imágenes)
  • Page Rank de 8/10
  • Volumen reducido de códigos de errores (168 errores 4XX, fuente ATB)

  • Fichas de obras interesantes y completas
  • Diseño adaptado para la navegación móvil
  • Excelente tiempo de carga (promedio general de 223 milisegundos, fuente ATB)

  • Página multi-idioma (Castellano, Inglés, Catalan, Euskera, Gallego)

Ejemplos de potenciales de mejora que hemos detectado con Advanced SEO Toolbox (lista no exhaustiva)

Mejoras técnicas

Poco contenido en los niveles cerca de la página de inicio (1-3)

Según los datos de ATB, 92% de las URLs rastreadas están a más de 3 clics de la pagina de inicio. Un primer potencial de mejora sería reducir los niveles de profundidad.

Personalización incompleta del fichero robots.txt e inevitable fichero sitemap.xml

El fichero robots.txt que encontramos en la raíz del servidor (http://www.museoreinasofia.es/robots.txt) es el fichero base del CMS drupal. Este fichero podría personalizarse más con el objetivo de bloquear el crawl y la indexación de las páginas inútiles por SEO. Vemos que se ha bloqueado el rastreo de algunas secciones del sitio, pero, como vamos a ver después, este bloqueo es insuficiente.

#Propias de museo
Disallow: /system/
Disallow: /preparar-visita/
Disallow: /aviso-legal
Disallow: /accesibilidad
Disallow: /prensa/registro

Por otro lado, encontramos la instrucción:

Crawl-delay: 10

Esto significa que los robots de buscadores solo deben pedir una página al servidor cada 10 segundos. Lo cual significa que, o bien el servidor del Museo Nacional no puede asumir una carga superior a 1 petición cada 10 segundos (lo cual dudamos), o bien que se ha dejado esta instrucción por defecto.

Por último, encontramos el siguiente sitemap.xml (5 ficheros en total):

Sitemap: http://www.museoreinasofia.es/sitemap_index.xml

El sitemap para las páginas en español contiene 12.088 URLs. Cuando sabemos que el robot de Google rastrea dominios de varios millones de URLs, podemos cuestionar la utilidad de este fichero. O, por decirlo de otro modo, ¿un volumen tan pequeño de URLs necesita realmente un sitemap? Si echamos un vistazo al volumen de URLs indexadas en Google España (con la instrucción "site:http://www.museoreinasofia.es"), vemos 53.500 URLs en el índice. Aunque sería necesario hacer un matching detallado, podemos presumir que las 12.088 ya están en el índice desde hace tiempo.

 Resultados del buscador interno abiertos a los buscadores externos

Esto es algo que encontramos a menudo. Consiste en dejar abierto el buscador interno de la página a los robots de buscadores externos. ¿Porque no lo recomendamos?

  • Puede constituir un spider trap para algunos robots, pudiendo llegar a rastrear una multitud de combinaciones de búsquedas disponibles sin límites de profundidad
  • Impide el rastreo de las páginas útiles para SEO, en este caso 64% (46.458 URLs) de las páginas hasta el nivel 5 son resultados de búsqueda, mientras solo tenemos un 8% de obras (5.858 URLs) y un 7% de artistas (5.460 URLs)
  • Todas las páginas de resultados de búsqueda tienen un contenido muy parecido para Google, por lo que se posicionan mal (ver abajo)

Ausencia de atributo hreflang

En una página multi-idioma, se recomienda indicar la ruta de las URLs equivalentes en distintos idiomas gracias al atributo hreflang
Por ejemplo, <link rel="alternate" href="http://example.com/es-es" hreflang="es-es" />

Tiempos de conexión al servidor demasiado largos

El promedio de tiempo de conexión al servidor es de 4.985 milisegundos. El tiempo de conexión al servidor es lo que se necesita antes de recibir el primer octeto de la URL pedida. Entra en el tiempo de descarga total de las paginas e influye directamente en el crawl de los buscadores, y, por tanto, en la tasa de rebote de los usuarios. Habría que identificar los templates mas lentos del sitio para identificar la causa y encontrar una solución de mejora.

Mejoras de contenido

Volumen alto de duplicaciones de etiquetas SEO debido al buscador interno

Esto no es una sorpresa porque hemos visto antes que una mayoría de URLs son resultados de busqueda con etiquetas SEO duplicadas. Habría que ver si hay otras duplicaciones en otras secciones.

Las etiquetas TITLES de las obras incluyen los apellidos de artistas primero, despues los nombres y en fin los titulos de las obras
  

Por ejemplo: Picasso, Pablo (Pablo Ruiz Picasso) - Mujer en azul

Si el objetivo es posicionarse en los títulos de obras, se recomienda meterlos al principio. Por otro lado, los nombres de artistas siempre se buscan por usuarios con el nombre primero y el apellido segundo.

Los artistas son categorizados como autores

Quizas merecería afinar con subcategorías más descriptivas (pintores, escultores,...) para mejorar la relevancia de la documentación del Museo Reina Sofía.

Las etiquetas TITLES de las fichas de artistas incluyen las fechas de nacimiento y muerte

Esta información podría estar en el contenido de la página, mientras la etiqueta TITLE podría documentar otro tipo de información más relevante.

Las etiquetas TITLES de las exposiciones incluyen todos los nombres de artistas

El problema surge cuando hay varios artistas en una misma exposición, como por ejemplo:

Exposición - Formas biográficas  - Bourgeois, Louise, Brassaï (Gyula Halász), Clark, Lygia, Cornell, Joseph, Ernst, Max, Espaliú, Pepe, Guston, Philip, Hains, Raymond, Kippenberger, Martin, Klee, Paul, Mallo, Maruja (Ana María Gómez González), Pistoletto, Michelangelo, Richter, Gerhard, Rothko, Mark, VALIE EXPORT, Artaud, Antonin, Breton, André, Michals, Duane, Schwitters, Kurt, Braque, Georges, Evans, Walker  | Museo Nacional Centro de Arte Reina Sofía
Google recomienda 60 caracteres mientras en este ejemplo, tenemos 396...  

El nombre del museo esta incluido en todas las URLs profundas

Habría que evaluar si realmente sirve a los usuarios tener el nombre Museo Nacional Centro de Arte Reina Sofía en todas las etiquetas TITLES de las URLs visitadas. Al nivel SEO al menos, sabemos que no sirve de nada, incluso ni para el posicionamiento del nombre del museo.

Mejoras de enlaces internos   

Los textos ancla de los enlaces internos son poco relevantes

En la imagen abajo podemos ver textos de enlaces internos vacíos, en varios idiomas, o compuesto de código HTML. Los textos de los enlaces internos sirven para distribuir semántica dentro de la página. Si no son relevantes impiden a los buscadores dar un valor semántico a las páginas enlazadas. Se recomienda trabajar los textos de enlaces internos en base a una auditoría semántica.


   

Conversiones   

 Poca visibilidad del servicio de compra de entradas online

Esta parte tiene poco que ver con SEO, pero, sin embargo, es el aspecto más importante, ya que es lo que hacer venir a la gente al Museo. Es por tanto muy recomendable dar más visibilidad al servicio de compra de entradas. En el caso analizado, éste se sitúa actualmente en la parte de arriba del encabezamiento, lo que le hace totalmente invisible para alguien que tenga interés en una exposición, por lo que es posible que su atención se centre más en la foto y el texto destacado a la derecha que en la compra de entradas.

http://www.museoreinasofia.es/exposiciones/richard-hamilton

Por otro lado, una vez en la página de compra, se explica el proceso con un texto muy poco incitativo para la compra. Después de haber leído el texto, hay que pinchar otra vez en una navegación poca intuitiva para empezar el proceso de compra.

http://www.entradas.museoreinasofia.es/individual/principal.aspx

Conclusión

La página del Museo Nacional Centro de Arte Reina Sofía presenta una multitud de potenciales de mejora, teniendo en cuenta los KPIs SEO disponibles gracias a la herramienta Advanced SEO Toolbox. Hemos visto que por el momento:

  • Está poco optimizada en los buscadores para disfrutar, como institucion nacional, de un índice de confianza muy elevado (historial, enlaces externos).
  • La singularidad y la riqueza de sus contenidos le podría permitir en el corto plazo un ascenso muy rápido en los resultados de búsqueda de Google gracias a una auditoría semántica.
  • A medio y largo plazo la optimización técnica de la plataforma, la ampliación de los universos semánticos y la mejora del proceso de compra permitiría, no solo aumentar el tráfico sino también mejorar la conversión.