Configurar Screaming Frog para comprobar una migración

screaming frog
Cuando llega el momento de encargarnos de llevar una migración, la rana se convierte en nuestra mejor amiga y, si aún no lo sabéis, vais a descubrir por qué.

Crawlear la web actual

En este paso debemos crawlear la web en bruto para sacar la máxima información posible, por ejemplo el número de páginas HTML, imágenes, CSS, JS, etc.

Configuration > Spider > Basic

Como en todos los crawleos, primero debemos pensar qué nos interesa rastrear. Si, por ejemplo, no existen páginas en flash (Check SWF), si no hay subdominios (Crawl All Subdomains), no hay páginas otros idiomas (Extract/Crawl hreflang) o no existen páginas en AMP (Extract/Crawl AMP Links), deberemos desmarcar ésas casillas:



Si estamos usando un CDN para servir imágenes o vídeos, desde la versión 11 de Screaming Frog, podemos incluirlos para que se analicen como URLs internas.

Configuration > Spider > Limits / Rendering

En la parte de Limits, por lo general, la configuración por defecto servirá para crawlear casi cualquier web. En la pestaña de Rendering, debemos elegir el tipo de crawleo en función de cómo esté hecha la web.

Seleccionando “Text Only” podremos analizar la mayoría de las webs, pero si la web está hecha en JavaScript (o queremos ver cómo se renderiza), será esta la opción que elijamos.

Configuration > Spider > Advanced

En este listado de opciones, es importante marcar “Always Follow Redirects” para detectar enlaces internos que actualmente redirigen y evitar aún más saltos después de migrar.

También es interesante marcar la casilla “Always Follow Canonicals”, ya que al terminar el crawleo, podremos ver si existen loops de canonical-redirección en el informe “Redirect & Canonical Chains”.

Y, como queremos un análisis en bruto, tenemos que dejar sin marcar las casillas Respect noindex, Respect Canonical y Respect Next/Prev:



Es importante que guardemos el crawleo para poder consultarlo más adelante, así como para exportar los documentos necesarios, como por ejemplo, “internall all” que usaremos en el siguiente paso.

Configuration > Spider > Preferences

En este caso, la configuración por defecto nos vale perfectamente para ver el estado de las metaetiquetas en cuanto a su longitud.

Comprobar el entorno pre

Lo normal es que los entornos de preproducción estén protegidos con usuario y contraseña para que los motores de búsqueda no puedan entrar. Para ello, Screaming tiene una opción en la que podemos incluir estos accesos y poder crawlear la web.

Una vez introducida la URL del pre en la barra superior de Screaming, entramos en la pestaña Configuration > Authentication para elegir la opción “Forms Based”. Haciendo clic en “Add”, nos llevará a un navegador interno donde deberemos añadir el usuario y la contraseña:



El resto de la configuración tiene que ser la misma que la usada en la web actual para poder hacer el mismo análisis del status de las URLs, metaetiquetas, etc.

Para asegurarnos de que las redirecciones se están llevando a cabo de manera correcta, podemos abrir el archivo de Excel “internal all” que nos hemos descargado en el paso anterior y sustituir el dominio de la web por el del pre. Una vez hecho esto, subimos las URLs en “modo lista” y vemos si está todo en orden.

En este paso, es necesario marcar la opción “Always Follow Redirects” para que siga las URLs hasta la final y comprobar si se dan en un solo salto.

Comprobar la nueva web

Cuando la nueva web ya se ha lanzado, volvemos a crawlearla en bruto para obtener la misma información con la que hemos contado desde el principio. Aquí podemos cruzar los datos de la web inicial con los del pre y con los actuales, para confirmar que todo ha salido según lo previsto, por ejemplo:

Las URLs redirigen en un solo salto

Las páginas que deben llevar noindex, contienen la etiqueta

Todas las versiones de la web redirigen a la canónica

Las metaetiquetas están optimizadas

Etc.
Otra comprobación que debemos hacer, es emular el rastreo que haría GoogleBot de la web por si se nos ha escapado algo durante los primeros análisis. Para ello, sólo hay que cambiar el User-Agent dentro de la configuración de Screaming Frog.

Es recomendable hacer 2 crawleos, con el User Agent mobile y el de desktop:



Con estos consejos básicos para configurar la rana ante una migración, ya podremos sacar bastante información y si queréis saber más sobre migraciones, podéis consultar estos 11 tips para una migración web sin sustos.

Fuente: este post proviene de Tecnicas SEO 2019, donde puedes consultar el contenido original.
¿Vulnera este post tus derechos? Pincha aquí.
Creado:
¿Qué te ha parecido esta idea?

Esta idea proviene de:

Y estas son sus últimas ideas publicadas:

La red social que llegaba en julio de este año para combatir a X, ha conseguido adaptarse a las políticas de privacidad europeas y ¡está por fin disponible en Europa!  Meta lanzaba su nueva plataform ...

Etiquetas:

Recomendamos

Relacionado

Actualidad Google Marketing ...

Cualquier persona relacionada con el sector digital, habrá vivido casi con seguridad, de forma directa o indirecta, la migración de una web, y sabe que puede ser algo bastante tedioso y que según cómo se enfoque, el resultado puede llegar a ser muy negativo de cara al negocio. En una migración, hay infinitos puntos a tener en cuenta, pero voy a centrarme en algunos que suelen pasarse por alto y es ...

Blog

Hoy quiero contarte una técnica de Linkbuilding sobre la que leí algo hace tiempo y que he podido probar con buenos resultados. Aunque la técnica no consiste en hacer un Linkbuilding directo, si que suele ocurrir que cuando un contenido es controvertido, recibe algunos enlaces de manera natural. Antes de nada avisar de que vas a necesitar Screaming Frog, que por si no lo sabes es gratuito hasta 50 ...

seo

El crawling o crawleo es un procedimiento que realizan los motores de búsqueda para encontrar y analizar el contenido de un sitio web a través de “saltos” en cada URL. Aquí es cuando también se añaden los términos de araña, Crawler o rastreadores, ya que el Bot se desplaza por los enlaces para abarcar todos los rincones de la web. En el caso del navegador más utilizado del mundo (Google), su crawl ...

Videos y tutoriales

ALT Attributes. ¿Qué es el atributo ALT? Si eres creador de contenido, seguro que en algún momento has oído hablar sobre el atributo ALT. Y, muy probablemente, te habrás preguntado qué es el atributo ALT y para qué sirve. Pues bien, hoy te traemos la respuesta. El atributo ALT es parte del estándar HTML. Se utiliza para especificar textos alternativos en las imágenes que se incluyen en páginas web ...

Videos y tutoriales

ALT Attributes. ¿Qué es el atributo ALT? Si eres creador de contenido, seguro que en algún momento has oído hablar sobre el atributo ALT. Y, muy probablemente, te habrás preguntado qué es el atributo ALT y para qué sirve. Pues bien, hoy te traemos la respuesta. El atributo ALT es parte del estándar HTML. Se utiliza para especificar textos alternativos en las imágenes que se incluyen en páginas web ...