Cómo solucionar problemas con recursos bloqueados de una web en Google Search Console



Suele ser frecuente que el creador de contenidos en Internet pueda tener algunos problemas para añadir correctamente la información de su sitio web en el índice de Google o de cualquier otro buscador.
A menudo se trata de simples avisos que no requieren una atención especial más allá de una sencilla corrección. Dichos avisos, no suelen plantear problemas graves para que Google pueda asimilar los contenidos de una web en su índice, pero siempre suscitan el interés de aquellos que tantas horas dedican a que sus contenidos tengan un buen nivel de presencia en Internet.
Veamos cómo tratar los mencionados avisos en nuestro sitio web con el informe de la Google Search Console (las herramientas para webmaster de Google) para recursos bloqueados.
¿Qué son los "recursos bloqueados" de una página web?

Un buscador en Internet, como por ejemplo Google, recopila enormes cantidades de información de sitios web para después poderla ofrecer a sus usuarios en los resultados de las búsquedas que éstos realizan.
Google lanza pequeños programas informáticos llamados "robots" (Googlebot) que recorren las páginas web y las analizan para entender cuál es su estructura, cómo se distribuye su contenido y qué información proporciona.
Este análisis de información de un sitio web se conoce como rastreo. Con dicha información rastreada, el buscador después "indexa" u ordena comprensiblemente la información extraída de cada sitio web en su propia "bases de datos" (índice) para después utilizarla para ofrecer los resultados de búsqueda a sus usuarios.
Durante el citado proceso de rastreo se pueden producir diversos problemas que Google reporta en forma de avisos a aquellos propietarios de sitios web que poseen su página dada de alta en la Google Search Console (Herramientas para Webmasters de Google).
Los avisos de errores de rastreo que Google proporciona contemplan desde la imposibilidad de acceder por completo a un sitio web hasta, por ejemplo, que un sitio web está inaccesible durante un tiempo por encontrarse caído o incluso si hay recursos (partes de un sitio web) que puedan estar bloqueadas por no pertenecer realmente a su contenido directo.
El recurso bloqueado suele ser siempre, alguna imagen, alguna hoja de estilos (CSS) ó código javascript que no pertenece al dominio en el cual Googlebot (el robot rastreador de Google) está intentando recopilar información.
Un ejemplo sencillo: Por ejemplo, una situación típica suele ser cuando desde un sitio se copia información de otro para exponerla en ese determinado sitio. En Diarios de la nube por ejemplo, hay veces que se hacen "reviews" de artículos tecnológicos, si copio las especificaciones técnicas desde la página del fabricante a mi página, aquellos datos que copio y pego desde su web a la mía, al encontrarse fuera de mi dominio (de www.diariosdelanube.com), Googlebot me avisa de que se encuentran bloqueados por pertenecer al dominio del fabricante.
¿Es grave tener recursos bloqueados en una página web?

Como norma general, no es en absoluto algo grave si no es algo que sea habitual en todo el sitio web. Es decir, si se da pocas veces y además es por razones justificadas, no da mayor problema.
Lo mejor es intentar tener la menor cantidad de recursos bloqueados posible pero sin obsesionarse con "dejar todo perfecto": es bueno "intentar tener las cosas bien".¿En qué ocasiones suele tenerse un recurso bloqueado?

Casi siempre se produce cuando utilizamos desde nuestra web algún recurso "protegido" de otra web (ver el ejemplo expuesto al final del párrafo "¿qué son los recursos bloqueados de unas página web?").
Otras veces suele producirse porque nuestro archivo robots.txt está bloqueando algún recurso en concreto sin que nos demos cuenta. El archivo robots.txt como se explica en la guía, "Qué es y cómo se utiliza el archivo Robots.txt", puede "proteger" de la lectura de Googlebot o de cualquier otro rastreador, recursos de un sitio web (la parte que se encuentra detrás del "login" o acceso a una web, páginas de archivo o históricos, etc...).¿Qué se puede hacer para solucionar el problema de los recursos bloqueados?

La regla general es que todos los recursos de nuestra web que deseamos que Google pueda utilizar para exponerla en sus búsquedas y para que ésta además se muestre correctamente, se encuentren en nuestro propio dominio y sin proteger (por ejemplo protegido por el robots.txt).
Para ello debemos siempre comprobar que nuestro propio archivo robots.txt no está bloqueando algún recurso.
Si vamos a utilizar recursos en nuestra web que no pertenecen a nuestro dominio, debemos pedirle permiso al propietario de la web de donde los vamos a utilizar para:
a). Pedirle que desbloquee esos recursos en su robots.txt para que nosotros podamos utilizarlos desde nuestro dominio (desde nuestra web www.nombre_de_nuestro_dominio.com). b). Después de solicitarle permiso al propietario del sitio web del que deseamos copiar los recursos, nos los traigamos y subamos a nuestro propio dominio (a nuestra web).Muchas veces, queremos utilizar recursos de otros sitios web que sus autores dan por sentado que se pueden reutilizar y no suele haber mayores problemas, pero como norma, siempre es necesario pedirle permiso al propietario para no infringir ninguna ley de propiedad intelectual.
¿Cómo puedo detectar si mi web contiene recursos bloqueados?

1) Es fundamental tener tu web dada de alta en la Google Search Console (las herramientas para webmaster de Google). Para conseguirlo de una manera sencilla, ejecuta esta guía paso a paso: Google Search Consolo, aprende a utilizar las Herramientas para Webmasters de Google.
Si es la primera vez que das de alta tu web en las herramientas para webmaster, después de haber ejecutado los pasos indicados en la guía, necesitarás un tiempo para que todo tu sitio web sea rastreado por completo. Podrás empezar con el paso 2) si ya llevas un tiempo utilizando la Google Search Console y tu web está ya plenamente rastreada.
2) Utilizando el informe de recursos bloqueados de la Google Search Console, las herramientas para webmaster de Google podrás ver qué recursos tienes bloqueados y porqué en tu web.


Accede al informe de recursos Bloqueados a través del menú de la izquierda, dando en la opción "Índice de Google" y después en "Recursos bloqueados".
En el ejemplo en pantalla se pueden apreciar dos recursos bloqueados. En la tabla se puede ver que ambos pertenecen a un Host (dominio o página web) que no es www.diariosdelanube.com.
Se hace referencia dentro de una página de www.diariosdelanube.com a dos recursos que pertenecen a otro dominio.3) Al hacer "clic" sobre cualquier recurso bloqueado de la tabla se accede al detalle del problema:

¿Cómo se puede solucionar el problema de los recursos bloqueados?, un ejemplo paso a paso:

Se observa en el detalle de los recursos bloqueados que se trata de tres imágenes ".png" que pertenecen a un dominio distinto de www.diariosdelanube.com

En la imagen de la izquierda se puede ver la página de www.diariosdelanube.com donde se realizó una review de un artículo técnico de otra web.

Para realizar la review, como es lógico, se copiaron y pegaron tres imágenes que pertenecen al sitio web que es propietario del aparato.
Gracias a las imágenes se puede realizar la review pero como se encuentran fuera de mi propio dominio, el archivo robots.txt de la web de origen los bloquea.
Hay dos opciones para solucionar el inconveniente:
a) Se le solicita al propietario de la web que desbloquee en su robots.txt el rastreo de esas imágenes para mi sitio web.
b) Lo más fácil es pedirle permiso al propietario de la web y subir las imágenes a mi propia web.
La opción b) es claramente la más sencilla, se le pide permiso al propietario de la web que posee las imágenes y, en lugar de copiar y pegar sus imágenes de su web a la mía directamente (que arrastra todas sus referencias a su sitio web), las subo una a una al mío.
Si copias y pegas directamente imágenes o recursos de otro sitio web, normalmente se "arrastrará" con la copia la referencia a la web de origen. Esto puede producir no sólo el problema del bloqueo de recursos, sino que además como se referencia directamente al sitio web propietario de las imágenes, si desde éste un día se deciden quitar o cambiar de sitio, dejarán de aparecer también en tu sitio web.
Solución: se pide permiso al webmaster de la web que posee las imágenes (o estilos CSS, o javascript) que se quieren utilizar en tu web y se suben directamente a la tuya.
¡Eso es todo!, por supuesto si tienes alguna duda estoy a tu disposición en los comentarios.

Fuente: este post proviene de Diarios de la nube, donde puedes consultar el contenido original.
¿Vulnera este post tus derechos? Pincha aquí.
Creado:
¿Qué te ha parecido esta idea?

Esta idea proviene de:

Y estas son sus últimas ideas publicadas:

Etiquetas: SEO

Recomendamos

Relacionado

Herramientas de Marketing Digital

Guía de Google Search Console En el mundo del marketing digital existen una gran cantidad de herramientas que nos ayudan a trabajar. Es habitual recibir publicidad constantemente, pero hay una herramienta que no necesita publicidad, y que puede marcar la diferencia entre lograr un buen posicionamiento o no. Se trata de Google Search Console, la gran herramienta de Google para los consultores SEOs. ...

Diccionario SEO

Hay muchas herramientas SEO en el mercado, tanto gratuitas como de pago que ayudan mucho en la labor diaria del posicionamiento de cualquier web, pero si hay una herramienta que es fundamental es Search Console, ofrecida por Google de forma totalmente gratuita. Para poder usar Search Console solo tienes que tener una cuenta de Google, por ejemplo la que uses para tu correo de Gmail, y acceder a ht ...

general seo

Los errores de rastreo en páginas web pueden detectarse y corregirse por medio de las herramientas para webmaster de Google. Es posible que a lo largo del período de vida de un sitio web, se produzcan diversas situaciones que impidan que éste pueda ser correctamente rastreado e indexado por el buscador. En esta guía vamos a aprender qué son los errores de rastreo que se producen en las páginas web ...

blog top seo

Search Console WordPress. En este artículo te he preparado una super guia para que integres y empieces a usar desde cero esta poderosa herramienta de Google con el gestor de contenidos más usado de mundo. ¿Listo? ¿Por qué usar la Consola de búsqueda? Primero déjame aclarar esto, la consola de búsqueda (Search Console) es una herramienta creada por Google para medir el rendimiento de cualquier siti ...

blog top seo noti google

Esta mañana Google ha anunciado que abandona la configuración de dominio preferido en la herramienta Search Console. Vamos a ver de qué se trata y cómo influye esto en nuestro trabajo cotidiano optimizando nuestros sitios. ¿Qué dice el comunicado oficial de Google? «A medida que avancemos en la migración a la nueva experiencia de Search Console, nos despediremos de una de nuestras configurac ...

blog de marketing noti google

Google está preparando todo para la indexación móvil primero que se hará efectiva en pocos día, más precisamente el primero de julio. Así lo anunció en un tweet esta mañana; el panel de Search Console ahora muestra estas características. ¡Vamos a verlas! Cada vez está más cerca el día en que la web cambiará para siempre centrándose en la indexación móvil. El famoso plugin Yoast SEO ya ha preparado ...

wordpress Linux noticia ...

Un Web crawler indexador web, indizador web o araña web es un programa informático que navega he inspecciona las páginas del World Wide Web (www) por Internet de una manera predeterminada, configurable y automática, realizando acciones programadas en el contenido crawler. Los motores de búsqueda como Google y Yahoo utilizan rastreadores como medio de proporcionar datos de búsqueda, es decir, est ...

Actualidad

Las funcionalidades de Search Console no dejan de evolucionar. Durante el mes de febrero, la herramienta de Google ha incluido la función “Propiedades de dominio”, que permite añadir propiedades aglutinando todas las versiones del site (http, https, con o sin www, subdominios, etc.). Antes de que existiera esta función, para poder tener una visión global de los datos de un dominio, de ...

general seo

La información duplicada en Internet es un problema que afecta a los buscadores web. Una misma información puede servirse desde múltiples direcciones distintas, discriminar cuál es la correcta no es una tarea que pueda dilucidar fácilmente un buscador. Los buscadores en Internet han dotado a los propietarios de sitios web (webmaster) de mecanismos que permiten informarles de cuál es la URL (la dir ...

general seo

En Internet pueden existir sitios web que enlacen al nuestro y afecten negativamente a nuestro posicionamiento. Unas veces por provenir de sitios de dudosa reputación u otras por ser directamente páginas generadoras de SPAM, el control periódico de los enlaces que apuntan a nuestro sitio web es importante. ¿Cómo enlaza un sitio web a otro en Internet? Es muy sencillo, desde una dirección externa a ...