Saltar al contenido

Analizar la indexación en Google

12 enero, 2019
Analizar la indexación en Google

En un momento en que Google está indexando todo y todo (JavaScript, activación de formularios, etc.), puede parecerle ridículo hablar de indexación. Sin embargo, a veces es necesario volver a lo básico, por ejemplo, leyendo el libro “réussir son référencement web” o dando un paso atrás en la disciplina de la referenciación natural que es tan simple y al mismo tiempo tan compleja….

“Volver a lo básico”, por tanto, con elementos que me parecen poco conocidos sobre el análisis de la indexación de su contenido en Google y, sobre todo, las lecciones que se pueden extraer de estos análisis.

 

Cómo medir la indexación en Google: el comando “site:” y sus límites

Tradicionalmente, la indexación de su contenido en Google se mide utilizando el comando “site:monsite.com” de Google. Esta consulta devuelve todas las páginas indexadas en su dominio por el motor de búsqueda, pero también, y especialmente, el número de páginas que el motor asocia con su nombre de dominio. Aquí para el ejemplo de la página web NEGOCIOVIVO(una famosa agencia de SEO parece…) Google devuelve 1 120 resultados por lo que 1 120 páginas indexadas.

Sí, pero aquí está la cosa… La representatividad de este indicador es relativa ya que un rastreo del sitio con una herramienta de terceros le dará alrededor de 500 páginas HTLM de contenido indexable.

Esta falta de relevancia de la cifra dada por Google a la realidad podría explicarse por varios factores (de hecho son suposiciones más personales, por lo que si tienes más información sobre el tema, te invito a compartirlas en comentarios).

Duplicación de contenido interno: el resultado devuelto por Google devolvería todas las URL y las diferentes formas de URL encontradas para el mismo o similar contenido (filtros de navegación, paginación, URL de seguimiento…), todos ellos factores que explican por qué Google encuentra un gran número de URL indexables en su sitio pero que no reflejan la disponibilidad y el volumen de contenido cualitativo en su sitio.

La historia del sitio: también parece que la vida del sitio tiene un impacto significativo en esta indicación. Por ejemplo, un sitio web de comercio electrónico que actualiza con frecuencia los productos durante un período determinado (temporadas: verano, invierno) y que luego se retira de la venta tendría un número de urls indexadas con este pedido muy por encima de la realidad. (Por lo tanto, Google proporcionaría una serie de urls indexadas históricamente en un dominio que mantendría en caché).

En el ejemplo de NegocioVivo, el número de urls encontradas por Google corresponde al 45% de la realidad, en el caso de un sitio de comercio electrónico con movimientos significativos en la disponibilidad de productos que varían según las colecciones, este indicador cae al 5%.

En resumen, este comando te da todo y cualquier cosa… Los resultados devueltos son también muy variables en el tiempo dependiendo de los buenos deseos del motor sin información sobre cómo se calcula esta cifra.

Evitar los límites del comando “site:” en Google, el comando “site:*”.

No muy conocido, el comando “site:*” sólo devuelve resultados de búsqueda considerados relevantes por Google. Así, para NegocioVivo este orden devuelve 315 resultados en lugar de 1.120 con el comando “site:”. Nótese que nos hemos acercado a la cifra de 500 url indexables ya que esta cifra de 315 representa el 63% del número de páginas indexables encontradas con un crawler externo.

Por lo tanto, tenemos aquí un indicador potencial para analizar la relevancia del contenido producido, que podría llamarse “tasa de relevancia”, “tasa de calidad”, “tasa de indexación” que podría constituir un KPI SEO en muchos contextos…. Este indicador de rendimiento no tiene un nombre estándar a priori….

Por cierto, me gustaría señalar a todos los trolls que puedan comentar el valor de este indicador para que las agencias SEO sigan su camino y vuelvan a cazar duendes, ya que este no es el tema del debate y este valor es explicable y perfectamente normal en este contexto. Su comentario será pura y simplemente moderado y yo invocaré a los espíritus malignos del bosque para perseguirlo como castigo. ]

Los límites del comando “site:*” para el análisis de indexación en Google

Por lo tanto, el comando “site:*” es útil para medir el grado de relevancia del contenido indexado, pero esto plantea ciertos problemas….

  • La primera es que la construcción del indicador de la tasa de pertinencia requiere la actualización de una variable: el volumen de contenido presentado. Para ello, será rápidamente doloroso realizar un rastreo periódico del sitio con una herramienta de terceros (Screaming Frog Seo Spider, Xenu, XML Sitemap Tools……..) para recuperar este valor.
  • La segunda es que el comando “site:*” se limita muy rápidamente cuando se intenta medir la relevancia sobre contenidos específicos: plantilla de ficha de producto, indexación sobre una sección específica del sitio con el comando site:* inurl:[parámetro] con el parámetro que permite identificar una sección específica o tipo de contenido.

Profundice en el análisis de indexación con las herramientas para webmasters de Google y los sitemaps XML

Por lo tanto, existe una solución alternativa para superar este problema: utilizar mapas de sitio XML y análisis de indexación en las Herramientas para webmasters de Google.

  • La primera ventaja del mapa de sitio XML es que puede ser generado dinámicamente por el CMS y se actualizará automáticamente. La ventaja es también que la mayoría de los CMS que generan sitemaps dinámicos sólo ofrecerán urls relevantes (independientemente de los problemas de duplicación de contenido que puedan ocurrir con los urls dinámicos).
  • La segunda ventaja es que es posible maquetar estos sitemaps XML para tener una visión de la tasa de relevancia de cada tipo de contenido de su sitio (ficha de producto, categoría, por ejemplo para un sitio de comercio electrónico).

Por ejemplo, si envío a través de un mapa de sitio temático de 470 url, Google Webmaster Tools me dice “445 url en el índice web”. Esta cifra corresponde al número de url que Google considera relevante, es decir, un coeficiente de relevancia del 95%.

Y ahora, ¿cómo analizo la indexación de mi sitio web en Google y la relevancia de mi contenido?

Ahora puede divertirse creando mapas de sitio temáticos y darse cuenta de que la vida no siempre es tan color de rosa con proporciones que llegan a cero defectos. Aún así, será necesario trabajar en su contenido y en su referenciación natural. 🙂

Varios factores pueden explicar las bajas proporciones, desafortunadamente las Herramientas para webmasters de Google no le darán la respuesta, o incluso los detalles de las páginas “irrelevantes”. Usted necesitará considerar las siguientes suposiciones para organizar su capacidad de progreso.

Densidad de contenido demasiado baja: Las páginas con un volumen bajo de contenido textual pueden filtrar las páginas que se consideran “irrelevantes”.

Duplicación interna: El volumen de contenido no lo es todo. Es posible que si diferentes páginas con un volumen de contenido tienen una alta tasa de similitud (por ejemplo, contenido generado dinámicamente), las páginas se pueden encontrar en este filtro.

Popularidad demasiado baja: A diferencia de las páginas con poco contenido, las páginas con poco contenido pueden evitar este filtro si son populares (valoradas en la malla de enlaces internos y externos).

Anterioridad/paternidad/duplicación externa del contenido: la sindicación de contenidos se ha convertido en algo habitual en la web y este factor mal controlado puede convertirse rápidamente en un problema para su referenciación natural. Por ejemplo, los sitios de comercio electrónico que distribuyen ampliamente su contenido (descripción del producto) en sitios de comparación de precios pueden ser reconocidos por la “autoría” del contenido. Esto es posible gracias al criterio del estado de la técnica (el primero que se indiza es el primero que se sirve), a la popularidad de los sitios comerciales, que a menudo es inferior a la de los comparadores, o al uso masivo de las mismas descripciones (de los proveedores). En los casos mencionados, el crédito (relevancia) del contenido se asigna a sus competidores. Usted se dará cuenta rápidamente del problema cuando analice la indexación de su sitio web……

NEGOCIO VIVO – seo en malaga Empresa de paginas web en malagaRedes sociales

Llámanos