¿Cómo no indexa Google algunos sitios?

La indexación es la piedra angular de un buen SEO. Si su sitio o ciertas páginas de su sitio no están indexando, debe averiguar por qué.

1. Su sitio está indexado en un dominio www o no www

Técnicamente www es un subdominio. Por lo tanto, http://example.com no es lo mismo que http://www.example.com. Asegúrese de agregar ambos sitios a su cuenta de GWT para asegurarse de que ambos estén indexados. Asegúrese de configurar su dominio preferido, pero verifique la propiedad de ambos.

2. Google aún no ha encontrado su sitio

Esto suele ser un problema con los nuevos sitios. Espere unos días (al menos), pero si Google aún no ha indexado su sitio, asegúrese de que su mapa del sitio esté cargado y funcione correctamente. Si no ha creado o enviado un mapa del sitio, este podría ser su problema. También debe solicitar el rastreo de Google y buscar su sitio. Aquí están las instrucciones de Google sobre cómo hacerlo:

  • En la página de inicio de Herramientas para webmasters de Google, haga clic en el sitio que desee.
  • En el Panel, debajo de Rastrear, haga clic en Obtener como Google.
  • En el cuadro de texto, escriba la ruta a la página que desea verificar.
  • En la lista desplegable, seleccione Escritorio. (Puede seleccionar otro tipo de página, pero actualmente solo aceptamos envíos para nuestro índice de Búsqueda web).
  • Haz clic en Obtener. Google buscará la URL que solicitó. Puede tomar hasta 10 o 15 minutos para que se actualice el estado de recuperación.
  • Una vez que vea el estado Recuperar de “Correcto”, haga clic en Enviar al índice y luego haga clic en uno de los siguientes:
    • Para enviar la URL individual al índice de Google, seleccione URL y haga clic en Enviar. Puede enviar hasta 500 URL por semana de esta manera.
    • Para enviar la URL y todas las páginas vinculadas desde ella, haga clic en URL y todas las páginas vinculadas. Puede enviar hasta 10 de estas solicitudes por mes

3. El sitio o las páginas están bloqueados con robots.txt

Otro problema es que su desarrollador o editor ha bloqueado el sitio usando robots.txt. Esta es una solución fácil. Simplemente elimine la entrada del archivo robots.txt y su sitio volverá a aparecer en el índice.

4. No tienes un sitemap.xml

Cada sitio web debe tener un sitemap.xml, que es una lista simple de instrucciones que Google debe seguir para indexar su sitio. Puede leer sobre la política de Sitemap de Google y crear una con bastante facilidad.

Si tiene problemas de indexación en cualquier parte de su sitio, le recomiendo que revise y vuelva a enviar su sitemap.xml solo para asegurarse.

5. Tiene errores de rastreo

En algunos casos, Google no indexará algunas páginas en su sitio porque no puede rastrearlas. Aunque no puede rastrearlos, aún puede verlos.

Para identificar estos errores de rastreo, vaya a Herramientas para webmasters de Google → Seleccione su sitio, → Haga clic en “Rastrear” → Haga clic en “Errores de rastreo”. Si tiene algún error, es decir, páginas no indexadas, las verá en la lista de las “1000 páginas principales con errores”.

6. Tienes mucho contenido duplicado

Demasiado contenido duplicado en un sitio puede confundir a los motores de búsqueda y hacer que abandonen la indexación de su sitio. Si varias URL en su sitio devuelven exactamente el mismo contenido, entonces tiene un problema de contenido duplicado en su sitio. Para corregir este problema, elija la página que desea conservar y 301 el resto.

A veces tiene sentido canonizar las páginas, pero tenga cuidado. Algunos sitios han informado que un problema confuso de canonicalización ha impedido la indexación.

7. Ha activado su configuración de privacidad

Si tiene un sitio de WordPress, es posible que haya mantenido accidentalmente la configuración de privacidad activada. Vaya a Administrador → Configuración → Privacidad para verificar.

8. El sitio está bloqueado por .htaccess

Su archivo .htaccess es parte de la existencia de su sitio web en el servidor, lo que le permite estar disponible en la red mundial. El archivo .htaccess está escrito en Apache. Aunque .htacess es útil y útil, puede usarse para bloquear rastreadores y evitar la indexación.

9. El sitio tiene NOINDEX en la metaetiqueta

Otra forma de decir “no” a los robots, y por lo tanto no tener ninguna indexación, es tener metaetiquetas noindex. A menudo se ve así:

Este es uno de esos problemas en los que piensas: “¡Oh, dispara, no puedo creer que no haya visto eso!” Esto es lo que escribió Barry Schwartz al respecto en SEO Roundtable:

Diablos, lo veo todo el tiempo en los foros. He sido llamado por grandes compañías de Fortune 500 con problemas de SEO. He visto más de una vez, tienen una etiqueta noindex en su página de inicio que causa el problema. A veces son difíciles de detectar debido a los redireccionamientos, así que use una herramienta de verificación de encabezado http para verificar antes de los redireccionamientos. Pero no pase por alto lo obvio, verifique eso primero.

Elimine esta línea de código y volverá al índice en muy poco tiempo.

10. Tiene problemas con AJAX / JavaScript

Google indexa JavaScript y AJAX. Pero estos lenguajes no son tan fáciles de indexar como HTML. Entonces, si está configurando incorrectamente sus páginas AJAX y la ejecución de JavaScript, Google no indexará la página.

11. Su sitio tarda para siempre en cargar

A Google no le gusta si su sitio tarda una eternidad en cargarse. Si el rastreador encuentra tiempos de carga interminables, es probable que no indexe el sitio en absoluto.

12. Tienes tiempos de alojamiento

Si los rastreadores no pueden acceder a su sitio, no lo indexarán. Esto es bastante obvio, pero ¿por qué sucede? Verifica tu conectividad. Si su host tiene interrupciones frecuentes, puede ser que el sitio no se rastree. Es hora de ir de compras por un nuevo anfitrión.

13. Tienes Deinedexed

Este es realmente malo.

Si recibió un golpe manual y fue eliminado del índice, probablemente ya lo sepa. Si tiene un sitio con un historial sombrío (que no conoce) podría ser que una penalización manual al acecho impida la indexación.

Si su sitio ha caído del índice, tendrá que trabajar muy duro para recuperarlo.