微信客服
Telegram:guangsuan
电话联系:18928809533
发送邮件:xiuyuan2000@gmail.com

6 Razones Técnicas Por Las Que Las Páginas De Productos No Se Indexan|Excluyendo Contenido Duplicado Y Restricciones De Rastreo

本文作者:Don jiang

Las razones por las que una página no se indexa pueden estar ocultas en la arquitectura del código o la configuración del servidor.

Por ejemplo, cuando los rastreadores no pueden “entender” el contenido dinámico o un parámetro mal configurado hace que la página se considere duplicada.

Este artículo recopila 6 problemas técnicos prácticos, fácilmente pasados por alto, pero que afectan directamente la indexación, desde la perspectiva de la auditoría técnica.

6 causas técnicas por las que la página de producto no se indexa

Table of Contens

La velocidad de carga lenta bloquea el rastreo

Por ejemplo, si el tiempo de respuesta del servidor supera los 3 segundos, Googlebot puede abandonar el rastreo o indexar solo contenido incompleto.

Este problema suele pasarse por alto, ya que muchos administradores de sitios se enfocan únicamente en la experiencia del usuario (como si la animación de carga es visible), ignorando el “umbral de paciencia” de los rastreadores.

Tiempo de respuesta del servidor demasiado largo

Diagnóstico: Utiliza Google Search Console (Core Web Vitals) o herramientas como GTmetrix para comprobar el “Tiempo hasta el primer byte” (TTFB); si supera los 1,5 segundos, es necesario optimizarlo.

Soluciones:

  1. Actualizar la configuración del servidor (CPU/memoria) o cambiar a un proveedor de alojamiento de alto rendimiento (como Cloudways o SiteGround).
  2. Optimizar las consultas a la base de datos: reducir consultas complejas y añadir índices a las tablas de productos.
  3. Habilitar la caché del servidor (por ejemplo, Redis o Memcached) para reducir la generación dinámica de páginas.

Archivos de recursos no optimizados

Problemas comunes:

  • Imágenes de productos sin comprimir (por ejemplo, PNG no convertidas a WebP o resolución superior a 2000px).
  • CSS/JS no combinados, generando decenas de solicitudes HTTP.

Pasos para corregir:

  1. Comprimir imágenes con herramientas como Squoosh o TinyPNG y ajustar el tamaño para pantallas habituales (por ejemplo, 1200px de ancho).
  2. Combinar archivos CSS/JS mediante Webpack o Gulp para reducir la cantidad de solicitudes.
  3. Activar la compresión Gzip o Brotli para reducir el tamaño de transmisión de archivos.

Scripts que bloquean el renderizado

Desde la perspectiva de los rastreadores: Al analizar el HTML, si encuentran scripts que no cargan de forma asíncrona (por ejemplo, Google Analytics en carga síncrona), el rastreo se detendrá hasta que el script se haya ejecutado.

Soluciones de optimización:

  • Agregar el atributo async o defer en los scripts no esenciales (Ejemplo: ).
  • Retrasar la carga de herramientas de terceros (como chat en línea o mapas de calor) hasta después de la carga completa de la página.

Herramientas de diagnóstico y prioridades recomendadas

Lista de verificación:

  1. PageSpeed Insights: Para detectar problemas específicos en la carga de recursos (por ejemplo, “Reducir el tiempo de ejecución de JavaScript”).
  2. Screaming Frog: Para rastrear en masa el TTFB de las páginas de productos y localizar URL lentas.
  3. Lighthouse: Para ver las recomendaciones en la sección “Oportunidades” (como eliminar CSS no utilizado).

Prioridades de optimización urgentes: Primero soluciona las páginas con TTFB superior a 2 segundos, aquellas con más de 50 solicitudes HTTP o recursos de imagen que superen los 500KB.

Datos de referencia: Según Google, cuando el tiempo de carga de una página pasa de 1 a 3 segundos, la probabilidad de que el rastreo falle aumenta un 32%. Con estas optimizaciones, la mayoría de las páginas de productos pueden cargarse en menos de 2 segundos, mejorando significativamente la tasa de indexación.

Error en el archivo robots.txt que bloquea el directorio de productos

Por ejemplo, si por error escribes Disallow: /tmp/ como Disallow: /product/, los rastreadores omitirán completamente las páginas de productos, incluso si el contenido es de alta calidad.

Cómo detectar rápidamente bloqueos en robots.txt

Herramientas recomendadas:

  • Google Search Console: Ve a “Indexación” > “Páginas”; si las páginas de productos aparecen como “bloqueadas”, revisa los detalles para ver el bloqueo en robots.txt.
  • Herramientas online de prueba de robots.txt: Usa la herramienta de prueba de robots.txt para simular la vista del rastreador sobre la URL.

Errores típicos:

  1. Errores de escritura en la ruta (por ejemplo, /produc/ en lugar de /product/).
  2. Uso excesivo de comodines * (por ejemplo, Disallow: /*.jpg$ bloquea todas las imágenes de productos).

Cómo corregir las reglas erróneas en robots.txt

Principios para una escritura correcta

  • Coincidencia precisa de rutas: Evita bloqueos imprecisos. Por ejemplo, para bloquear un directorio temporal, usa Disallow: /old-product/ en lugar de Disallow: /product/.
  • Distinguir el tipo de rastreador: Si solo deseas bloquear bots no deseados, debes especificar el User-agent (Ejemplo: User-agent: MJ12bot).

Gestión de parámetros

  • Permite los parámetros necesarios (por ejemplo, paginación ?page=2), pero bloquea únicamente los parámetros específicos como Disallow: *?sort=.
  • Usa el símbolo $ para indicar el final de un parámetro (Ejemplo: Disallow: /*?print=true$).

Proceso de recuperación de emergencia y verificación

Ejemplo de pasos

  1. Edita el archivo robots.txt y comenta o elimina las líneas erróneas (Ejemplo: # Disallow: /product/).
  2. Envía la solicitud de actualización del archivo robots.txt mediante Google Search Console.
  3. Usa la herramienta “Inspección de URL” para probar manualmente el acceso a las páginas de productos.
  4. Revisa el estado de indexación después de 24 horas. Si no se recupera, envía manualmente el sitemap de productos.

Medidas de protección

  • Utiliza herramientas de control de versiones (como Git) para registrar los cambios en el archivo robots.txt, facilitando la reversión si es necesario.
  • Prueba los cambios en un entorno de prueba antes de aplicarlos en producción.

Análisis de un caso real

Configuración errónea

User-agent: *

Disallow: /

Allow: /product/

Problema: Disallow: / bloquea todo el sitio, lo que hace que la regla Allow no tenga efecto.

Corrección adecuada

User-agent: *

Disallow: /admin/

Disallow: /tmp/

Allow: /product/

Lógica: Solo se bloquean los directorios de administración y temporales, permitiendo el acceso a las páginas de productos.

Páginas de productos sin enlaces internos efectivos

Si una página de producto no cuenta con enlaces internos (como menú de navegación, productos recomendados o enlaces contextuales), se convierte en una “isla aislada”, lo que dificulta su indexación, incluso si tiene buen contenido.

Esto es común en productos nuevos, páginas de promociones especiales o páginas importadas en masa mediante herramientas externas, que no siempre se integran correctamente en la estructura de navegación del sitio.

Falta de estructura de navegación o diseño inadecuado

Problemas comunes

  • Las páginas de productos no están integradas en el menú principal ni en las categorías (solo accesibles mediante resultados de búsqueda).
  • En dispositivos móviles, los menús desplegables esconden los enlaces clave de productos en submenús profundos.

Soluciones

Herramienta de autoevaluación: Usa Screaming Frog para rastrear el sitio completo y detectar páginas de productos con “número de enlaces entrantes ≤ 1”.

Pasos de optimización

  1. Añade accesos directos a páginas de productos importantes en el menú principal, como “Novedades Populares” o “Categorías Destacadas”.
  2. Asegúrate de que cada página de producto esté incluida al menos en una categoría (Ejemplo: /category/shoes/product-A).

Uso ineficiente de módulos de recomendación

Desde la perspectiva de los motores de búsqueda: Si los módulos como “Te podría gustar” se cargan mediante JavaScript, los bots podrían no ser capaces de rastrear esos enlaces.

Proporcionar una entrada estática para el contenido recomendado de forma dinámica, por ejemplo, mostrando un espacio fijo con el “Top 10 de los más vendidos de la semana” y enlaces directos a las páginas de los productos.

La navegación de migas de pan no cubre niveles clave

Ejemplo incorrecto: La ruta de las migas de pan es demasiado corta y no enlaza a la página de categoría (por ejemplo: Inicio > Producto A).

Solución:

  1. Completar todos los niveles de categoría (ejemplo: Inicio > Zapatillas deportivas > Zapatillas para correr > Producto A) y asegurarse de que cada nivel tenga un enlace clicable.
  2. Configurar en el CMS la generación automática de las migas de pan para que coincidan con la estructura de las URLs (por ejemplo: /categoria1/categoria2/nombre-del-producto).

Falta de enlaces con texto ancla en las páginas de contenido

Insertar enlaces de productos relacionados de forma natural en la descripción del producto (ejemplo: “Esta cámara es compatible con el trípode X“).

Agregar en la sección de comentarios de usuarios sugerencias como “Los usuarios que compraron este producto también vieron”.

Estrategia de emergencia

Plan temporal:

  • Crear una página de recopilación “Novedades” que agrupe los productos no indexados, y añadir su enlace en el pie de página de la página de inicio.
  • Insertar enlaces a las páginas de productos objetivo en páginas de alta autoridad (por ejemplo, artículos de blog como “Lectura recomendada: Ranking de las mejores zapatillas para correr 2024“).

Plan de mantenimiento a largo plazo:

  • Monitorear semanalmente el estado de indexación de las páginas de productos (herramientas recomendadas: Ahrefs Site Audit) y corregir los problemas de enlaces internos a tiempo.

Pérdida de contenido por renderizado dinámico con JavaScript

Por ejemplo, páginas de productos desarrolladas con Vue o React donde la información clave (como SKU o especificaciones) se carga de forma asíncrona mediante API, lo que puede impedir que los motores de búsqueda accedan a dichos contenidos debido a problemas de tiempo de carga.

Resultado: la página indexada solo muestra el mensaje “Cargando”, lo que afecta negativamente su posicionamiento.

Cómo detectar la pérdida de contenido por renderizado dinámico

Herramientas de autoevaluación:

  1. Prueba de compatibilidad móvil de Google: Introduce la URL del producto y verifica si la captura de pantalla del HTML renderizado muestra el contenido clave (precio, botón de compra, etc.).
  2. Simulación de rastreo con comando curl: Ejecuta el comando en la terminal curl -A "Googlebot" URL y compara el HTML devuelto con el código fuente visualizado en las herramientas de desarrollo del navegador.

Indicadores comunes:

  • El código fuente no contiene descripciones de productos, comentarios u otros textos clave, solo etiquetas vacías como

    .

  • En Google Search Console, el informe de cobertura muestra “Rastreada pero no indexada” con el motivo “Página vacía”.

Soluciones: Renderizado en el servidor (SSR) y pre-renderizado

Ventajas del SSR: El servidor genera y entrega una página HTML completa, asegurando que los motores de búsqueda puedan rastrear el contenido correctamente.

Frameworks recomendados: Next.js (React), Nuxt.js (Vue), Angular Universal.

Ejemplo de código (Ruta de la página de producto con Next.js):

export async function getServerSideProps(context) {
const product = await fetchAPI(`/product/${context.params.id}`);
return { props: { product } };

Solución alternativa de pre-renderizado: Para los sitios que no pueden adaptarse a SSR, utiliza Prerender.io o Rendertron para generar instantáneas estáticas.

Pasos de configuración:

  1. Configura un middleware en el servidor para identificar solicitudes de rastreadores y redirigirlas al servicio de pre-renderizado.
  2. Almacena en caché los resultados del renderizado para reducir el coste de generación repetida.

Optimización del momento de carga de contenido dinámico

Lógica clave: Inserta directamente la información clave del producto (título, precio, especificaciones) en el HTML inicial en lugar de cargarla de forma asíncrona mediante JavaScript.

Ejemplo incorrecto:

// Obtener el precio de forma asíncrona (los rastreadores pueden no esperar)
fetch('/api/price').then(data => {
document.getElementById('price').innerHTML = data.price;
});

Solución correcta:

<!-- Mostrar el precio directamente en el HTML inicial -->

$99.99

Controlar el tiempo de ejecución de JavaScript y el tamaño de los recursos

Umbral de tolerancia de los rastreadores: Googlebot espera hasta aproximadamente 5 segundos para ejecutar JavaScript y renderizar la página.

Medidas de optimización:

División de código (Code Splitting): Cargar solo el JavaScript necesario en la página de producto (por ejemplo, eliminar módulos no esenciales como galerías o sliders).

// Carga dinámica de módulos no esenciales (como el reproductor de video del producto)
import('video-player').then(module => {
module.loadPlayer();
});

Carga diferida de recursos que no aparecen en la primera vista: Ejecutar módulos como comentarios o productos recomendados después del evento DOMContentLoaded.

Problemas de páginas duplicadas causadas por parámetros de URL desordenados

Por ejemplo, un mismo producto puede tener diferentes URLs dependiendo del orden de los parámetros, como:
/product?color=red&size=10 y /product?size=10&color=red. Esto puede hacer que los rastreadores los consideren páginas diferentes, lo cual dispersa la autoridad SEO e incluso puede generar penalizaciones por contenido duplicado.

Detectar el impacto de los parámetros de URL en la duplicación de páginas

Herramientas de autoinspección:

  1. Google Search Console: En el informe de “Cobertura”, filtra las URLs “Enviadas pero no indexadas” y analiza el porcentaje de URLs afectadas por parámetros duplicados.
  2. Screaming Frog: Configura la opción “Ignorar parámetros” y rastrea todo el sitio para contar cuántas variantes de URL existen para una misma página de producto.

Escenarios típicos de problemas:

  • Un mismo producto genera múltiples URLs debido a filtros (por ejemplo, orden por precio o filtro por color).
  • No utilizar la etiqueta rel="canonical" en las páginas paginadas, haciendo que se consideren páginas independientes.

Normalización de parámetros y consolidación de la autoridad SEO

Prioridad de las soluciones:

Fijar el orden de los parámetros: Aplicar reglas estrictas para ordenar los parámetros (por ejemplo, color → tamaño → orden) y evitar URLs duplicadas.

  • Ejemplo: Forzar que todas las URLs sigan el formato /product?color=red&size=10 y redirigir (301) todas las demás variantes a la URL canónica.

Uso de la etiqueta Canonical: Agregar la etiqueta canonical en el encabezado de las páginas con parámetros para señalar la URL principal del producto.

Bloquear parámetros sin importancia

Utiliza meta robots noindex o el archivo robots.txt para evitar la indexación de parámetros de seguimiento (por ejemplo: ?session_id=xxx).

Técnicas de gestión de parámetros del lado del servidor

Reglas de reescritura de URL:

Ejemplo en Apache (ocultar parámetros de paginación y normalizar la URL):


RewriteCond %{QUERY_STRING} ^page=([2-9]|10)$
RewriteRule ^product/?$ /product?page=%1 [R=301,L]

Ejemplo en Nginx (unificar parámetros de ordenación):


if ($args ~* "sort=price") {
rewrite ^/product /product?sort=price permanent;
}

Control de parámetros dinámicos:

  • Predefinir una lista de parámetros permitidos en el CMS y rechazar las solicitudes con parámetros no autorizados (retornar error 404 o redirigir a la página principal).

Estrategias SEO para páginas de paginación y filtrado

Páginas de paginación:

  1. Agregar las etiquetas rel="prev" y rel="next" para indicar la relación entre páginas a los motores de búsqueda.
  2. Para las páginas que no sean la primera (por ejemplo: page=2 y siguientes), configurar noindex para que solo la primera página sea indexada.

Páginas de filtros:

Si no hay productos que coincidan con los filtros (por ejemplo: /product?color=purple sin stock disponible), devolver un error 404 o redirigir al usuario a una categoría relacionada.

Falta de etiquetas HTML estándar

Por ejemplo, si una página no incluye la etiqueta H1, los motores de búsqueda podrían considerarla como una página “sin tema claro”. Además, sin datos estructurados (Schema Markup), información importante como el precio o la disponibilidad del producto no se mostrará correctamente en los resultados de búsqueda.


<link rel="canonical" href="https://example.com/product" />

Falta o duplicación del encabezado H1

Detección del problema:

  • Usa las herramientas de desarrollo del navegador para inspeccionar elementos y verificar si la página del producto tiene un único

    con palabras clave.

  • Errores comunes: múltiples etiquetas H1 (por ejemplo, una para el nombre del producto y otra para la marca) o un contenido de H1 irrelevante (como “Bienvenido a nuestra tienda”).

Solución:

  • Asegúrate de que cada página de producto tenga solo un H1, que incluya el modelo del producto y su propuesta de valor principal (ejemplo:

    Zapatillas Serie X | Amortiguación y transpirabilidad, nuevo modelo 2024

    ).

  • Está prohibido reemplazar el texto del H1 con una imagen (los motores de búsqueda no pueden leer texto en imágenes); si es necesario usar una imagen, agrega el atributo aria-label.

Meta descripción no optimizada

Impacto: Si la meta descripción está incompleta o falta, los motores de búsqueda mostrarán un fragmento aleatorio de texto de la página, lo cual reduce la tasa de clics.

Pasos para optimizar:

  1. Debe tener entre 150 y 160 caracteres, incluyendo las palabras clave principales del producto y un llamado a la acción (ejemplo: ).
  2. Configura reglas automáticas en el CMS para generar descripciones tomando los campos de beneficios del producto, evitando dejarlo vacío.

Ignorar datos estructurados Schema

Necesidad para SEO: El marcado Schema permite a los motores de búsqueda comprender claramente detalles como precio, valoraciones y stock del producto, mejorando la apariencia en los resultados.

Método de implementación:
Usa el Generador de Schema Markup para crear un código JSON-LD del tipo “Product” e insértalo dentro de la etiqueta :

<script type="application/ld+json">
{
"@context": "https://schema.org/",
"@type": "Product",
"name": "Zapatillas Serie X",
"image": "https://example.com/shoe.jpg",
"offers": {
"@type": "Offer",
"price": "99.99",
"priceCurrency": "USD",
"availability": "https://schema.org/InStock"
}
}
script>
  • Herramienta de validación: Usa la Herramienta de Prueba de Datos Estructurados de Google para verificar que el marcado funcione correctamente.

Imágenes sin texto alternativo (Alt)

Importancia para SEO: El texto alternativo ayuda a los motores de búsqueda a comprender el contenido de la imagen y mejora la accesibilidad.

Errores comunes:

  • Dejar el atributo alt vacío () o abusar de palabras clave (alt="Zapatillas deportivas running amortiguación 2024").

Forma correcta:

  • Describe el contenido de la imagen y su contexto de uso (ejemplo: alt="Foto real de las Zapatillas Serie X en color negro, mostrando la suela con amortiguación").
  • Para imágenes decorativas, usa alt="" para evitar ruido innecesario.

Etiqueta Canonical incorrecta

Riesgo: Si la etiqueta canonical apunta por error a la página principal o a la categoría en lugar de la página del producto, la autoridad SEO se distribuye incorrectamente.

Verificación y solución:

  • Usa Screaming Frog para rastrear las páginas de productos y detectar aquellas con etiquetas canonical incorrectas o externas.
  • Formato correcto: (debe apuntar a la versión canónica de la página actual).

Elige una página de producto que no haya sido indexada durante mucho tiempo y revisa esta lista punto por punto; normalmente podrás identificar los problemas principales en menos de 30 minutos.

滚动至顶部