Lección 4 de 30Fundamentos de SEO Técnico

Cómo Google descubre e indexa tu sitio

Entiende crawling, indexación y ranking para optimizar tu sitio.

12 minutos

Antes de optimizar tu sitio para SEO, necesitas entender exactamente cómo Google encuentra, procesa y clasifica tu contenido. Sin este conocimiento, estarás haciendo cambios a ciegas.

El viaje de tu página: De invisible a resultado #1

Cada página web pasa por tres etapas fundamentales antes de aparecer en los resultados de búsqueda:

Crawling → Indexación → Ranking
(Descubrir)  (Procesar)   (Clasificar)

Piensa en Google como una biblioteca gigantesca:

  • Crawling: Los bibliotecarios salen a buscar libros nuevos
  • Indexación: Clasifican cada libro por tema, autor y contenido
  • Ranking: Deciden qué libro recomendar cuando alguien pregunta por un tema

Veamos cada etapa en detalle.


Etapa 1: Crawling (Rastreo)

¿Qué es el crawling?

El crawling es el proceso donde los "robots" de Google (llamados Googlebots o crawlers) visitan páginas web para descubrir contenido nuevo o actualizado.

Cómo funciona el proceso

  1. Google mantiene una lista de URLs conocidas
  2. El Googlebot visita cada URL y descarga el contenido
  3. Extrae todos los enlaces de esa página
  4. Agrega enlaces nuevos a la lista para rastrear después
  5. Repite el proceso continuamente

El presupuesto de rastreo (Crawl Budget)

Google no puede rastrear todo internet todo el tiempo. Cada sitio tiene un crawl budget—la cantidad de páginas que Googlebot rastreará en un período dado.

Factores que afectan tu crawl budget:

Factor Impacto
Velocidad del servidor Servidores rápidos = más páginas rastreadas
Errores del sitio Muchos errores 404/500 = menos rastreo
Páginas duplicadas Desperdician presupuesto
Contenido de baja calidad Google reduce prioridad

Cómo ayudar al crawling

Lo que debes hacer:

  • Crear un sitemap XML actualizado
  • Usar enlaces internos claros
  • Mantener servidor rápido y estable
  • Actualizar contenido regularmente

Lo que debes evitar:

  • Páginas huérfanas (sin enlaces entrantes)
  • Cadenas de redirecciones largas
  • Bloquear recursos importantes en robots.txt
  • URLs con parámetros infinitos

El archivo robots.txt

Este archivo le dice a Google qué puede y qué no puede rastrear:

# Ejemplo de robots.txt
User-agent: *
Allow: /
Disallow: /admin/
Disallow: /carrito/
Disallow: /checkout/

Sitemap: https://tudominio.com/sitemap.xml

Importante: robots.txt controla el rastreo, no la indexación. Una página bloqueada en robots.txt puede aparecer en Google si otros sitios enlazan a ella.


Etapa 2: Indexación

¿Qué es la indexación?

Una vez que Googlebot rastrea una página, pasa al proceso de indexación donde:

  1. Analiza el contenido (texto, imágenes, videos)
  2. Entiende de qué trata la página
  3. Almacena información en su base de datos (el "índice")

El proceso de análisis

Google examina múltiples señales para entender tu página:

Señales de contenido:

  • Título de la página (title tag)
  • Encabezados (H1, H2, H3...)
  • Texto del cuerpo
  • Texto alternativo de imágenes
  • Datos estructurados (Schema markup)

Señales técnicas:

  • URL de la página
  • Enlaces internos y externos
  • Velocidad de carga
  • Compatibilidad móvil

Renderizado: JavaScript y contenido dinámico

Google tiene dos fases de indexación:

  1. Primera ola: Rastrea e indexa HTML inicial
  2. Segunda ola: Renderiza JavaScript y procesa contenido dinámico
Solicitud → HTML inicial → Primera indexación
                ↓
         Cola de renderizado
                ↓
         JavaScript ejecutado → Segunda indexación

Por qué esto importa:

Si tu contenido principal depende de JavaScript, Google podría no indexarlo inmediatamente o indexarlo parcialmente.

Cómo verificar la indexación

En Google Search Console:

  1. Ve a "Inspección de URL"
  2. Ingresa la URL de tu página
  3. Revisa el estado de indexación

Estados posibles:

Estado Significado Acción
URL está en Google Indexada correctamente Ninguna
URL no está en Google No indexada Solicitar indexación
URL indexada, no enviada en sitemap Indexada pero falta en sitemap Actualizar sitemap

Problemas comunes de indexación

1. Contenido duplicado

tudominio.com/producto
tudominio.com/producto/
tudominio.com/producto?ref=123

Solución: Usar etiquetas canonical

2. Páginas con poco contenido Google puede decidir no indexar páginas con contenido "thin" (delgado).

3. Bloqueo por meta robots

<!-- Esta página no se indexará -->
<meta name="robots" content="noindex">

Etapa 3: Ranking (Posicionamiento)

¿Qué es el ranking?

El ranking es el proceso donde Google decide en qué posición mostrar cada página para una búsqueda específica.

Factores principales de ranking

Google usa más de 200 factores de ranking, pero los más importantes son:

1. Relevancia del contenido

  • ¿La página responde a la búsqueda del usuario?
  • ¿El contenido es completo y útil?

2. Autoridad del sitio

  • ¿Otros sitios de calidad enlazan a este contenido?
  • ¿El sitio tiene historial de contenido confiable?

3. Experiencia de usuario

  • ¿La página carga rápido?
  • ¿Es fácil de navegar en móvil?
  • ¿Los usuarios encuentran lo que buscan?

4. Frescura del contenido

  • ¿El contenido está actualizado?
  • ¿Se actualiza regularmente?

El concepto de "intención de búsqueda"

Google intenta entender qué quiere lograr el usuario:

Tipo de intención Ejemplo Lo que Google muestra
Informativa "qué es SEO" Artículos educativos, definiciones
Navegacional "Google Analytics login" Página oficial de inicio de sesión
Transaccional "comprar hosting web" Páginas de producto, comparativas
Local "restaurante italiano cerca" Google Maps, negocios locales

Clave: Tu página debe coincidir con la intención de búsqueda. Un artículo informativo no posicionará para búsquedas transaccionales.


Cómo la IA está cambiando este proceso

Google y el Machine Learning

Google usa IA en múltiples partes del proceso:

RankBrain (desde 2015)

  • Entiende búsquedas que nunca ha visto
  • Conecta conceptos relacionados
  • Mejora con cada búsqueda

BERT (desde 2019)

  • Entiende el contexto de las palabras
  • Procesa búsquedas en lenguaje natural
  • Mejor comprensión de preguntas complejas

MUM (desde 2021)

  • Multimodal (texto, imágenes, video)
  • Multilingüe (traduce conocimiento entre idiomas)
  • Responde preguntas complejas que requieren múltiples pasos

Implicaciones para tu SEO

  1. El contenido de calidad importa más que nunca

    • Google entiende mejor el significado, no solo palabras clave
  2. La experiencia de usuario es crucial

    • Google puede medir si los usuarios están satisfechos
  3. El contexto importa

    • No basta repetir palabras clave; el contenido debe ser completo

Ejercicio práctico

Audita el estado de tu sitio en Google

  1. Ve a Google Search Console (o créate una cuenta)

  2. Revisa el reporte de cobertura:

    • ¿Cuántas páginas están indexadas?
    • ¿Hay páginas excluidas? ¿Por qué?
  3. Inspecciona 3-5 páginas importantes:

    • ¿Están indexadas?
    • ¿Google las renderiza correctamente?
  4. Revisa tu archivo robots.txt:

    • ¿Estás bloqueando algo importante?
    • ¿Incluye tu sitemap?
  5. Documenta tus hallazgos:

Página Indexada Problemas encontrados
Homepage Sí/No
Página de producto Sí/No
Blog post Sí/No

Puntos clave de esta lección

  • Crawling es cómo Google descubre tus páginas mediante robots que siguen enlaces
  • Indexación es cómo Google procesa y almacena el contenido de tus páginas
  • Ranking es cómo Google decide qué posición darte para cada búsqueda
  • El crawl budget es limitado—optimiza tu sitio para aprovecharlo
  • Google usa IA para entender mejor el contenido y la intención del usuario
  • Google Search Console es tu herramienta principal para monitorear estos procesos

Próxima lección

Ahora que entiendes cómo Google procesa tu sitio, en la siguiente lección aprenderás sobre Core Web Vitals—las métricas de velocidad y experiencia que Google usa como factores de ranking.


Quiz de comprensión

  1. ¿Cuál es la diferencia entre crawling e indexación?
  2. ¿Qué es el crawl budget y por qué importa?
  3. ¿Por qué una página podría estar rastreada pero no indexada?
  4. ¿Cómo afecta la IA de Google la forma en que debes crear contenido?

¿Completaste esta lección?

Marca esta lección como completada. Tu progreso se guardará en tu navegador.