Lección 4 de 21Módulo 2: Tecnologías Core (Lecciones 4-6)

04. Fundamentos de Machine Learning

Comprende los tipos de aprendizaje automático y cuándo usar cada uno en aplicaciones de negocio

15 minutos

🎯 Objetivos de Aprendizaje

Al completar esta lección, serás capaz de:

  • Comprender la diferencia entre aprendizaje supervisado y no supervisado
  • Distinguir entre clasificación y regresión y sus casos de uso
  • Identificar cuándo usar clustering para segmentación
  • Reconocer aplicaciones de aprendizaje por refuerzo
  • Aplicar el tipo correcto de ML según tu problema de negocio

Tiempo estimado: 15 minutos Nivel: Principiante Prerequisitos: Lecciones 1, 2 y 3


🚀 Introducción

Escenario real: Tienes presupuesto aprobado para tu primer proyecto de IA. El proveedor te pregunta: "¿Necesitas clasificación o regresión? ¿Supervisado o no supervisado?"

Si estos términos te confunden, no estás solo. Machine Learning es el paraguas que contiene múltiples tipos de aprendizaje, cada uno apropiado para diferentes problemas de negocio.

En esta lección aprenderás:

  • Qué tipo de ML usar según tu problema
  • Ejemplos concretos de cada tipo
  • Cómo tomar decisiones informadas

📚 ¿Qué es Machine Learning?

Definición Simple

Machine Learning es la capacidad de las máquinas de aprender patrones de datos históricos y usar esos patrones para hacer predicciones sobre datos nuevos, sin ser programadas explícitamente para cada escenario.

La Analogía del Niño que Aprende Frutas

Programación tradicional:

SI (color == "rojo" Y forma == "redonda" Y tamaño == "mediano")
    ENTONCES es_manzana = TRUE
SI (color == "amarillo" Y forma == "alargada")
    ENTONCES es_banana = TRUE

Problema: ¿Qué pasa con manzanas verdes? ¿Bananas medio verdes? Necesitas reglas para cada variación posible.

Machine Learning:

1. Muestras al niño 1,000 fotos de manzanas (de todos los colores y tamaños)
2. Muestras 1,000 fotos de bananas
3. El niño identifica patrones comunes por sí mismo
4. Ahora puede reconocer manzanas y bananas que nunca ha visto

Proceso Simplificado de ML

┌──────────────┐      ┌──────────────┐      ┌──────────────┐
│ 1. DATOS     │  →   │ 2. ALGORITMO │  →   │ 3. MODELO    │
│ HISTÓRICOS   │      │ DE ML        │      │ ENTRENADO    │
│              │      │ (aprende)    │      │ (predice)    │
└──────────────┘      └──────────────┘      └──────────────┘
   Ejemplos              Encuentra              Hace
   del pasado            patrones            predicciones

Ejemplo Concreto - Predicción de Churn

# PASO 1: Datos históricos (lo que ya pasó)
Cliente ID | Edad | Compras | Último acceso | Churn (abandonó)
---------- | ---- | ------- | ------------- | ----------------
001        | 28   | 15      | 2 días        | NO
002        | 45   | 3       | 90 días       | SÍ
003        | 32   | 22      | 1 día         | NO
004        | 51   | 5       | 120 días      | SÍ
...        | ...  | ...     | ...           | ...
(10,000 clientes)

# PASO 2: Algoritmo aprende patrones
Patrón detectado: Clientes con >60 días sin acceso + <8 compras → 85% abandona

# PASO 3: Predicción en clientes nuevos
Cliente 10001 | 29 | 6 | 75 días | → Predicción: 78% probabilidad CHURN
Acción: Enviar campaña de retención automáticamente

📊 Tipos de Machine Learning

1. Aprendizaje Supervisado

Concepto: El algoritmo aprende de ejemplos etiquetados (con la "respuesta correcta" ya conocida).

Analogía: Es como estudiar para un examen con un libro de ejercicios que tiene las respuestas al final. Practicas con problemas resueltos hasta que aprendes el patrón.

Dos Sub-tipos Principales

A. Clasificación (Predecir Categorías)

¿Qué pregunta responde? SÍ/NO o ¿A qué grupo pertenece?

Estructura de datos:

Tienes: [Características] → [Etiqueta/Categoría]
Predices: Nueva categoría basada en características

Ejemplos por Industria:

Pregunta de Negocio Categorías Posibles Aplicación
¿Este email es spam? Spam / No Spam Filtros de Gmail
¿El cliente comprará? Comprará / No comprará Lead scoring
¿Esta transacción es fraude? Fraude / Legítima Bancos
¿Qué tipo de cliente es? Premium / Regular / En riesgo Segmentación
¿Este producto tiene defecto? Defectuoso / OK Control de calidad

Caso Real - Spotify (Clasificación)

Problema: Identificar canciones "skip" (que usuarios saltarán)

Datos de entrenamiento:

  • 100 millones de canciones reproducidas
  • Etiqueta: "Skip" vs "Escuchada completa"
  • Variables: Tempo, género, hora del día, historial usuario

Algoritmo: Random Forest Classifier

Resultado del modelo:

  • Predicción 89% precisa de qué canciones serán saltadas
  • Acción: NO recomendar esas canciones en playlists
  • Impacto: +24% en tiempo de escucha, +15% retención usuarios

Implementación en negocio:

# Pseudocódigo conceptual
for cada_cancion in playlist:
    probabilidad_skip = modelo.predecir(cancion)

    if probabilidad_skip > 0.7:
        # Alta probabilidad de skip
        no_recomendar()
    else:
        # Baja probabilidad de skip
        incluir_en_recomendaciones()

B. Regresión (Predecir Valores Numéricos)

¿Qué pregunta responde? ¿CUÁNTO? o ¿CUÁNTOS?

Estructura de datos:

Tienes: [Características] → [Valor numérico]
Predices: Número continuo basado en características

Ejemplos por Industria:

Pregunta de Negocio Valor a Predecir Aplicación
¿Cuánto venderé? $50,000 - $200,000 Forecasting ventas
¿Cuántos clientes llegarán? 100 - 500 personas Staffing tiendas
¿Cuál será el precio óptimo? $19.99 - $49.99 Dynamic pricing
¿Cuánto gastará este cliente? $0 - $5,000 Lifetime value
¿En cuántos días se entregará? 1 - 15 días Estimación logística

Caso Real - Airbnb (Regresión)

Problema: Ayudar a hosts a fijar precio óptimo

Datos de entrenamiento:

  • 7 millones de listings históricos
  • Variable objetivo: Precio por noche
  • Variables predictoras:
    • Ubicación (coordenadas GPS)
    • Tamaño (habitaciones, baños)
    • Amenities (wifi, cocina, AC)
    • Temporada (alta/baja)
    • Reviews (calificación promedio)
    • Demanda local (ocupación zona)

Algoritmo: Gradient Boosting Regressor

Proceso de predicción:

Input: Listing nuevo
- Ubicación: Manhattan, NY
- 2 habitaciones, 1 baño
- Wifi, cocina, sin AC
- Temporada: Verano (alta demanda)
- Sin reviews aún

Modelo analiza:
1. Precios de 500 listings similares en zona
2. Ajusta por amenities específicos
3. Factor de temporada (+25% verano)
4. Descuento por sin reviews (-15%)

Output: Precio sugerido $189/noche
Rango de confianza: $165 - $215

Resultado:

  • Predicción de precio óptimo con 92% precisión
  • Hosts que usan el precio sugerido: +8% en reservas
  • Impacto anual: +$300M en revenue para la plataforma

Ejemplo Detallado - Predicción de Ventas

Dataset de entrenamiento:

Mes       | Inversión Ads | Temporada | Promo  | Ventas (objetivo)
--------- | ------------- | --------- | ------ | -----------------
Enero     | $10,000       | Baja      | No     | $120,000
Febrero   | $15,000       | Baja      | Sí     | $180,000
Marzo     | $12,000       | Media     | No     | $150,000
Abril     | $20,000       | Alta      | Sí     | $280,000
Mayo      | $18,000       | Alta      | No     | $240,000
...       | ...           | ...       | ...    | ...

Modelo aprende relación matemática:

Ventas ≈ (Ads × 8.5) + (Temporada_Alta × 50,000) + (Promo × 30,000) + 50,000

Donde:
- Cada $1 en ads genera $8.5 en ventas
- Temporada alta agrega $50K base
- Promoción agrega $30K extra
- $50K es baseline

Predicción para próximo mes:

Input:
- Ads planificados: $18,000
- Temporada: Alta
- Promoción: Sí

Cálculo:
Ventas = ($18,000 × 8.5) + ($50,000) + ($30,000) + $50,000
Ventas = $153,000 + $50,000 + $30,000 + $50,000
Ventas = $283,000

Predicción: $283,000 (± $15,000)

🔄 Clasificación vs Regresión: ¿Cuál Usar?

Tabla de Decisión Rápida

Si tu pregunta es... Tipo de ML Ejemplo
"¿Sí o No?" Clasificación ¿Comprará? Sí/No
"¿A qué categoría?" Clasificación Cliente: Premium/Regular/Básico
"¿Cuánto?" Regresión ¿Cuánto gastará? $150
"¿Cuántos?" Regresión ¿Cuántos visitantes? 245
"¿Qué probabilidad?" Clasificación Probabilidad de churn: 78%
"¿En cuánto tiempo?" Regresión Tiempo de entrega: 3.5 días

Ejemplos Lado a Lado

Problema: Gestión de inventario

Enfoque Clasificación:

Pregunta: ¿Este producto se agotará esta semana?
Respuesta: Sí / No
Acción: Si "Sí" → Re-ordenar inmediatamente

Enfoque Regresión:

Pregunta: ¿Cuántas unidades venderemos esta semana?
Respuesta: 127 unidades
Acción: Ordenar cantidad específica basada en predicción

¿Cuál usar? Depende de tu proceso:

  • Si solo necesitas alerta binaria → Clasificación
  • Si necesitas planificar cantidad exacta → Regresión

🎲 2. Aprendizaje No Supervisado

Concepto: El algoritmo encuentra patrones en datos sin etiquetas (sin respuestas correctas pre-definidas). Busca estructura oculta.

Analogía: Es como organizar tu clóset sin instrucciones. Naturalmente agruparás: ropa formal, casual, deportiva, etc. El algoritmo hace lo mismo con datos.

A. Clustering (Agrupamiento)

¿Qué hace? Agrupa datos similares automáticamente sin decirle cuántos grupos hay.

Caso Real - Netflix (Clustering de Usuarios)

Problema: 200 millones de usuarios, imposible personalizar manualmente

Algoritmo aplicado: K-Means Clustering

Proceso:

Input: Historial de visualización de todos los usuarios
- Usuario A: Drama 80%, Comedia 15%, Acción 5%
- Usuario B: Acción 70%, Sci-Fi 20%, Drama 10%
- Usuario C: Drama 75%, Romance 20%, Comedia 5%
...

Algoritmo descubre grupos naturales (sin decirle cuántos)

Output - 8 clusters identificados:

Clusters descubiertos:

┌──────────────────────────────────────────────┐
│ Cluster 1: "Fans de Drama" (15% usuarios)    │
│ Características:                              │
│ - Ven: Dramas, películas emocionales         │
│ - Tiempo de visionado: Alto (15h/semana)     │
│ - Preferencia: Contenido con subtítulos      │
│ Acción: Recomendar series dramáticas nuevas  │
├──────────────────────────────────────────────┤
│ Cluster 2: "Bingers de Acción" (22% usuarios)│
│ Características:                              │
│ - Ven: Series de acción, maratones          │
│ - Comportamiento: 5+ episodios seguidos      │
│ - Hora: Principalmente noches y fines de semana│
│ Acción: Recomendar siguiente temporada       │
├──────────────────────────────────────────────┤
│ Cluster 3: "Familias con niños" (12%)        │
│ Características:                              │
│ - Ven: Contenido infantil + familiar         │
│ - Múltiples perfiles en cuenta              │
│ - Horario: Tardes y temprano en noche       │
│ Acción: Recomendar contenido todo público   │
└──────────────────────────────────────────────┘

Resultado:

  • Recomendaciones personalizadas por cluster
  • +35% en engagement
  • -18% en churn rate
  • Sistema se auto-ajusta cuando usuarios cambian de cluster

Caso Práctico - E-commerce

Situación: Tienes 50,000 clientes sin categorizar

ANTES (sin ML):

- Todos reciben mismos emails
- Mismas ofertas para todos
- Tasa de conversión: 1.2%

PROCESO DE CLUSTERING:

# Datos de cada cliente
- Total comprado históricamente
- Frecuencia de compra
- Categorías preferidas
- Sensibilidad al precio (% compras con descuento)
- Engagement (abre emails, clicks)

# Algoritmo K-Means descubre 4 clusters naturales

DESPUÉS (con Clustering):

Cluster 1: "Cazadores de gangas" (18,000 usuarios)

Características identificadas:
- Solo compran con 40%+ descuento
- Comparan precios en múltiples sitios
- Abandonan carrito si no hay cupón

Estrategia personalizada:
- Emails con ofertas flash
- Cupones limitados en tiempo
- "Solo por hoy: 50% OFF"

Conversión: 3.8% (vs 1.2% antes)

Cluster 2: "Compradores premium" (8,000 usuarios)

Características identificadas:
- Compran productos de alta gama
- No les importa precio
- Valoran exclusividad y calidad

Estrategia personalizada:
- Emails con lanzamientos exclusivos
- Early access a nuevos productos
- "Colección exclusiva para miembros VIP"

Conversión: 8.2%

Cluster 3: "Ocasionales curiosos" (15,000 usuarios)

Características identificadas:
- Navegan mucho, compran poco
- Alta tasa de abandono de carrito
- Sensibles a shipping costs

Estrategia personalizada:
- Retargeting con productos que vieron
- 20% descuento + envío gratis
- Recordatorios de carrito abandonado

Conversión: 2.1%

Cluster 4: "Leales frecuentes" (9,000 usuarios)

Características identificadas:
- Compran cada 2-3 semanas
- Ticket promedio medio
- Alta satisfacción (reviews positivos)

Estrategia personalizada:
- Programa de lealtad
- Envío gratis en todas las compras
- "Gracias por tu preferencia"

Conversión: 12.5%

RESULTADO TOTAL:

  • Conversión promedio: 1.2% → 6.1%
  • ROI de campañas: +408%
  • Satisfacción del cliente: +25%

B. Detección de Anomalías

¿Qué hace? Encuentra valores atípicos o comportamientos inusuales.

Caso Real - Mastercard (Detección de Fraude)

Problema: Detectar transacciones fraudulentas en tiempo real

Dataset: 50 billones de transacciones anuales

Algoritmo: Isolation Forest (detecta anomalías)

Patrón normal aprendido automáticamente:

Para Usuario ID 12345:
- Compra típicamente en ciudad de residencia (Madrid)
- Monto promedio: $50-$200
- Comercios habituales: Supermercado, gasolinera, restaurantes
- Horario: 8am-10pm
- Frecuencia: 3-5 transacciones/día

Transacción anómala detectada:

┌──────────────────────────────────────────┐
│ 🚨 ALERTA: Anomalía detectada            │
│ Usuario ID: 12345                        │
│                                          │
│ Transacción actual:                      │
│ - Ubicación: Bangkok, Tailandia         │
│   (nunca antes registrado)               │
│ - Monto: $3,500 (15x promedio)           │
│ - Tipo: Electrónica (nunca comprado)    │
│ - Hora: 3:42 AM                          │
│ - Desviación del patrón normal: 96/100   │
│                                          │
│ ACCIÓN AUTOMÁTICA:                       │
│ ✓ Bloquear transacción                  │
│ ✓ Enviar SMS verificación a usuario     │
│ ✓ Notificar equipo anti-fraude          │
└──────────────────────────────────────────┘

Resultado:

  • 97% de fraudes detectados en tiempo real
  • $12 billones ahorrados en fraudes (2023)
  • Falsos positivos reducidos: 15% → 2%
  • Tiempo de detección: <100 milisegundos

Por qué es No Supervisado:

  • No requiere etiquetar transacciones como "fraude" manualmente
  • Aprende qué es "normal" para cada usuario
  • Detecta fraudes nunca vistos antes
  • Se adapta a nuevos patrones de fraude automáticamente

3. Aprendizaje por Refuerzo

Concepto: El algoritmo aprende por ensayo y error, recibiendo recompensas por acciones correctas y penalizaciones por errores.

Analogía: Como entrenar a un perro. No le explicas la teoría de "sentarse", le das un premio cada vez que lo hace bien.

Proceso de Aprendizaje por Refuerzo

┌─────────┐    Acción    ┌─────────────┐    Recompensa/   ┌─────────┐
│ AGENTE  │──────────────>│  AMBIENTE   │──────Castigo────>│ AGENTE  │
│   IA    │              │   (mundo)   │                  │ aprende │
└─────────┘   <──────────└─────────────┘                  └─────────┘
              Observa                                     Mejora
              nuevo                                       estrategia
              estado

Caso Real - Google DeepMind: Data Centers

Problema: Data centers de Google consumen electricidad equivalente a 200,000 hogares

Solución: RL para optimizar enfriamiento

Agente de RL:

Observa:
- Temperatura de 5,000 servers
- Clima exterior (temperatura, humedad)
- Carga computacional (workload)
- Estado de ventiladores y bombas

Acciones posibles:
- Ajustar velocidad de ventiladores (0-100%)
- Controlar bombas de agua fría (ON/OFF)
- Ajustar temperatura objetivo (18-24°C)
- Distribuir carga entre zonas

Recompensa:
+ Puntos: Mantener temperatura óptima (22°C)
+ Puntos: Usar menos energía
- Puntos: Si temperatura muy alta (riesgo)
- Puntos: Si energía desperdiciada

Entrenamiento:

Fase 1: Simulación (2 semanas)
- Simula 1 año de operación
- Prueba millones de configuraciones
- Aprende sin riesgo real

Fase 2: Piloto controlado (1 mes)
- Opera con supervisión humana
- Humano puede intervenir
- Ajusta estrategia con datos reales

Fase 3: Autónomo (ongoing)
- Opera independientemente
- Mejora continuamente
- Humano monitorea métricas

Estrategias aprendidas (que humanos nunca imaginaron):

  • Pre-enfriar antes de picos predecibles
  • Distribuir carga para optimizar zonas naturalmente frías
  • Ajustes micro-continuos vs cambios grandes

Resultado:

  • -40% en energía para enfriamiento
  • -15% en consumo eléctrico total
  • Ahorro: $120 millones anuales
  • Reducción CO2: Equivalente a sacar 100,000 autos de circulación

Limitación Importante

⚠️ RL no es común en negocios típicos porque:

  • Más complejo de implementar que supervisado/no supervisado
  • Requiere simulación o ambiente controlado
  • No puedes "experimentar" con clientes reales
  • Riesgo de estrategias inesperadas

Mejor para:

  • Gaming
  • Robótica
  • Optimización de sistemas complejos
  • Trading algorítmico (con restricciones)

Para mayoría de negocios:

  • Usa Supervisado (si tienes respuestas correctas)
  • Usa No Supervisado (si buscas patrones)
  • Deja RL para casos muy específicos

🎯 Tabla de Decisión: ¿Qué Tipo de ML Usar?

Tu Situación Tipo de ML Subtipo Ejemplo
Tengo datos con "respuestas correctas" y quiero predecir categorías Supervisado Clasificación Lead scoring: ¿Comprará? Sí/No
Tengo datos con "respuestas correctas" y quiero predecir números Supervisado Regresión Precio óptimo: $X
Tengo datos SIN etiquetas y quiero encontrar grupos No Supervisado Clustering Segmentación de clientes
Quiero encontrar comportamientos raros No Supervisado Anomalías Detección de fraude
Tengo un sistema que puede experimentar Refuerzo RL Optimización de procesos

🎯 Puntos Clave para Recordar

  • Supervisado = Tienes datos con respuestas correctas → Predices en nuevos datos

    • Clasificación = Predice categorías (Sí/No, A/B/C)
    • Regresión = Predice números (¿Cuánto? ¿Cuántos?)
  • No Supervisado = Solo tienes datos sin etiquetas → Encuentras patrones ocultos

    • Clustering = Agrupa similares automáticamente
    • Anomalías = Detecta lo que es "raro"
  • Refuerzo = Sistema que aprende experimentando → Optimiza decisiones secuenciales

💡 Regla práctica: 90% de casos de negocio usan Supervisado (clasificación o regresión). Empieza ahí.


🔜 Próximo Módulo

Has completado el Módulo 1: Fundamentos de IA para Negocios

En el Módulo 2: Deep Learning e IA Generativa, aprenderás:

  • Qué hace especial al Deep Learning
  • Cómo funcionan las redes neuronales
  • GPT-4, Claude y la revolución generativa
  • Cuándo usar DL vs ML tradicional

Última actualización: Octubre 25, 2025 Duración: 15 minutos Nivel: ⭐⚪⚪⚪⚪ (Principiante)

¿Completaste esta lección?

Marca esta lección como completada. Tu progreso se guardará en tu navegador.