04. Fundamentos de Machine Learning

🎯 Objetivos de Aprendizaje

Al completar esta lección, serás capaz de:

Comprender la diferencia entre aprendizaje supervisado y no supervisado
Distinguir entre clasificación y regresión y sus casos de uso
Identificar cuándo usar clustering para segmentación
Reconocer aplicaciones de aprendizaje por refuerzo
Aplicar el tipo correcto de ML según tu problema de negocio

Tiempo estimado: 15 minutos Nivel: Principiante Prerequisitos: Lecciones 1, 2 y 3

🚀 Introducción

Escenario real: Tienes presupuesto aprobado para tu primer proyecto de IA. El proveedor te pregunta: "¿Necesitas clasificación o regresión? ¿Supervisado o no supervisado?"

Si estos términos te confunden, no estás solo. Machine Learning es el paraguas que contiene múltiples tipos de aprendizaje, cada uno apropiado para diferentes problemas de negocio.

En esta lección aprenderás:

Qué tipo de ML usar según tu problema
Ejemplos concretos de cada tipo
Cómo tomar decisiones informadas

📚 ¿Qué es Machine Learning?

Definición Simple

Machine Learning es la capacidad de las máquinas de aprender patrones de datos históricos y usar esos patrones para hacer predicciones sobre datos nuevos, sin ser programadas explícitamente para cada escenario.

La Analogía del Niño que Aprende Frutas

Programación tradicional:

SI (color == "rojo" Y forma == "redonda" Y tamaño == "mediano")
    ENTONCES es_manzana = TRUE
SI (color == "amarillo" Y forma == "alargada")
    ENTONCES es_banana = TRUE

Problema: ¿Qué pasa con manzanas verdes? ¿Bananas medio verdes? Necesitas reglas para cada variación posible.

Machine Learning:

1. Muestras al niño 1,000 fotos de manzanas (de todos los colores y tamaños)
2. Muestras 1,000 fotos de bananas
3. El niño identifica patrones comunes por sí mismo
4. Ahora puede reconocer manzanas y bananas que nunca ha visto

Proceso Simplificado de ML

┌──────────────┐      ┌──────────────┐      ┌──────────────┐
│ 1. DATOS     │  →   │ 2. ALGORITMO │  →   │ 3. MODELO    │
│ HISTÓRICOS   │      │ DE ML        │      │ ENTRENADO    │
│              │      │ (aprende)    │      │ (predice)    │
└──────────────┘      └──────────────┘      └──────────────┘
   Ejemplos              Encuentra              Hace
   del pasado            patrones            predicciones

Ejemplo Concreto - Predicción de Churn

# PASO 1: Datos históricos (lo que ya pasó)
Cliente ID | Edad | Compras | Último acceso | Churn (abandonó)
---------- | ---- | ------- | ------------- | ----------------
001        | 28   | 15      | 2 días        | NO
002        | 45   | 3       | 90 días       | SÍ
003        | 32   | 22      | 1 día         | NO
004        | 51   | 5       | 120 días      | SÍ
...        | ...  | ...     | ...           | ...
(10,000 clientes)

# PASO 2: Algoritmo aprende patrones
Patrón detectado: Clientes con >60 días sin acceso + <8 compras → 85% abandona

# PASO 3: Predicción en clientes nuevos
Cliente 10001 | 29 | 6 | 75 días | → Predicción: 78% probabilidad CHURN
Acción: Enviar campaña de retención automáticamente

📊 Tipos de Machine Learning

1. Aprendizaje Supervisado

Concepto: El algoritmo aprende de ejemplos etiquetados (con la "respuesta correcta" ya conocida).

Analogía: Es como estudiar para un examen con un libro de ejercicios que tiene las respuestas al final. Practicas con problemas resueltos hasta que aprendes el patrón.

Dos Sub-tipos Principales

A. Clasificación (Predecir Categorías)

¿Qué pregunta responde? SÍ/NO o ¿A qué grupo pertenece?

Estructura de datos:

Tienes: [Características] → [Etiqueta/Categoría]
Predices: Nueva categoría basada en características

Ejemplos por Industria:

Pregunta de Negocio	Categorías Posibles	Aplicación
¿Este email es spam?	Spam / No Spam	Filtros de Gmail
¿El cliente comprará?	Comprará / No comprará	Lead scoring
¿Esta transacción es fraude?	Fraude / Legítima	Bancos
¿Qué tipo de cliente es?	Premium / Regular / En riesgo	Segmentación
¿Este producto tiene defecto?	Defectuoso / OK	Control de calidad

Caso Real - Spotify (Clasificación)

Problema: Identificar canciones "skip" (que usuarios saltarán)

Datos de entrenamiento:

100 millones de canciones reproducidas
Etiqueta: "Skip" vs "Escuchada completa"
Variables: Tempo, género, hora del día, historial usuario

Algoritmo: Random Forest Classifier

Resultado del modelo:

Predicción 89% precisa de qué canciones serán saltadas
Acción: NO recomendar esas canciones en playlists
Impacto: +24% en tiempo de escucha, +15% retención usuarios

Implementación en negocio:

# Pseudocódigo conceptual
for cada_cancion in playlist:
    probabilidad_skip = modelo.predecir(cancion)

    if probabilidad_skip > 0.7:
        # Alta probabilidad de skip
        no_recomendar()
    else:
        # Baja probabilidad de skip
        incluir_en_recomendaciones()

B. Regresión (Predecir Valores Numéricos)

¿Qué pregunta responde? ¿CUÁNTO? o ¿CUÁNTOS?

Estructura de datos:

Tienes: [Características] → [Valor numérico]
Predices: Número continuo basado en características

Ejemplos por Industria:

Pregunta de Negocio	Valor a Predecir	Aplicación
¿Cuánto venderé?	$50,000 - $200,000	Forecasting ventas
¿Cuántos clientes llegarán?	100 - 500 personas	Staffing tiendas
¿Cuál será el precio óptimo?	$19.99 - $49.99	Dynamic pricing
¿Cuánto gastará este cliente?	$0 - $5,000	Lifetime value
¿En cuántos días se entregará?	1 - 15 días	Estimación logística

Caso Real - Airbnb (Regresión)

Problema: Ayudar a hosts a fijar precio óptimo

Datos de entrenamiento:

7 millones de listings históricos
Variable objetivo: Precio por noche
Variables predictoras:
- Ubicación (coordenadas GPS)
- Tamaño (habitaciones, baños)
- Amenities (wifi, cocina, AC)
- Temporada (alta/baja)
- Reviews (calificación promedio)
- Demanda local (ocupación zona)

Algoritmo: Gradient Boosting Regressor

Proceso de predicción:

Input: Listing nuevo
- Ubicación: Manhattan, NY
- 2 habitaciones, 1 baño
- Wifi, cocina, sin AC
- Temporada: Verano (alta demanda)
- Sin reviews aún

Modelo analiza:
1. Precios de 500 listings similares en zona
2. Ajusta por amenities específicos
3. Factor de temporada (+25% verano)
4. Descuento por sin reviews (-15%)

Output: Precio sugerido $189/noche
Rango de confianza: $165 - $215

Resultado:

Predicción de precio óptimo con 92% precisión
Hosts que usan el precio sugerido: +8% en reservas
Impacto anual: +$300M en revenue para la plataforma

Ejemplo Detallado - Predicción de Ventas

Dataset de entrenamiento:

Mes       | Inversión Ads | Temporada | Promo  | Ventas (objetivo)
--------- | ------------- | --------- | ------ | -----------------
Enero     | $10,000       | Baja      | No     | $120,000
Febrero   | $15,000       | Baja      | Sí     | $180,000
Marzo     | $12,000       | Media     | No     | $150,000
Abril     | $20,000       | Alta      | Sí     | $280,000
Mayo      | $18,000       | Alta      | No     | $240,000
...       | ...           | ...       | ...    | ...

Modelo aprende relación matemática:

Ventas ≈ (Ads × 8.5) + (Temporada_Alta × 50,000) + (Promo × 30,000) + 50,000

Donde:
- Cada $1 en ads genera $8.5 en ventas
- Temporada alta agrega $50K base
- Promoción agrega $30K extra
- $50K es baseline

Predicción para próximo mes:

Input:
- Ads planificados: $18,000
- Temporada: Alta
- Promoción: Sí

Cálculo:
Ventas = ($18,000 × 8.5) + ($50,000) + ($30,000) + $50,000
Ventas = $153,000 + $50,000 + $30,000 + $50,000
Ventas = $283,000

Predicción: $283,000 (± $15,000)

🔄 Clasificación vs Regresión: ¿Cuál Usar?

Tabla de Decisión Rápida

Si tu pregunta es...	Tipo de ML	Ejemplo
"¿Sí o No?"	Clasificación	¿Comprará? Sí/No
"¿A qué categoría?"	Clasificación	Cliente: Premium/Regular/Básico
"¿Cuánto?"	Regresión	¿Cuánto gastará? $150
"¿Cuántos?"	Regresión	¿Cuántos visitantes? 245
"¿Qué probabilidad?"	Clasificación	Probabilidad de churn: 78%
"¿En cuánto tiempo?"	Regresión	Tiempo de entrega: 3.5 días

Ejemplos Lado a Lado

Problema: Gestión de inventario

Enfoque Clasificación:

Pregunta: ¿Este producto se agotará esta semana?
Respuesta: Sí / No
Acción: Si "Sí" → Re-ordenar inmediatamente

Enfoque Regresión:

Pregunta: ¿Cuántas unidades venderemos esta semana?
Respuesta: 127 unidades
Acción: Ordenar cantidad específica basada en predicción

¿Cuál usar? Depende de tu proceso:

Si solo necesitas alerta binaria → Clasificación
Si necesitas planificar cantidad exacta → Regresión

🎲 2. Aprendizaje No Supervisado

Concepto: El algoritmo encuentra patrones en datos sin etiquetas (sin respuestas correctas pre-definidas). Busca estructura oculta.

Analogía: Es como organizar tu clóset sin instrucciones. Naturalmente agruparás: ropa formal, casual, deportiva, etc. El algoritmo hace lo mismo con datos.

A. Clustering (Agrupamiento)

¿Qué hace? Agrupa datos similares automáticamente sin decirle cuántos grupos hay.

Caso Real - Netflix (Clustering de Usuarios)

Problema: 200 millones de usuarios, imposible personalizar manualmente

Algoritmo aplicado: K-Means Clustering

Proceso:

Input: Historial de visualización de todos los usuarios
- Usuario A: Drama 80%, Comedia 15%, Acción 5%
- Usuario B: Acción 70%, Sci-Fi 20%, Drama 10%
- Usuario C: Drama 75%, Romance 20%, Comedia 5%
...

Algoritmo descubre grupos naturales (sin decirle cuántos)

Output - 8 clusters identificados:

Clusters descubiertos:

┌──────────────────────────────────────────────┐
│ Cluster 1: "Fans de Drama" (15% usuarios)    │
│ Características:                              │
│ - Ven: Dramas, películas emocionales         │
│ - Tiempo de visionado: Alto (15h/semana)     │
│ - Preferencia: Contenido con subtítulos      │
│ Acción: Recomendar series dramáticas nuevas  │
├──────────────────────────────────────────────┤
│ Cluster 2: "Bingers de Acción" (22% usuarios)│
│ Características:                              │
│ - Ven: Series de acción, maratones          │
│ - Comportamiento: 5+ episodios seguidos      │
│ - Hora: Principalmente noches y fines de semana│
│ Acción: Recomendar siguiente temporada       │
├──────────────────────────────────────────────┤
│ Cluster 3: "Familias con niños" (12%)        │
│ Características:                              │
│ - Ven: Contenido infantil + familiar         │
│ - Múltiples perfiles en cuenta              │
│ - Horario: Tardes y temprano en noche       │
│ Acción: Recomendar contenido todo público   │
└──────────────────────────────────────────────┘

Resultado:

Recomendaciones personalizadas por cluster
+35% en engagement
-18% en churn rate
Sistema se auto-ajusta cuando usuarios cambian de cluster

Caso Práctico - E-commerce

Situación: Tienes 50,000 clientes sin categorizar

ANTES (sin ML):

- Todos reciben mismos emails
- Mismas ofertas para todos
- Tasa de conversión: 1.2%

PROCESO DE CLUSTERING:

# Datos de cada cliente
- Total comprado históricamente
- Frecuencia de compra
- Categorías preferidas
- Sensibilidad al precio (% compras con descuento)
- Engagement (abre emails, clicks)

# Algoritmo K-Means descubre 4 clusters naturales

DESPUÉS (con Clustering):

Cluster 1: "Cazadores de gangas" (18,000 usuarios)

Características identificadas:
- Solo compran con 40%+ descuento
- Comparan precios en múltiples sitios
- Abandonan carrito si no hay cupón

Estrategia personalizada:
- Emails con ofertas flash
- Cupones limitados en tiempo
- "Solo por hoy: 50% OFF"

Conversión: 3.8% (vs 1.2% antes)

Cluster 2: "Compradores premium" (8,000 usuarios)

Características identificadas:
- Compran productos de alta gama
- No les importa precio
- Valoran exclusividad y calidad

Estrategia personalizada:
- Emails con lanzamientos exclusivos
- Early access a nuevos productos
- "Colección exclusiva para miembros VIP"

Conversión: 8.2%

Cluster 3: "Ocasionales curiosos" (15,000 usuarios)

Características identificadas:
- Navegan mucho, compran poco
- Alta tasa de abandono de carrito
- Sensibles a shipping costs

Estrategia personalizada:
- Retargeting con productos que vieron
- 20% descuento + envío gratis
- Recordatorios de carrito abandonado

Conversión: 2.1%

Cluster 4: "Leales frecuentes" (9,000 usuarios)

Características identificadas:
- Compran cada 2-3 semanas
- Ticket promedio medio
- Alta satisfacción (reviews positivos)

Estrategia personalizada:
- Programa de lealtad
- Envío gratis en todas las compras
- "Gracias por tu preferencia"

Conversión: 12.5%

RESULTADO TOTAL:

Conversión promedio: 1.2% → 6.1%
ROI de campañas: +408%
Satisfacción del cliente: +25%

B. Detección de Anomalías

¿Qué hace? Encuentra valores atípicos o comportamientos inusuales.

Caso Real - Mastercard (Detección de Fraude)

Problema: Detectar transacciones fraudulentas en tiempo real

Dataset: 50 billones de transacciones anuales

Algoritmo: Isolation Forest (detecta anomalías)

Patrón normal aprendido automáticamente:

Para Usuario ID 12345:
- Compra típicamente en ciudad de residencia (Madrid)
- Monto promedio: $50-$200
- Comercios habituales: Supermercado, gasolinera, restaurantes
- Horario: 8am-10pm
- Frecuencia: 3-5 transacciones/día

Transacción anómala detectada:

┌──────────────────────────────────────────┐
│ 🚨 ALERTA: Anomalía detectada            │
│ Usuario ID: 12345                        │
│                                          │
│ Transacción actual:                      │
│ - Ubicación: Bangkok, Tailandia         │
│   (nunca antes registrado)               │
│ - Monto: $3,500 (15x promedio)           │
│ - Tipo: Electrónica (nunca comprado)    │
│ - Hora: 3:42 AM                          │
│ - Desviación del patrón normal: 96/100   │
│                                          │
│ ACCIÓN AUTOMÁTICA:                       │
│ ✓ Bloquear transacción                  │
│ ✓ Enviar SMS verificación a usuario     │
│ ✓ Notificar equipo anti-fraude          │
└──────────────────────────────────────────┘

Resultado:

97% de fraudes detectados en tiempo real
$12 billones ahorrados en fraudes (2023)
Falsos positivos reducidos: 15% → 2%
Tiempo de detección: <100 milisegundos

Por qué es No Supervisado:

No requiere etiquetar transacciones como "fraude" manualmente
Aprende qué es "normal" para cada usuario
Detecta fraudes nunca vistos antes
Se adapta a nuevos patrones de fraude automáticamente

3. Aprendizaje por Refuerzo

Concepto: El algoritmo aprende por ensayo y error, recibiendo recompensas por acciones correctas y penalizaciones por errores.

Analogía: Como entrenar a un perro. No le explicas la teoría de "sentarse", le das un premio cada vez que lo hace bien.

Proceso de Aprendizaje por Refuerzo

┌─────────┐    Acción    ┌─────────────┐    Recompensa/   ┌─────────┐
│ AGENTE  │──────────────>│  AMBIENTE   │──────Castigo────>│ AGENTE  │
│   IA    │              │   (mundo)   │                  │ aprende │
└─────────┘   <──────────└─────────────┘                  └─────────┘
              Observa                                     Mejora
              nuevo                                       estrategia
              estado

Caso Real - Google DeepMind: Data Centers

Problema: Data centers de Google consumen electricidad equivalente a 200,000 hogares

Solución: RL para optimizar enfriamiento

Agente de RL:

Observa:
- Temperatura de 5,000 servers
- Clima exterior (temperatura, humedad)
- Carga computacional (workload)
- Estado de ventiladores y bombas

Acciones posibles:
- Ajustar velocidad de ventiladores (0-100%)
- Controlar bombas de agua fría (ON/OFF)
- Ajustar temperatura objetivo (18-24°C)
- Distribuir carga entre zonas

Recompensa:
+ Puntos: Mantener temperatura óptima (22°C)
+ Puntos: Usar menos energía
- Puntos: Si temperatura muy alta (riesgo)
- Puntos: Si energía desperdiciada

Entrenamiento:

Fase 1: Simulación (2 semanas)
- Simula 1 año de operación
- Prueba millones de configuraciones
- Aprende sin riesgo real

Fase 2: Piloto controlado (1 mes)
- Opera con supervisión humana
- Humano puede intervenir
- Ajusta estrategia con datos reales

Fase 3: Autónomo (ongoing)
- Opera independientemente
- Mejora continuamente
- Humano monitorea métricas

Estrategias aprendidas (que humanos nunca imaginaron):

Pre-enfriar antes de picos predecibles
Distribuir carga para optimizar zonas naturalmente frías
Ajustes micro-continuos vs cambios grandes

Resultado:

-40% en energía para enfriamiento
-15% en consumo eléctrico total
Ahorro: $120 millones anuales
Reducción CO2: Equivalente a sacar 100,000 autos de circulación

Limitación Importante

⚠️ RL no es común en negocios típicos porque:

Más complejo de implementar que supervisado/no supervisado
Requiere simulación o ambiente controlado
No puedes "experimentar" con clientes reales
Riesgo de estrategias inesperadas

Mejor para:

Gaming
Robótica
Optimización de sistemas complejos
Trading algorítmico (con restricciones)

Para mayoría de negocios:

Usa Supervisado (si tienes respuestas correctas)
Usa No Supervisado (si buscas patrones)
Deja RL para casos muy específicos

🎯 Tabla de Decisión: ¿Qué Tipo de ML Usar?

Tu Situación	Tipo de ML	Subtipo	Ejemplo
Tengo datos con "respuestas correctas" y quiero predecir categorías	Supervisado	Clasificación	Lead scoring: ¿Comprará? Sí/No
Tengo datos con "respuestas correctas" y quiero predecir números	Supervisado	Regresión	Precio óptimo: $X
Tengo datos SIN etiquetas y quiero encontrar grupos	No Supervisado	Clustering	Segmentación de clientes
Quiero encontrar comportamientos raros	No Supervisado	Anomalías	Detección de fraude
Tengo un sistema que puede experimentar	Refuerzo	RL	Optimización de procesos

🎯 Puntos Clave para Recordar

Supervisado = Tienes datos con respuestas correctas → Predices en nuevos datos
- Clasificación = Predice categorías (Sí/No, A/B/C)
- Regresión = Predice números (¿Cuánto? ¿Cuántos?)
No Supervisado = Solo tienes datos sin etiquetas → Encuentras patrones ocultos
- Clustering = Agrupa similares automáticamente
- Anomalías = Detecta lo que es "raro"
Refuerzo = Sistema que aprende experimentando → Optimiza decisiones secuenciales

💡 Regla práctica: 90% de casos de negocio usan Supervisado (clasificación o regresión). Empieza ahí.

🔜 Próximo Módulo

Has completado el Módulo 1: Fundamentos de IA para Negocios

En el Módulo 2: Deep Learning e IA Generativa, aprenderás:

Qué hace especial al Deep Learning
Cómo funcionan las redes neuronales
GPT-4, Claude y la revolución generativa
Cuándo usar DL vs ML tradicional

Última actualización: Octubre 25, 2025 Duración: 15 minutos Nivel: ⭐⚪⚪⚪⚪ (Principiante)

🎯 Objetivos de Aprendizaje

🚀 Introducción

📚 ¿Qué es Machine Learning?

Definición Simple

La Analogía del Niño que Aprende Frutas

Proceso Simplificado de ML

Ejemplo Concreto - Predicción de Churn

📊 Tipos de Machine Learning

1. Aprendizaje Supervisado

Dos Sub-tipos Principales

A. Clasificación (Predecir Categorías)

Caso Real - Spotify (Clasificación)

B. Regresión (Predecir Valores Numéricos)

Caso Real - Airbnb (Regresión)

Ejemplo Detallado - Predicción de Ventas

🔄 Clasificación vs Regresión: ¿Cuál Usar?

Tabla de Decisión Rápida

Ejemplos Lado a Lado

🎲 2. Aprendizaje No Supervisado

A. Clustering (Agrupamiento)

Caso Real - Netflix (Clustering de Usuarios)

Caso Práctico - E-commerce

B. Detección de Anomalías

Caso Real - Mastercard (Detección de Fraude)

3. Aprendizaje por Refuerzo

Proceso de Aprendizaje por Refuerzo

Caso Real - Google DeepMind: Data Centers

Limitación Importante

🎯 Tabla de Decisión: ¿Qué Tipo de ML Usar?

🎯 Puntos Clave para Recordar

🔜 Próximo Módulo

Checkpoint de comprensión

¿Completaste esta lección?