04. Fundamentos de Machine Learning
Comprende los tipos de aprendizaje automático y cuándo usar cada uno en aplicaciones de negocio
🎯 Objetivos de Aprendizaje
Al completar esta lección, serás capaz de:
- Comprender la diferencia entre aprendizaje supervisado y no supervisado
- Distinguir entre clasificación y regresión y sus casos de uso
- Identificar cuándo usar clustering para segmentación
- Reconocer aplicaciones de aprendizaje por refuerzo
- Aplicar el tipo correcto de ML según tu problema de negocio
Tiempo estimado: 15 minutos Nivel: Principiante Prerequisitos: Lecciones 1, 2 y 3
🚀 Introducción
Escenario real: Tienes presupuesto aprobado para tu primer proyecto de IA. El proveedor te pregunta: "¿Necesitas clasificación o regresión? ¿Supervisado o no supervisado?"
Si estos términos te confunden, no estás solo. Machine Learning es el paraguas que contiene múltiples tipos de aprendizaje, cada uno apropiado para diferentes problemas de negocio.
En esta lección aprenderás:
- Qué tipo de ML usar según tu problema
- Ejemplos concretos de cada tipo
- Cómo tomar decisiones informadas
📚 ¿Qué es Machine Learning?
Definición Simple
Machine Learning es la capacidad de las máquinas de aprender patrones de datos históricos y usar esos patrones para hacer predicciones sobre datos nuevos, sin ser programadas explícitamente para cada escenario.
La Analogía del Niño que Aprende Frutas
Programación tradicional:
SI (color == "rojo" Y forma == "redonda" Y tamaño == "mediano")
ENTONCES es_manzana = TRUE
SI (color == "amarillo" Y forma == "alargada")
ENTONCES es_banana = TRUE
Problema: ¿Qué pasa con manzanas verdes? ¿Bananas medio verdes? Necesitas reglas para cada variación posible.
Machine Learning:
1. Muestras al niño 1,000 fotos de manzanas (de todos los colores y tamaños)
2. Muestras 1,000 fotos de bananas
3. El niño identifica patrones comunes por sí mismo
4. Ahora puede reconocer manzanas y bananas que nunca ha visto
Proceso Simplificado de ML
┌──────────────┐ ┌──────────────┐ ┌──────────────┐
│ 1. DATOS │ → │ 2. ALGORITMO │ → │ 3. MODELO │
│ HISTÓRICOS │ │ DE ML │ │ ENTRENADO │
│ │ │ (aprende) │ │ (predice) │
└──────────────┘ └──────────────┘ └──────────────┘
Ejemplos Encuentra Hace
del pasado patrones predicciones
Ejemplo Concreto - Predicción de Churn
# PASO 1: Datos históricos (lo que ya pasó)
Cliente ID | Edad | Compras | Último acceso | Churn (abandonó)
---------- | ---- | ------- | ------------- | ----------------
001 | 28 | 15 | 2 días | NO
002 | 45 | 3 | 90 días | SÍ
003 | 32 | 22 | 1 día | NO
004 | 51 | 5 | 120 días | SÍ
... | ... | ... | ... | ...
(10,000 clientes)
# PASO 2: Algoritmo aprende patrones
Patrón detectado: Clientes con >60 días sin acceso + <8 compras → 85% abandona
# PASO 3: Predicción en clientes nuevos
Cliente 10001 | 29 | 6 | 75 días | → Predicción: 78% probabilidad CHURN
Acción: Enviar campaña de retención automáticamente
📊 Tipos de Machine Learning
1. Aprendizaje Supervisado
Concepto: El algoritmo aprende de ejemplos etiquetados (con la "respuesta correcta" ya conocida).
Analogía: Es como estudiar para un examen con un libro de ejercicios que tiene las respuestas al final. Practicas con problemas resueltos hasta que aprendes el patrón.
Dos Sub-tipos Principales
A. Clasificación (Predecir Categorías)
¿Qué pregunta responde? SÍ/NO o ¿A qué grupo pertenece?
Estructura de datos:
Tienes: [Características] → [Etiqueta/Categoría]
Predices: Nueva categoría basada en características
Ejemplos por Industria:
| Pregunta de Negocio | Categorías Posibles | Aplicación |
|---|---|---|
| ¿Este email es spam? | Spam / No Spam | Filtros de Gmail |
| ¿El cliente comprará? | Comprará / No comprará | Lead scoring |
| ¿Esta transacción es fraude? | Fraude / Legítima | Bancos |
| ¿Qué tipo de cliente es? | Premium / Regular / En riesgo | Segmentación |
| ¿Este producto tiene defecto? | Defectuoso / OK | Control de calidad |
Caso Real - Spotify (Clasificación)
Problema: Identificar canciones "skip" (que usuarios saltarán)
Datos de entrenamiento:
- 100 millones de canciones reproducidas
- Etiqueta: "Skip" vs "Escuchada completa"
- Variables: Tempo, género, hora del día, historial usuario
Algoritmo: Random Forest Classifier
Resultado del modelo:
- Predicción 89% precisa de qué canciones serán saltadas
- Acción: NO recomendar esas canciones en playlists
- Impacto: +24% en tiempo de escucha, +15% retención usuarios
Implementación en negocio:
# Pseudocódigo conceptual
for cada_cancion in playlist:
probabilidad_skip = modelo.predecir(cancion)
if probabilidad_skip > 0.7:
# Alta probabilidad de skip
no_recomendar()
else:
# Baja probabilidad de skip
incluir_en_recomendaciones()
B. Regresión (Predecir Valores Numéricos)
¿Qué pregunta responde? ¿CUÁNTO? o ¿CUÁNTOS?
Estructura de datos:
Tienes: [Características] → [Valor numérico]
Predices: Número continuo basado en características
Ejemplos por Industria:
| Pregunta de Negocio | Valor a Predecir | Aplicación |
|---|---|---|
| ¿Cuánto venderé? | $50,000 - $200,000 | Forecasting ventas |
| ¿Cuántos clientes llegarán? | 100 - 500 personas | Staffing tiendas |
| ¿Cuál será el precio óptimo? | $19.99 - $49.99 | Dynamic pricing |
| ¿Cuánto gastará este cliente? | $0 - $5,000 | Lifetime value |
| ¿En cuántos días se entregará? | 1 - 15 días | Estimación logística |
Caso Real - Airbnb (Regresión)
Problema: Ayudar a hosts a fijar precio óptimo
Datos de entrenamiento:
- 7 millones de listings históricos
- Variable objetivo: Precio por noche
- Variables predictoras:
- Ubicación (coordenadas GPS)
- Tamaño (habitaciones, baños)
- Amenities (wifi, cocina, AC)
- Temporada (alta/baja)
- Reviews (calificación promedio)
- Demanda local (ocupación zona)
Algoritmo: Gradient Boosting Regressor
Proceso de predicción:
Input: Listing nuevo
- Ubicación: Manhattan, NY
- 2 habitaciones, 1 baño
- Wifi, cocina, sin AC
- Temporada: Verano (alta demanda)
- Sin reviews aún
Modelo analiza:
1. Precios de 500 listings similares en zona
2. Ajusta por amenities específicos
3. Factor de temporada (+25% verano)
4. Descuento por sin reviews (-15%)
Output: Precio sugerido $189/noche
Rango de confianza: $165 - $215
Resultado:
- Predicción de precio óptimo con 92% precisión
- Hosts que usan el precio sugerido: +8% en reservas
- Impacto anual: +$300M en revenue para la plataforma
Ejemplo Detallado - Predicción de Ventas
Dataset de entrenamiento:
Mes | Inversión Ads | Temporada | Promo | Ventas (objetivo)
--------- | ------------- | --------- | ------ | -----------------
Enero | $10,000 | Baja | No | $120,000
Febrero | $15,000 | Baja | Sí | $180,000
Marzo | $12,000 | Media | No | $150,000
Abril | $20,000 | Alta | Sí | $280,000
Mayo | $18,000 | Alta | No | $240,000
... | ... | ... | ... | ...
Modelo aprende relación matemática:
Ventas ≈ (Ads × 8.5) + (Temporada_Alta × 50,000) + (Promo × 30,000) + 50,000
Donde:
- Cada $1 en ads genera $8.5 en ventas
- Temporada alta agrega $50K base
- Promoción agrega $30K extra
- $50K es baseline
Predicción para próximo mes:
Input:
- Ads planificados: $18,000
- Temporada: Alta
- Promoción: Sí
Cálculo:
Ventas = ($18,000 × 8.5) + ($50,000) + ($30,000) + $50,000
Ventas = $153,000 + $50,000 + $30,000 + $50,000
Ventas = $283,000
Predicción: $283,000 (± $15,000)
🔄 Clasificación vs Regresión: ¿Cuál Usar?
Tabla de Decisión Rápida
| Si tu pregunta es... | Tipo de ML | Ejemplo |
|---|---|---|
| "¿Sí o No?" | Clasificación | ¿Comprará? Sí/No |
| "¿A qué categoría?" | Clasificación | Cliente: Premium/Regular/Básico |
| "¿Cuánto?" | Regresión | ¿Cuánto gastará? $150 |
| "¿Cuántos?" | Regresión | ¿Cuántos visitantes? 245 |
| "¿Qué probabilidad?" | Clasificación | Probabilidad de churn: 78% |
| "¿En cuánto tiempo?" | Regresión | Tiempo de entrega: 3.5 días |
Ejemplos Lado a Lado
Problema: Gestión de inventario
Enfoque Clasificación:
Pregunta: ¿Este producto se agotará esta semana?
Respuesta: Sí / No
Acción: Si "Sí" → Re-ordenar inmediatamente
Enfoque Regresión:
Pregunta: ¿Cuántas unidades venderemos esta semana?
Respuesta: 127 unidades
Acción: Ordenar cantidad específica basada en predicción
¿Cuál usar? Depende de tu proceso:
- Si solo necesitas alerta binaria → Clasificación
- Si necesitas planificar cantidad exacta → Regresión
🎲 2. Aprendizaje No Supervisado
Concepto: El algoritmo encuentra patrones en datos sin etiquetas (sin respuestas correctas pre-definidas). Busca estructura oculta.
Analogía: Es como organizar tu clóset sin instrucciones. Naturalmente agruparás: ropa formal, casual, deportiva, etc. El algoritmo hace lo mismo con datos.
A. Clustering (Agrupamiento)
¿Qué hace? Agrupa datos similares automáticamente sin decirle cuántos grupos hay.
Caso Real - Netflix (Clustering de Usuarios)
Problema: 200 millones de usuarios, imposible personalizar manualmente
Algoritmo aplicado: K-Means Clustering
Proceso:
Input: Historial de visualización de todos los usuarios
- Usuario A: Drama 80%, Comedia 15%, Acción 5%
- Usuario B: Acción 70%, Sci-Fi 20%, Drama 10%
- Usuario C: Drama 75%, Romance 20%, Comedia 5%
...
Algoritmo descubre grupos naturales (sin decirle cuántos)
Output - 8 clusters identificados:
Clusters descubiertos:
┌──────────────────────────────────────────────┐
│ Cluster 1: "Fans de Drama" (15% usuarios) │
│ Características: │
│ - Ven: Dramas, películas emocionales │
│ - Tiempo de visionado: Alto (15h/semana) │
│ - Preferencia: Contenido con subtítulos │
│ Acción: Recomendar series dramáticas nuevas │
├──────────────────────────────────────────────┤
│ Cluster 2: "Bingers de Acción" (22% usuarios)│
│ Características: │
│ - Ven: Series de acción, maratones │
│ - Comportamiento: 5+ episodios seguidos │
│ - Hora: Principalmente noches y fines de semana│
│ Acción: Recomendar siguiente temporada │
├──────────────────────────────────────────────┤
│ Cluster 3: "Familias con niños" (12%) │
│ Características: │
│ - Ven: Contenido infantil + familiar │
│ - Múltiples perfiles en cuenta │
│ - Horario: Tardes y temprano en noche │
│ Acción: Recomendar contenido todo público │
└──────────────────────────────────────────────┘
Resultado:
- Recomendaciones personalizadas por cluster
- +35% en engagement
- -18% en churn rate
- Sistema se auto-ajusta cuando usuarios cambian de cluster
Caso Práctico - E-commerce
Situación: Tienes 50,000 clientes sin categorizar
ANTES (sin ML):
- Todos reciben mismos emails
- Mismas ofertas para todos
- Tasa de conversión: 1.2%
PROCESO DE CLUSTERING:
# Datos de cada cliente
- Total comprado históricamente
- Frecuencia de compra
- Categorías preferidas
- Sensibilidad al precio (% compras con descuento)
- Engagement (abre emails, clicks)
# Algoritmo K-Means descubre 4 clusters naturales
DESPUÉS (con Clustering):
Cluster 1: "Cazadores de gangas" (18,000 usuarios)
Características identificadas:
- Solo compran con 40%+ descuento
- Comparan precios en múltiples sitios
- Abandonan carrito si no hay cupón
Estrategia personalizada:
- Emails con ofertas flash
- Cupones limitados en tiempo
- "Solo por hoy: 50% OFF"
Conversión: 3.8% (vs 1.2% antes)
Cluster 2: "Compradores premium" (8,000 usuarios)
Características identificadas:
- Compran productos de alta gama
- No les importa precio
- Valoran exclusividad y calidad
Estrategia personalizada:
- Emails con lanzamientos exclusivos
- Early access a nuevos productos
- "Colección exclusiva para miembros VIP"
Conversión: 8.2%
Cluster 3: "Ocasionales curiosos" (15,000 usuarios)
Características identificadas:
- Navegan mucho, compran poco
- Alta tasa de abandono de carrito
- Sensibles a shipping costs
Estrategia personalizada:
- Retargeting con productos que vieron
- 20% descuento + envío gratis
- Recordatorios de carrito abandonado
Conversión: 2.1%
Cluster 4: "Leales frecuentes" (9,000 usuarios)
Características identificadas:
- Compran cada 2-3 semanas
- Ticket promedio medio
- Alta satisfacción (reviews positivos)
Estrategia personalizada:
- Programa de lealtad
- Envío gratis en todas las compras
- "Gracias por tu preferencia"
Conversión: 12.5%
RESULTADO TOTAL:
- Conversión promedio: 1.2% → 6.1%
- ROI de campañas: +408%
- Satisfacción del cliente: +25%
B. Detección de Anomalías
¿Qué hace? Encuentra valores atípicos o comportamientos inusuales.
Caso Real - Mastercard (Detección de Fraude)
Problema: Detectar transacciones fraudulentas en tiempo real
Dataset: 50 billones de transacciones anuales
Algoritmo: Isolation Forest (detecta anomalías)
Patrón normal aprendido automáticamente:
Para Usuario ID 12345:
- Compra típicamente en ciudad de residencia (Madrid)
- Monto promedio: $50-$200
- Comercios habituales: Supermercado, gasolinera, restaurantes
- Horario: 8am-10pm
- Frecuencia: 3-5 transacciones/día
Transacción anómala detectada:
┌──────────────────────────────────────────┐
│ 🚨 ALERTA: Anomalía detectada │
│ Usuario ID: 12345 │
│ │
│ Transacción actual: │
│ - Ubicación: Bangkok, Tailandia │
│ (nunca antes registrado) │
│ - Monto: $3,500 (15x promedio) │
│ - Tipo: Electrónica (nunca comprado) │
│ - Hora: 3:42 AM │
│ - Desviación del patrón normal: 96/100 │
│ │
│ ACCIÓN AUTOMÁTICA: │
│ ✓ Bloquear transacción │
│ ✓ Enviar SMS verificación a usuario │
│ ✓ Notificar equipo anti-fraude │
└──────────────────────────────────────────┘
Resultado:
- 97% de fraudes detectados en tiempo real
- $12 billones ahorrados en fraudes (2023)
- Falsos positivos reducidos: 15% → 2%
- Tiempo de detección: <100 milisegundos
Por qué es No Supervisado:
- No requiere etiquetar transacciones como "fraude" manualmente
- Aprende qué es "normal" para cada usuario
- Detecta fraudes nunca vistos antes
- Se adapta a nuevos patrones de fraude automáticamente
3. Aprendizaje por Refuerzo
Concepto: El algoritmo aprende por ensayo y error, recibiendo recompensas por acciones correctas y penalizaciones por errores.
Analogía: Como entrenar a un perro. No le explicas la teoría de "sentarse", le das un premio cada vez que lo hace bien.
Proceso de Aprendizaje por Refuerzo
┌─────────┐ Acción ┌─────────────┐ Recompensa/ ┌─────────┐
│ AGENTE │──────────────>│ AMBIENTE │──────Castigo────>│ AGENTE │
│ IA │ │ (mundo) │ │ aprende │
└─────────┘ <──────────└─────────────┘ └─────────┘
Observa Mejora
nuevo estrategia
estado
Caso Real - Google DeepMind: Data Centers
Problema: Data centers de Google consumen electricidad equivalente a 200,000 hogares
Solución: RL para optimizar enfriamiento
Agente de RL:
Observa:
- Temperatura de 5,000 servers
- Clima exterior (temperatura, humedad)
- Carga computacional (workload)
- Estado de ventiladores y bombas
Acciones posibles:
- Ajustar velocidad de ventiladores (0-100%)
- Controlar bombas de agua fría (ON/OFF)
- Ajustar temperatura objetivo (18-24°C)
- Distribuir carga entre zonas
Recompensa:
+ Puntos: Mantener temperatura óptima (22°C)
+ Puntos: Usar menos energía
- Puntos: Si temperatura muy alta (riesgo)
- Puntos: Si energía desperdiciada
Entrenamiento:
Fase 1: Simulación (2 semanas)
- Simula 1 año de operación
- Prueba millones de configuraciones
- Aprende sin riesgo real
Fase 2: Piloto controlado (1 mes)
- Opera con supervisión humana
- Humano puede intervenir
- Ajusta estrategia con datos reales
Fase 3: Autónomo (ongoing)
- Opera independientemente
- Mejora continuamente
- Humano monitorea métricas
Estrategias aprendidas (que humanos nunca imaginaron):
- Pre-enfriar antes de picos predecibles
- Distribuir carga para optimizar zonas naturalmente frías
- Ajustes micro-continuos vs cambios grandes
Resultado:
- -40% en energía para enfriamiento
- -15% en consumo eléctrico total
- Ahorro: $120 millones anuales
- Reducción CO2: Equivalente a sacar 100,000 autos de circulación
Limitación Importante
⚠️ RL no es común en negocios típicos porque:
- Más complejo de implementar que supervisado/no supervisado
- Requiere simulación o ambiente controlado
- No puedes "experimentar" con clientes reales
- Riesgo de estrategias inesperadas
Mejor para:
- Gaming
- Robótica
- Optimización de sistemas complejos
- Trading algorítmico (con restricciones)
Para mayoría de negocios:
- Usa Supervisado (si tienes respuestas correctas)
- Usa No Supervisado (si buscas patrones)
- Deja RL para casos muy específicos
🎯 Tabla de Decisión: ¿Qué Tipo de ML Usar?
| Tu Situación | Tipo de ML | Subtipo | Ejemplo |
|---|---|---|---|
| Tengo datos con "respuestas correctas" y quiero predecir categorías | Supervisado | Clasificación | Lead scoring: ¿Comprará? Sí/No |
| Tengo datos con "respuestas correctas" y quiero predecir números | Supervisado | Regresión | Precio óptimo: $X |
| Tengo datos SIN etiquetas y quiero encontrar grupos | No Supervisado | Clustering | Segmentación de clientes |
| Quiero encontrar comportamientos raros | No Supervisado | Anomalías | Detección de fraude |
| Tengo un sistema que puede experimentar | Refuerzo | RL | Optimización de procesos |
🎯 Puntos Clave para Recordar
Supervisado = Tienes datos con respuestas correctas → Predices en nuevos datos
- Clasificación = Predice categorías (Sí/No, A/B/C)
- Regresión = Predice números (¿Cuánto? ¿Cuántos?)
No Supervisado = Solo tienes datos sin etiquetas → Encuentras patrones ocultos
- Clustering = Agrupa similares automáticamente
- Anomalías = Detecta lo que es "raro"
Refuerzo = Sistema que aprende experimentando → Optimiza decisiones secuenciales
💡 Regla práctica: 90% de casos de negocio usan Supervisado (clasificación o regresión). Empieza ahí.
🔜 Próximo Módulo
Has completado el Módulo 1: Fundamentos de IA para Negocios
En el Módulo 2: Deep Learning e IA Generativa, aprenderás:
- Qué hace especial al Deep Learning
- Cómo funcionan las redes neuronales
- GPT-4, Claude y la revolución generativa
- Cuándo usar DL vs ML tradicional
Última actualización: Octubre 25, 2025 Duración: 15 minutos Nivel: ⭐⚪⚪⚪⚪ (Principiante)
¿Completaste esta lección?
Marca esta lección como completada. Tu progreso se guardará en tu navegador.