06. Framework de Decisión: ¿Qué Tecnología de IA Usar?

Objetivos de Aprendizaje

Al completar esta lección, serás capaz de:

Aplicar un framework estructurado para elegir tecnología de IA
Evitar errores comunes que cuestan miles de dólares
Calcular presupuestos y timelines realistas
Tomar decisiones informadas entre ML, Deep Learning e IA Generativa

Prerequisito: Lecciones 3-5 (Tipos de Machine Learning, Deep Learning e IA Generativa)

El Problema del Millón de Dólares

Caso real - Startup SaaS (2023):

Querían predecir qué usuarios pagarían plan premium (datos: tabla con 5,000 usuarios).

Decisión equivocada:

Contrataron equipo de Deep Learning
Setup: 8 semanas, Costo: $45,000
Resultado: 86% precisión

Solución correcta hubiera sido:

ML Supervisado (Random Forest)
Setup: 2 semanas, Costo: $3,000
Resultado: 84% precisión

Diferencia: +2% precisión a 15x el costo y 4x el tiempo.

Esta lección te enseñará a evitar estos errores costosos.

Framework de Decisión Interactivo

Paso 1: Identifica el Tipo de Resultado

┌────────────────────────────────────────────────────┐
│ INICIO: ¿Qué problema quieres resolver con IA?    │
└────────────────────────────────────────────────────┘
                      │
                      ▼
         ┌─────────────────────────┐
         │ ¿Qué tipo de resultado  │
         │ necesitas?              │
         └─────────────────────────┘
                      │
        ┌─────────────┼─────────────┐
        │             │             │
        ▼             ▼             ▼
  ┌─────────┐   ┌──────────┐  ┌──────────┐
  │PREDECIR │   │ ENCONTRAR│  │  CREAR   │
  │  valor  │   │ patrones │  │contenido │
  │categoría│   │ ocultos  │  │  nuevo   │
  └─────────┘   └──────────┘  └──────────┘
        │             │             │
        ▼             ▼             ▼
  ┌─────────┐   ┌──────────┐  ┌──────────┐
  │¿Tienes  │   │¿Datos    │  │¿Qué tipo │
  │etiquetas│   │tipo?     │  │crear?    │
  │(labels)?│   │          │  │          │
  └─────────┘   └──────────┘  └──────────┘
   │     │         │   │        │   │   │
  Sí    No      Tabla Img    Texto Img Video
   │     │         │   │        │   │   │
   ▼     ▼         ▼   ▼        ▼   ▼   ▼
┌────┐┌────┐   ┌───┐┌───┐   ┌───┐┌───┐┌───┐
│ ML ││ ML │   │ML ││DL │   │LLM││Img││Vid││
│Sup.││NoS.│   │   ││CNN│   │GPT││Gen││Gen││
└────┘└────┘   └───┘└───┘   └───┘└───┘└───┘

Tabla Maestra de Decisión

Tu Problema	Tecnología	Datos Mínimos	Costo Mensual	Timeline	Complejidad
Predecir churn de clientes	ML Supervisado	1,000+ clientes etiquetados	$500-2K	2-4 semanas	Baja
Segmentar clientes en grupos	ML No supervisado	500+ clientes	$300-1K	1-3 semanas	Baja
Detectar fraude en transacciones	ML Supervisado	10,000+ transacciones	$2K-8K	4-8 semanas	Media
Clasificar imágenes de productos	Deep Learning (CNN)	5,000+ imgs/categoría	$3K-15K	6-12 semanas	Alta
Chatbot que responde preguntas	IA Generativa (LLM)	0 (usar API)	$200-3K	1-2 semanas	Baja
Generar copy de marketing	IA Generativa (LLM)	0 (usar API)	$20-200	1-3 días	Muy Baja
Crear imágenes publicitarias	IA Generativa (Diffusion)	0 (usar API)	$10-100	1-3 días	Muy Baja
Transcribir llamadas de ventas	DL (Whisper API)	0 (usar API)	$50-500	1 semana	Baja
Búsqueda visual en e-commerce	Deep Learning (CNN)	Catálogo completo	$5K-20K	8-16 semanas	Alta

Matriz de Decisión: ML vs DL vs Generativa

¿Cuándo Usar Machine Learning Tradicional?

Usa ML tradicional cuando:

Datos son tabulares (filas y columnas)
Tienes 1,000-50,000 ejemplos
Presupuesto limitado ($500-5K/mes)
Necesitas explicar decisiones del modelo
Proyecto tiene 2-4 semanas de timeline

Ejemplos perfectos para ML:

Predecir churn con datos de CRM
Segmentar 5,000 clientes
Forecasting de ventas
Lead scoring
Detección de anomalías en transacciones

NO uses ML tradicional para:

Procesar imágenes (usa CNN)
Generar contenido nuevo (usa IA Generativa)
Análisis de video/audio complejo (usa DL)

¿Cuándo Usar Deep Learning?

Usa Deep Learning cuando:

Datos son imágenes, video, audio o texto largo
Tienes 50,000+ ejemplos etiquetados
Presupuesto para GPUs ($3K-15K/mes)
Precisión extra justifica costo y complejidad
Timeline de 6-12 semanas es aceptable

Ejemplos perfectos para DL:

Clasificar 100K fotos de productos (CNN)
Transcribir audio de llamadas (Whisper)
Análisis de sentimiento en reviews (Transformers)
Reconocimiento facial (CNN)
Búsqueda visual (CNN)

NO uses Deep Learning cuando:

Datos tabulares con menos de 10K registros
ML tradicional da 90%+ precisión
No tienes presupuesto para GPUs
No hay expertise técnico en el equipo

¿Cuándo Usar IA Generativa?

Usa IA Generativa cuando:

Necesitas CREAR contenido nuevo (no clasificar)
Texto, imágenes, audio o video
Quieres usar APIs (NO entrenar modelo)
Timeline de días/semanas
Presupuesto bajo-medio ($20-3K/mes)

Ejemplos perfectos para IA Generativa:

Generar copy de marketing (LLMs)
Crear imágenes publicitarias (DALL-E, Midjourney)
Chatbots de atención (GPT-4 + RAG)
Resumir documentos largos (Claude, GPT-4)
Generación de código (GitHub Copilot)

NO uses IA Generativa para:

Predecir valores numéricos (usa ML Supervisado)
Clasificar categorías (usa ML/DL Discriminativo)
Cuando necesitas 100% precisión garantizada
Datos altamente confidenciales sin API on-premise

Guía Rápida por Tipo de Problema

Problema: Predecir Valores

Ejemplos: ¿Cuánto venderé? ¿Cuál será el precio óptimo? ¿Cuántos clientes llegarán?

Tecnología: ML Supervisado - Regresión

Datos necesarios:

1,000+ registros históricos con valor objetivo
Variables predictoras (features)
Formato tabular

Proceso simplificado:

# 1. PREPARAR DATOS
datos = cargar_datos_csv("historico_ventas.csv")
# Columnas: fecha, inversión_ads, temporada, ventas

# 2. ENTRENAR MODELO
from sklearn import RandomForestRegressor
modelo = RandomForestRegressor()
modelo.entrenar(X=datos[features], y=datos[ventas])

# 3. PREDECIR
proximo_mes = {inversión: 18000, temporada: "alta"}
prediccion = modelo.predecir(proximo_mes)
# Output: $333,000 en ventas (± $15,000)

Timeline: 2-4 semanas Costo: $500-2K/mes Herramientas: Google Vertex AI, AWS SageMaker, Azure ML

Problema: Agrupar por Similitud

Ejemplos: Segmentar clientes, encontrar productos similares, detectar patrones ocultos

Tecnología: ML No Supervisado - Clustering

Datos necesarios:

500+ registros
Variables numéricas de comportamiento
NO necesitas etiquetas

Proceso simplificado:

# 1. PREPARAR DATOS
from sklearn.cluster import KMeans
clientes = cargar_datos()
# Variables: recencia, frecuencia, monto_total

# 2. APLICAR CLUSTERING
modelo = KMeans(n_clusters=4)
clusters = modelo.fit_predict(clientes)

# 3. ANALIZAR RESULTADOS
Cluster 0: 2,500 clientes - "Premium"
Cluster 1: 5,000 clientes - "Ocasionales"
Cluster 2: 1,200 clientes - "En riesgo"
Cluster 3: 3,800 clientes - "Leales"

# 4. ACCIONES POR CLUSTER
for cliente in clientes:
    if cliente.cluster == "Premium":
        strategy = "VIP benefits"
    elif cliente.cluster == "En riesgo":
        strategy = "Win-back campaign"

Timeline: 1-3 semanas Costo: $300-1K/mes Complejidad: Baja

Problema: Clasificar Imágenes

Ejemplos: Identificar productos, detectar defectos, reconocer objetos

Tecnología: Deep Learning - CNN

Datos necesarios:

5,000+ imágenes por categoría
Etiquetadas correctamente
Calidad consistente

Proceso:

# 1. PREPARAR DATOS
from tensorflow import keras
train_data = cargar_imagenes("productos/", labels)

# 2. ENTRENAR CNN
modelo = keras.applications.ResNet50(weights='imagenet')
modelo.fine_tune(train_data, epochs=50)

# 3. VALIDAR
precision = modelo.evaluate(test_data)
# Output: 94% precisión

# 4. USAR EN PRODUCCIÓN
imagen_nueva = cargar_imagen("nuevo_producto.jpg")
categoria = modelo.predict(imagen_nueva)
# Output: "Calzado deportivo" (92% confianza)

Timeline: 6-12 semanas Costo: $3K-15K/mes Complejidad: Alta Requiere: GPUs, expertise en DL

Problema: Generar Contenido

Ejemplos: Copy de marketing, imágenes publicitarias, chatbots

Tecnología: IA Generativa - LLMs o Diffusion Models

Datos necesarios:

0 (usar APIs pre-entrenadas)
Opcional: Documentos propios para RAG

Proceso (Chatbot):

# 1. PREPARAR KNOWLEDGE BASE
documentos = ["FAQ.pdf", "Manual.pdf", "Políticas.pdf"]

# 2. CONVERTIR A EMBEDDINGS
from openai import embeddings
vectores = embeddings.create(documentos)

# 3. FUNCIÓN CHATBOT
def chatbot(pregunta_usuario):
    # Buscar contexto relevante
    docs_relevantes = buscar_similares(pregunta_usuario, vectores)

    # Generar respuesta con LLM
    prompt = f"""
    Contexto: {docs_relevantes}
    Pregunta: {pregunta_usuario}
    Responde como agente de soporte profesional.
    """

    respuesta = openai.ChatCompletion.create(
        model="gpt-4",
        messages=[{"role": "user", "content": prompt}]
    )

    return respuesta

# 4. USO
pregunta = "¿Cuál es su política de devoluciones?"
respuesta = chatbot(pregunta)

Timeline: 1-2 semanas Costo: $200-3K/mes (según volumen) Complejidad: Baja-Media

Errores Comunes y Cómo Evitarlos

Error 1: Usar Deep Learning cuando ML Tradicional es Suficiente

Síntomas:

Proyecto tarda 6+ meses en lugar de 1-2
Costos 10x superiores
Resultados apenas mejores

Solución:

Usa ML tradicional si datos son tabulares
Usa DL solo si datos son imágenes, audio, video o texto complejo
Prueba primero la solución más simple

Error 2: Insuficientes Datos para Deep Learning

Requisitos de datos por tipo:

Modelo	Datos Mínimos	Ideal
ML Supervisado (tabular)	1,000 registros	10,000+
ML No supervisado	500 registros	5,000+
Deep Learning (CNN imágenes)	5,000 imgs/clase	50,000+
Deep Learning (NLP)	10,000 textos	100,000+
IA Generativa (LLM)	0 (usar API)	N/A

Solución:

Si tienes menos de 5,000 ejemplos, usa ML tradicional o Transfer Learning
Considera Data Augmentation
Para IA Generativa, usa APIs ya entrenadas

Error 3: No Entender Supervisado vs No Supervisado

Regla simple:

┌──────────────────────────────────────────────────┐
│ ¿Tienes "respuestas correctas" (etiquetas)?      │
├──────────────────────────────────────────────────┤
│ SÍ → SUPERVISADO                                 │
│ Ejemplo: Email etiquetado como "spam" o "no spam"│
│                                                  │
│ NO → NO SUPERVISADO                              │
│ Ejemplo: Solo tienes emails, quieres que IA     │
│ descubra grupos naturales                        │
└──────────────────────────────────────────────────┘

Error 4: Esperar que IA Generativa Sea Perfecta

Problema: Alucinaciones (LLM inventa información falsa)

Caso real: Abogado pidió a ChatGPT casos legales relevantes. ChatGPT generó 6 casos inventados. Resultado: Abogado sancionado.

Solución:

SIEMPRE verifica outputs de IA Generativa
Usa "grounding" (dale contexto/docs reales)
Implementa human-in-the-loop
No uses para info médica, legal o financiera crítica sin validación

Error 5: No Considerar Interpretabilidad

Interpretabilidad por tipo:

Tecnología	Interpretabilidad	Uso Recomendado
Árboles de Decisión	Muy Alta	Decisiones que debes explicar
Random Forest	Alta	Predicciones de negocio
Deep Learning	Muy Baja	Clasificación imágenes/audio
LLMs	Baja	Generación de contenido

Solución:

Para decisiones críticas: Usa modelos interpretables
Implementa herramientas de explicabilidad (SHAP, LIME)
Documenta decisiones para auditorías

Comparación de Costos Realistas

ML Tradicional - Predicción de Churn

Setup:

Data scientist freelance: $4,000
Herramienta (AWS SageMaker): $500/mes
Total primer mes: $4,500

Operación:

Mantenimiento: $500/mes
Año 1 total: $10,000

Deep Learning - Clasificación de Imágenes

Setup:

ML engineer: $15,000
GPUs (AWS p3 instances): $3,000/mes
Datos de entrenamiento: $5,000
Total primer mes: $23,000

Operación:

Inferencia + mantenimiento: $2,000/mes
Año 1 total: $41,000

IA Generativa - Chatbot

Setup:

Developer: $3,000
Vector database: $200/mes
Total primer mes: $3,200

Operación:

API OpenAI: $500-2,000/mes (según volumen)
Mantenimiento: $200/mes
Año 1 total: $11,600-$29,600

Ejercicio Práctico: Diseña tu Proyecto

Template de decisión:

## Mi Proyecto de IA

### 1. PROBLEMA DE NEGOCIO
¿Qué problema quieres resolver?
[Tu respuesta]

### 2. TIPO DE RESULTADO NECESARIO
- [ ] Predecir valor/categoría
- [ ] Encontrar grupos/patrones
- [ ] Crear contenido nuevo
- [ ] Otro: ___________

### 3. DATOS DISPONIBLES
- Tipo: [Tabular / Imágenes / Texto / Audio]
- Cantidad: [número]
- Etiquetados: [Sí / No]
- Calidad: [Alta / Media / Baja]

### 4. TECNOLOGÍA RECOMENDADA
Basado en lo anterior:
- [ ] ML Supervisado
- [ ] ML No Supervisado
- [ ] Deep Learning
- [ ] IA Generativa

Justificación:
[Por qué elegiste esta]

### 5. PLAN DE IMPLEMENTACIÓN
Timeline estimado: ___ semanas
Presupuesto: $___
Herramientas: [Lista]
Métrica de éxito: [¿Cómo medirás si funciona?]

Puntos Clave para Recordar

Regla 80/20: ML tradicional resuelve 80% de problemas de negocio. Empieza simple.
APIs mejor que entrenar: Para IA Generativa, SIEMPRE usa APIs (GPT-4, Claude, DALL-E).
Datos > Algoritmo: 10,000 datos con modelo simple supera 1,000 datos con DL complejo.
ROI primero: Calcula impacto de negocio ANTES de elegir tecnología.
Interpretabilidad importa: Para decisiones críticas, usa modelos explicables.
Human-in-the-loop: Las mejores soluciones combinan IA + Humanos.

Próximos Pasos

Has completado el Módulo 2: Tecnologías de IA.

Ahora dominas:

Diferencias entre ML, Deep Learning e IA Generativa
Cómo elegir la tecnología correcta
Presupuestos y timelines realistas
Errores comunes y cómo evitarlos

Siguiente: Módulo 3 - Aplicaciones Prácticas de IA en Negocios

Verás implementaciones reales paso a paso en:

Marketing Digital
Ventas y CRM
Operaciones y Logística
Atención al Cliente

Continúa tu aprendizaje →

Actualizado: Octubre 2024 Tiempo de lectura: 8 minutos Nivel: Principiante

Objetivos de Aprendizaje

El Problema del Millón de Dólares

Framework de Decisión Interactivo

Paso 1: Identifica el Tipo de Resultado

Tabla Maestra de Decisión

Matriz de Decisión: ML vs DL vs Generativa

¿Cuándo Usar Machine Learning Tradicional?

¿Cuándo Usar Deep Learning?

¿Cuándo Usar IA Generativa?

Guía Rápida por Tipo de Problema

Problema: Predecir Valores

Problema: Agrupar por Similitud

Problema: Clasificar Imágenes

Problema: Generar Contenido

Errores Comunes y Cómo Evitarlos

Error 1: Usar Deep Learning cuando ML Tradicional es Suficiente

Error 2: Insuficientes Datos para Deep Learning

Error 3: No Entender Supervisado vs No Supervisado

Error 4: Esperar que IA Generativa Sea Perfecta

Error 5: No Considerar Interpretabilidad

Comparación de Costos Realistas

ML Tradicional - Predicción de Churn

Deep Learning - Clasificación de Imágenes

IA Generativa - Chatbot

Ejercicio Práctico: Diseña tu Proyecto

Puntos Clave para Recordar

Próximos Pasos

¿Completaste esta lección?