Lección 6 de 21Módulo 2: Tecnologías Core (Lecciones 4-6)

06. Framework de Decisión: ¿Qué Tecnología de IA Usar?

Aprende a seleccionar la tecnología correcta de IA según tu problema de negocio, datos disponibles y presupuesto. Evita errores costosos

8 minutos

Objetivos de Aprendizaje

Al completar esta lección, serás capaz de:

  • Aplicar un framework estructurado para elegir tecnología de IA
  • Evitar errores comunes que cuestan miles de dólares
  • Calcular presupuestos y timelines realistas
  • Tomar decisiones informadas entre ML, Deep Learning e IA Generativa

Prerequisito: Lecciones 3-5 (Tipos de Machine Learning, Deep Learning e IA Generativa)


El Problema del Millón de Dólares

Caso real - Startup SaaS (2023):

Querían predecir qué usuarios pagarían plan premium (datos: tabla con 5,000 usuarios).

Decisión equivocada:

  • Contrataron equipo de Deep Learning
  • Setup: 8 semanas, Costo: $45,000
  • Resultado: 86% precisión

Solución correcta hubiera sido:

  • ML Supervisado (Random Forest)
  • Setup: 2 semanas, Costo: $3,000
  • Resultado: 84% precisión

Diferencia: +2% precisión a 15x el costo y 4x el tiempo.

Esta lección te enseñará a evitar estos errores costosos.


Framework de Decisión Interactivo

Paso 1: Identifica el Tipo de Resultado

┌────────────────────────────────────────────────────┐
│ INICIO: ¿Qué problema quieres resolver con IA?    │
└────────────────────────────────────────────────────┘
                      │
                      ▼
         ┌─────────────────────────┐
         │ ¿Qué tipo de resultado  │
         │ necesitas?              │
         └─────────────────────────┘
                      │
        ┌─────────────┼─────────────┐
        │             │             │
        ▼             ▼             ▼
  ┌─────────┐   ┌──────────┐  ┌──────────┐
  │PREDECIR │   │ ENCONTRAR│  │  CREAR   │
  │  valor  │   │ patrones │  │contenido │
  │categoría│   │ ocultos  │  │  nuevo   │
  └─────────┘   └──────────┘  └──────────┘
        │             │             │
        ▼             ▼             ▼
  ┌─────────┐   ┌──────────┐  ┌──────────┐
  │¿Tienes  │   │¿Datos    │  │¿Qué tipo │
  │etiquetas│   │tipo?     │  │crear?    │
  │(labels)?│   │          │  │          │
  └─────────┘   └──────────┘  └──────────┘
   │     │         │   │        │   │   │
  Sí    No      Tabla Img    Texto Img Video
   │     │         │   │        │   │   │
   ▼     ▼         ▼   ▼        ▼   ▼   ▼
┌────┐┌────┐   ┌───┐┌───┐   ┌───┐┌───┐┌───┐
│ ML ││ ML │   │ML ││DL │   │LLM││Img││Vid││
│Sup.││NoS.│   │   ││CNN│   │GPT││Gen││Gen││
└────┘└────┘   └───┘└───┘   └───┘└───┘└───┘

Tabla Maestra de Decisión

Tu Problema Tecnología Datos Mínimos Costo Mensual Timeline Complejidad
Predecir churn de clientes ML Supervisado 1,000+ clientes etiquetados $500-2K 2-4 semanas Baja
Segmentar clientes en grupos ML No supervisado 500+ clientes $300-1K 1-3 semanas Baja
Detectar fraude en transacciones ML Supervisado 10,000+ transacciones $2K-8K 4-8 semanas Media
Clasificar imágenes de productos Deep Learning (CNN) 5,000+ imgs/categoría $3K-15K 6-12 semanas Alta
Chatbot que responde preguntas IA Generativa (LLM) 0 (usar API) $200-3K 1-2 semanas Baja
Generar copy de marketing IA Generativa (LLM) 0 (usar API) $20-200 1-3 días Muy Baja
Crear imágenes publicitarias IA Generativa (Diffusion) 0 (usar API) $10-100 1-3 días Muy Baja
Transcribir llamadas de ventas DL (Whisper API) 0 (usar API) $50-500 1 semana Baja
Búsqueda visual en e-commerce Deep Learning (CNN) Catálogo completo $5K-20K 8-16 semanas Alta

Matriz de Decisión: ML vs DL vs Generativa

¿Cuándo Usar Machine Learning Tradicional?

Usa ML tradicional cuando:

  • Datos son tabulares (filas y columnas)
  • Tienes 1,000-50,000 ejemplos
  • Presupuesto limitado ($500-5K/mes)
  • Necesitas explicar decisiones del modelo
  • Proyecto tiene 2-4 semanas de timeline

Ejemplos perfectos para ML:

  • Predecir churn con datos de CRM
  • Segmentar 5,000 clientes
  • Forecasting de ventas
  • Lead scoring
  • Detección de anomalías en transacciones

NO uses ML tradicional para:

  • Procesar imágenes (usa CNN)
  • Generar contenido nuevo (usa IA Generativa)
  • Análisis de video/audio complejo (usa DL)

¿Cuándo Usar Deep Learning?

Usa Deep Learning cuando:

  • Datos son imágenes, video, audio o texto largo
  • Tienes 50,000+ ejemplos etiquetados
  • Presupuesto para GPUs ($3K-15K/mes)
  • Precisión extra justifica costo y complejidad
  • Timeline de 6-12 semanas es aceptable

Ejemplos perfectos para DL:

  • Clasificar 100K fotos de productos (CNN)
  • Transcribir audio de llamadas (Whisper)
  • Análisis de sentimiento en reviews (Transformers)
  • Reconocimiento facial (CNN)
  • Búsqueda visual (CNN)

NO uses Deep Learning cuando:

  • Datos tabulares con menos de 10K registros
  • ML tradicional da 90%+ precisión
  • No tienes presupuesto para GPUs
  • No hay expertise técnico en el equipo

¿Cuándo Usar IA Generativa?

Usa IA Generativa cuando:

  • Necesitas CREAR contenido nuevo (no clasificar)
  • Texto, imágenes, audio o video
  • Quieres usar APIs (NO entrenar modelo)
  • Timeline de días/semanas
  • Presupuesto bajo-medio ($20-3K/mes)

Ejemplos perfectos para IA Generativa:

  • Generar copy de marketing (LLMs)
  • Crear imágenes publicitarias (DALL-E, Midjourney)
  • Chatbots de atención (GPT-4 + RAG)
  • Resumir documentos largos (Claude, GPT-4)
  • Generación de código (GitHub Copilot)

NO uses IA Generativa para:

  • Predecir valores numéricos (usa ML Supervisado)
  • Clasificar categorías (usa ML/DL Discriminativo)
  • Cuando necesitas 100% precisión garantizada
  • Datos altamente confidenciales sin API on-premise

Guía Rápida por Tipo de Problema

Problema: Predecir Valores

Ejemplos: ¿Cuánto venderé? ¿Cuál será el precio óptimo? ¿Cuántos clientes llegarán?

Tecnología: ML Supervisado - Regresión

Datos necesarios:

  • 1,000+ registros históricos con valor objetivo
  • Variables predictoras (features)
  • Formato tabular

Proceso simplificado:

# 1. PREPARAR DATOS
datos = cargar_datos_csv("historico_ventas.csv")
# Columnas: fecha, inversión_ads, temporada, ventas

# 2. ENTRENAR MODELO
from sklearn import RandomForestRegressor
modelo = RandomForestRegressor()
modelo.entrenar(X=datos[features], y=datos[ventas])

# 3. PREDECIR
proximo_mes = {inversión: 18000, temporada: "alta"}
prediccion = modelo.predecir(proximo_mes)
# Output: $333,000 en ventas (± $15,000)

Timeline: 2-4 semanas Costo: $500-2K/mes Herramientas: Google Vertex AI, AWS SageMaker, Azure ML


Problema: Agrupar por Similitud

Ejemplos: Segmentar clientes, encontrar productos similares, detectar patrones ocultos

Tecnología: ML No Supervisado - Clustering

Datos necesarios:

  • 500+ registros
  • Variables numéricas de comportamiento
  • NO necesitas etiquetas

Proceso simplificado:

# 1. PREPARAR DATOS
from sklearn.cluster import KMeans
clientes = cargar_datos()
# Variables: recencia, frecuencia, monto_total

# 2. APLICAR CLUSTERING
modelo = KMeans(n_clusters=4)
clusters = modelo.fit_predict(clientes)

# 3. ANALIZAR RESULTADOS
Cluster 0: 2,500 clientes - "Premium"
Cluster 1: 5,000 clientes - "Ocasionales"
Cluster 2: 1,200 clientes - "En riesgo"
Cluster 3: 3,800 clientes - "Leales"

# 4. ACCIONES POR CLUSTER
for cliente in clientes:
    if cliente.cluster == "Premium":
        strategy = "VIP benefits"
    elif cliente.cluster == "En riesgo":
        strategy = "Win-back campaign"

Timeline: 1-3 semanas Costo: $300-1K/mes Complejidad: Baja


Problema: Clasificar Imágenes

Ejemplos: Identificar productos, detectar defectos, reconocer objetos

Tecnología: Deep Learning - CNN

Datos necesarios:

  • 5,000+ imágenes por categoría
  • Etiquetadas correctamente
  • Calidad consistente

Proceso:

# 1. PREPARAR DATOS
from tensorflow import keras
train_data = cargar_imagenes("productos/", labels)

# 2. ENTRENAR CNN
modelo = keras.applications.ResNet50(weights='imagenet')
modelo.fine_tune(train_data, epochs=50)

# 3. VALIDAR
precision = modelo.evaluate(test_data)
# Output: 94% precisión

# 4. USAR EN PRODUCCIÓN
imagen_nueva = cargar_imagen("nuevo_producto.jpg")
categoria = modelo.predict(imagen_nueva)
# Output: "Calzado deportivo" (92% confianza)

Timeline: 6-12 semanas Costo: $3K-15K/mes Complejidad: Alta Requiere: GPUs, expertise en DL


Problema: Generar Contenido

Ejemplos: Copy de marketing, imágenes publicitarias, chatbots

Tecnología: IA Generativa - LLMs o Diffusion Models

Datos necesarios:

  • 0 (usar APIs pre-entrenadas)
  • Opcional: Documentos propios para RAG

Proceso (Chatbot):

# 1. PREPARAR KNOWLEDGE BASE
documentos = ["FAQ.pdf", "Manual.pdf", "Políticas.pdf"]

# 2. CONVERTIR A EMBEDDINGS
from openai import embeddings
vectores = embeddings.create(documentos)

# 3. FUNCIÓN CHATBOT
def chatbot(pregunta_usuario):
    # Buscar contexto relevante
    docs_relevantes = buscar_similares(pregunta_usuario, vectores)

    # Generar respuesta con LLM
    prompt = f"""
    Contexto: {docs_relevantes}
    Pregunta: {pregunta_usuario}
    Responde como agente de soporte profesional.
    """

    respuesta = openai.ChatCompletion.create(
        model="gpt-4",
        messages=[{"role": "user", "content": prompt}]
    )

    return respuesta

# 4. USO
pregunta = "¿Cuál es su política de devoluciones?"
respuesta = chatbot(pregunta)

Timeline: 1-2 semanas Costo: $200-3K/mes (según volumen) Complejidad: Baja-Media


Errores Comunes y Cómo Evitarlos

Error 1: Usar Deep Learning cuando ML Tradicional es Suficiente

Síntomas:

  • Proyecto tarda 6+ meses en lugar de 1-2
  • Costos 10x superiores
  • Resultados apenas mejores

Solución:

  • Usa ML tradicional si datos son tabulares
  • Usa DL solo si datos son imágenes, audio, video o texto complejo
  • Prueba primero la solución más simple

Error 2: Insuficientes Datos para Deep Learning

Requisitos de datos por tipo:

Modelo Datos Mínimos Ideal
ML Supervisado (tabular) 1,000 registros 10,000+
ML No supervisado 500 registros 5,000+
Deep Learning (CNN imágenes) 5,000 imgs/clase 50,000+
Deep Learning (NLP) 10,000 textos 100,000+
IA Generativa (LLM) 0 (usar API) N/A

Solución:

  • Si tienes menos de 5,000 ejemplos, usa ML tradicional o Transfer Learning
  • Considera Data Augmentation
  • Para IA Generativa, usa APIs ya entrenadas

Error 3: No Entender Supervisado vs No Supervisado

Regla simple:

┌──────────────────────────────────────────────────┐
│ ¿Tienes "respuestas correctas" (etiquetas)?      │
├──────────────────────────────────────────────────┤
│ SÍ → SUPERVISADO                                 │
│ Ejemplo: Email etiquetado como "spam" o "no spam"│
│                                                  │
│ NO → NO SUPERVISADO                              │
│ Ejemplo: Solo tienes emails, quieres que IA     │
│ descubra grupos naturales                        │
└──────────────────────────────────────────────────┘

Error 4: Esperar que IA Generativa Sea Perfecta

Problema: Alucinaciones (LLM inventa información falsa)

Caso real: Abogado pidió a ChatGPT casos legales relevantes. ChatGPT generó 6 casos inventados. Resultado: Abogado sancionado.

Solución:

  • SIEMPRE verifica outputs de IA Generativa
  • Usa "grounding" (dale contexto/docs reales)
  • Implementa human-in-the-loop
  • No uses para info médica, legal o financiera crítica sin validación

Error 5: No Considerar Interpretabilidad

Interpretabilidad por tipo:

Tecnología Interpretabilidad Uso Recomendado
Árboles de Decisión Muy Alta Decisiones que debes explicar
Random Forest Alta Predicciones de negocio
Deep Learning Muy Baja Clasificación imágenes/audio
LLMs Baja Generación de contenido

Solución:

  • Para decisiones críticas: Usa modelos interpretables
  • Implementa herramientas de explicabilidad (SHAP, LIME)
  • Documenta decisiones para auditorías

Comparación de Costos Realistas

ML Tradicional - Predicción de Churn

Setup:

  • Data scientist freelance: $4,000
  • Herramienta (AWS SageMaker): $500/mes
  • Total primer mes: $4,500

Operación:

  • Mantenimiento: $500/mes
  • Año 1 total: $10,000

Deep Learning - Clasificación de Imágenes

Setup:

  • ML engineer: $15,000
  • GPUs (AWS p3 instances): $3,000/mes
  • Datos de entrenamiento: $5,000
  • Total primer mes: $23,000

Operación:

  • Inferencia + mantenimiento: $2,000/mes
  • Año 1 total: $41,000

IA Generativa - Chatbot

Setup:

  • Developer: $3,000
  • Vector database: $200/mes
  • Total primer mes: $3,200

Operación:

  • API OpenAI: $500-2,000/mes (según volumen)
  • Mantenimiento: $200/mes
  • Año 1 total: $11,600-$29,600

Ejercicio Práctico: Diseña tu Proyecto

Template de decisión:

## Mi Proyecto de IA

### 1. PROBLEMA DE NEGOCIO
¿Qué problema quieres resolver?
[Tu respuesta]

### 2. TIPO DE RESULTADO NECESARIO
- [ ] Predecir valor/categoría
- [ ] Encontrar grupos/patrones
- [ ] Crear contenido nuevo
- [ ] Otro: ___________

### 3. DATOS DISPONIBLES
- Tipo: [Tabular / Imágenes / Texto / Audio]
- Cantidad: [número]
- Etiquetados: [Sí / No]
- Calidad: [Alta / Media / Baja]

### 4. TECNOLOGÍA RECOMENDADA
Basado en lo anterior:
- [ ] ML Supervisado
- [ ] ML No Supervisado
- [ ] Deep Learning
- [ ] IA Generativa

Justificación:
[Por qué elegiste esta]

### 5. PLAN DE IMPLEMENTACIÓN
Timeline estimado: ___ semanas
Presupuesto: $___
Herramientas: [Lista]
Métrica de éxito: [¿Cómo medirás si funciona?]

Puntos Clave para Recordar

  1. Regla 80/20: ML tradicional resuelve 80% de problemas de negocio. Empieza simple.

  2. APIs mejor que entrenar: Para IA Generativa, SIEMPRE usa APIs (GPT-4, Claude, DALL-E).

  3. Datos > Algoritmo: 10,000 datos con modelo simple supera 1,000 datos con DL complejo.

  4. ROI primero: Calcula impacto de negocio ANTES de elegir tecnología.

  5. Interpretabilidad importa: Para decisiones críticas, usa modelos explicables.

  6. Human-in-the-loop: Las mejores soluciones combinan IA + Humanos.


Próximos Pasos

Has completado el Módulo 2: Tecnologías de IA.

Ahora dominas:

  • Diferencias entre ML, Deep Learning e IA Generativa
  • Cómo elegir la tecnología correcta
  • Presupuestos y timelines realistas
  • Errores comunes y cómo evitarlos

Siguiente: Módulo 3 - Aplicaciones Prácticas de IA en Negocios

Verás implementaciones reales paso a paso en:

  • Marketing Digital
  • Ventas y CRM
  • Operaciones y Logística
  • Atención al Cliente

Continúa tu aprendizaje →


Actualizado: Octubre 2024 Tiempo de lectura: 8 minutos Nivel: Principiante

¿Completaste esta lección?

Marca esta lección como completada. Tu progreso se guardará en tu navegador.