06. Framework de Decisión: ¿Qué Tecnología de IA Usar?
Aprende a seleccionar la tecnología correcta de IA según tu problema de negocio, datos disponibles y presupuesto. Evita errores costosos
Objetivos de Aprendizaje
Al completar esta lección, serás capaz de:
- Aplicar un framework estructurado para elegir tecnología de IA
- Evitar errores comunes que cuestan miles de dólares
- Calcular presupuestos y timelines realistas
- Tomar decisiones informadas entre ML, Deep Learning e IA Generativa
Prerequisito: Lecciones 3-5 (Tipos de Machine Learning, Deep Learning e IA Generativa)
El Problema del Millón de Dólares
Caso real - Startup SaaS (2023):
Querían predecir qué usuarios pagarían plan premium (datos: tabla con 5,000 usuarios).
Decisión equivocada:
- Contrataron equipo de Deep Learning
- Setup: 8 semanas, Costo: $45,000
- Resultado: 86% precisión
Solución correcta hubiera sido:
- ML Supervisado (Random Forest)
- Setup: 2 semanas, Costo: $3,000
- Resultado: 84% precisión
Diferencia: +2% precisión a 15x el costo y 4x el tiempo.
Esta lección te enseñará a evitar estos errores costosos.
Framework de Decisión Interactivo
Paso 1: Identifica el Tipo de Resultado
┌────────────────────────────────────────────────────┐
│ INICIO: ¿Qué problema quieres resolver con IA? │
└────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────┐
│ ¿Qué tipo de resultado │
│ necesitas? │
└─────────────────────────┘
│
┌─────────────┼─────────────┐
│ │ │
▼ ▼ ▼
┌─────────┐ ┌──────────┐ ┌──────────┐
│PREDECIR │ │ ENCONTRAR│ │ CREAR │
│ valor │ │ patrones │ │contenido │
│categoría│ │ ocultos │ │ nuevo │
└─────────┘ └──────────┘ └──────────┘
│ │ │
▼ ▼ ▼
┌─────────┐ ┌──────────┐ ┌──────────┐
│¿Tienes │ │¿Datos │ │¿Qué tipo │
│etiquetas│ │tipo? │ │crear? │
│(labels)?│ │ │ │ │
└─────────┘ └──────────┘ └──────────┘
│ │ │ │ │ │ │
Sí No Tabla Img Texto Img Video
│ │ │ │ │ │ │
▼ ▼ ▼ ▼ ▼ ▼ ▼
┌────┐┌────┐ ┌───┐┌───┐ ┌───┐┌───┐┌───┐
│ ML ││ ML │ │ML ││DL │ │LLM││Img││Vid││
│Sup.││NoS.│ │ ││CNN│ │GPT││Gen││Gen││
└────┘└────┘ └───┘└───┘ └───┘└───┘└───┘
Tabla Maestra de Decisión
| Tu Problema | Tecnología | Datos Mínimos | Costo Mensual | Timeline | Complejidad |
|---|---|---|---|---|---|
| Predecir churn de clientes | ML Supervisado | 1,000+ clientes etiquetados | $500-2K | 2-4 semanas | Baja |
| Segmentar clientes en grupos | ML No supervisado | 500+ clientes | $300-1K | 1-3 semanas | Baja |
| Detectar fraude en transacciones | ML Supervisado | 10,000+ transacciones | $2K-8K | 4-8 semanas | Media |
| Clasificar imágenes de productos | Deep Learning (CNN) | 5,000+ imgs/categoría | $3K-15K | 6-12 semanas | Alta |
| Chatbot que responde preguntas | IA Generativa (LLM) | 0 (usar API) | $200-3K | 1-2 semanas | Baja |
| Generar copy de marketing | IA Generativa (LLM) | 0 (usar API) | $20-200 | 1-3 días | Muy Baja |
| Crear imágenes publicitarias | IA Generativa (Diffusion) | 0 (usar API) | $10-100 | 1-3 días | Muy Baja |
| Transcribir llamadas de ventas | DL (Whisper API) | 0 (usar API) | $50-500 | 1 semana | Baja |
| Búsqueda visual en e-commerce | Deep Learning (CNN) | Catálogo completo | $5K-20K | 8-16 semanas | Alta |
Matriz de Decisión: ML vs DL vs Generativa
¿Cuándo Usar Machine Learning Tradicional?
Usa ML tradicional cuando:
- Datos son tabulares (filas y columnas)
- Tienes 1,000-50,000 ejemplos
- Presupuesto limitado ($500-5K/mes)
- Necesitas explicar decisiones del modelo
- Proyecto tiene 2-4 semanas de timeline
Ejemplos perfectos para ML:
- Predecir churn con datos de CRM
- Segmentar 5,000 clientes
- Forecasting de ventas
- Lead scoring
- Detección de anomalías en transacciones
NO uses ML tradicional para:
- Procesar imágenes (usa CNN)
- Generar contenido nuevo (usa IA Generativa)
- Análisis de video/audio complejo (usa DL)
¿Cuándo Usar Deep Learning?
Usa Deep Learning cuando:
- Datos son imágenes, video, audio o texto largo
- Tienes 50,000+ ejemplos etiquetados
- Presupuesto para GPUs ($3K-15K/mes)
- Precisión extra justifica costo y complejidad
- Timeline de 6-12 semanas es aceptable
Ejemplos perfectos para DL:
- Clasificar 100K fotos de productos (CNN)
- Transcribir audio de llamadas (Whisper)
- Análisis de sentimiento en reviews (Transformers)
- Reconocimiento facial (CNN)
- Búsqueda visual (CNN)
NO uses Deep Learning cuando:
- Datos tabulares con menos de 10K registros
- ML tradicional da 90%+ precisión
- No tienes presupuesto para GPUs
- No hay expertise técnico en el equipo
¿Cuándo Usar IA Generativa?
Usa IA Generativa cuando:
- Necesitas CREAR contenido nuevo (no clasificar)
- Texto, imágenes, audio o video
- Quieres usar APIs (NO entrenar modelo)
- Timeline de días/semanas
- Presupuesto bajo-medio ($20-3K/mes)
Ejemplos perfectos para IA Generativa:
- Generar copy de marketing (LLMs)
- Crear imágenes publicitarias (DALL-E, Midjourney)
- Chatbots de atención (GPT-4 + RAG)
- Resumir documentos largos (Claude, GPT-4)
- Generación de código (GitHub Copilot)
NO uses IA Generativa para:
- Predecir valores numéricos (usa ML Supervisado)
- Clasificar categorías (usa ML/DL Discriminativo)
- Cuando necesitas 100% precisión garantizada
- Datos altamente confidenciales sin API on-premise
Guía Rápida por Tipo de Problema
Problema: Predecir Valores
Ejemplos: ¿Cuánto venderé? ¿Cuál será el precio óptimo? ¿Cuántos clientes llegarán?
Tecnología: ML Supervisado - Regresión
Datos necesarios:
- 1,000+ registros históricos con valor objetivo
- Variables predictoras (features)
- Formato tabular
Proceso simplificado:
# 1. PREPARAR DATOS
datos = cargar_datos_csv("historico_ventas.csv")
# Columnas: fecha, inversión_ads, temporada, ventas
# 2. ENTRENAR MODELO
from sklearn import RandomForestRegressor
modelo = RandomForestRegressor()
modelo.entrenar(X=datos[features], y=datos[ventas])
# 3. PREDECIR
proximo_mes = {inversión: 18000, temporada: "alta"}
prediccion = modelo.predecir(proximo_mes)
# Output: $333,000 en ventas (± $15,000)
Timeline: 2-4 semanas Costo: $500-2K/mes Herramientas: Google Vertex AI, AWS SageMaker, Azure ML
Problema: Agrupar por Similitud
Ejemplos: Segmentar clientes, encontrar productos similares, detectar patrones ocultos
Tecnología: ML No Supervisado - Clustering
Datos necesarios:
- 500+ registros
- Variables numéricas de comportamiento
- NO necesitas etiquetas
Proceso simplificado:
# 1. PREPARAR DATOS
from sklearn.cluster import KMeans
clientes = cargar_datos()
# Variables: recencia, frecuencia, monto_total
# 2. APLICAR CLUSTERING
modelo = KMeans(n_clusters=4)
clusters = modelo.fit_predict(clientes)
# 3. ANALIZAR RESULTADOS
Cluster 0: 2,500 clientes - "Premium"
Cluster 1: 5,000 clientes - "Ocasionales"
Cluster 2: 1,200 clientes - "En riesgo"
Cluster 3: 3,800 clientes - "Leales"
# 4. ACCIONES POR CLUSTER
for cliente in clientes:
if cliente.cluster == "Premium":
strategy = "VIP benefits"
elif cliente.cluster == "En riesgo":
strategy = "Win-back campaign"
Timeline: 1-3 semanas Costo: $300-1K/mes Complejidad: Baja
Problema: Clasificar Imágenes
Ejemplos: Identificar productos, detectar defectos, reconocer objetos
Tecnología: Deep Learning - CNN
Datos necesarios:
- 5,000+ imágenes por categoría
- Etiquetadas correctamente
- Calidad consistente
Proceso:
# 1. PREPARAR DATOS
from tensorflow import keras
train_data = cargar_imagenes("productos/", labels)
# 2. ENTRENAR CNN
modelo = keras.applications.ResNet50(weights='imagenet')
modelo.fine_tune(train_data, epochs=50)
# 3. VALIDAR
precision = modelo.evaluate(test_data)
# Output: 94% precisión
# 4. USAR EN PRODUCCIÓN
imagen_nueva = cargar_imagen("nuevo_producto.jpg")
categoria = modelo.predict(imagen_nueva)
# Output: "Calzado deportivo" (92% confianza)
Timeline: 6-12 semanas Costo: $3K-15K/mes Complejidad: Alta Requiere: GPUs, expertise en DL
Problema: Generar Contenido
Ejemplos: Copy de marketing, imágenes publicitarias, chatbots
Tecnología: IA Generativa - LLMs o Diffusion Models
Datos necesarios:
- 0 (usar APIs pre-entrenadas)
- Opcional: Documentos propios para RAG
Proceso (Chatbot):
# 1. PREPARAR KNOWLEDGE BASE
documentos = ["FAQ.pdf", "Manual.pdf", "Políticas.pdf"]
# 2. CONVERTIR A EMBEDDINGS
from openai import embeddings
vectores = embeddings.create(documentos)
# 3. FUNCIÓN CHATBOT
def chatbot(pregunta_usuario):
# Buscar contexto relevante
docs_relevantes = buscar_similares(pregunta_usuario, vectores)
# Generar respuesta con LLM
prompt = f"""
Contexto: {docs_relevantes}
Pregunta: {pregunta_usuario}
Responde como agente de soporte profesional.
"""
respuesta = openai.ChatCompletion.create(
model="gpt-4",
messages=[{"role": "user", "content": prompt}]
)
return respuesta
# 4. USO
pregunta = "¿Cuál es su política de devoluciones?"
respuesta = chatbot(pregunta)
Timeline: 1-2 semanas Costo: $200-3K/mes (según volumen) Complejidad: Baja-Media
Errores Comunes y Cómo Evitarlos
Error 1: Usar Deep Learning cuando ML Tradicional es Suficiente
Síntomas:
- Proyecto tarda 6+ meses en lugar de 1-2
- Costos 10x superiores
- Resultados apenas mejores
Solución:
- Usa ML tradicional si datos son tabulares
- Usa DL solo si datos son imágenes, audio, video o texto complejo
- Prueba primero la solución más simple
Error 2: Insuficientes Datos para Deep Learning
Requisitos de datos por tipo:
| Modelo | Datos Mínimos | Ideal |
|---|---|---|
| ML Supervisado (tabular) | 1,000 registros | 10,000+ |
| ML No supervisado | 500 registros | 5,000+ |
| Deep Learning (CNN imágenes) | 5,000 imgs/clase | 50,000+ |
| Deep Learning (NLP) | 10,000 textos | 100,000+ |
| IA Generativa (LLM) | 0 (usar API) | N/A |
Solución:
- Si tienes menos de 5,000 ejemplos, usa ML tradicional o Transfer Learning
- Considera Data Augmentation
- Para IA Generativa, usa APIs ya entrenadas
Error 3: No Entender Supervisado vs No Supervisado
Regla simple:
┌──────────────────────────────────────────────────┐
│ ¿Tienes "respuestas correctas" (etiquetas)? │
├──────────────────────────────────────────────────┤
│ SÍ → SUPERVISADO │
│ Ejemplo: Email etiquetado como "spam" o "no spam"│
│ │
│ NO → NO SUPERVISADO │
│ Ejemplo: Solo tienes emails, quieres que IA │
│ descubra grupos naturales │
└──────────────────────────────────────────────────┘
Error 4: Esperar que IA Generativa Sea Perfecta
Problema: Alucinaciones (LLM inventa información falsa)
Caso real: Abogado pidió a ChatGPT casos legales relevantes. ChatGPT generó 6 casos inventados. Resultado: Abogado sancionado.
Solución:
- SIEMPRE verifica outputs de IA Generativa
- Usa "grounding" (dale contexto/docs reales)
- Implementa human-in-the-loop
- No uses para info médica, legal o financiera crítica sin validación
Error 5: No Considerar Interpretabilidad
Interpretabilidad por tipo:
| Tecnología | Interpretabilidad | Uso Recomendado |
|---|---|---|
| Árboles de Decisión | Muy Alta | Decisiones que debes explicar |
| Random Forest | Alta | Predicciones de negocio |
| Deep Learning | Muy Baja | Clasificación imágenes/audio |
| LLMs | Baja | Generación de contenido |
Solución:
- Para decisiones críticas: Usa modelos interpretables
- Implementa herramientas de explicabilidad (SHAP, LIME)
- Documenta decisiones para auditorías
Comparación de Costos Realistas
ML Tradicional - Predicción de Churn
Setup:
- Data scientist freelance: $4,000
- Herramienta (AWS SageMaker): $500/mes
- Total primer mes: $4,500
Operación:
- Mantenimiento: $500/mes
- Año 1 total: $10,000
Deep Learning - Clasificación de Imágenes
Setup:
- ML engineer: $15,000
- GPUs (AWS p3 instances): $3,000/mes
- Datos de entrenamiento: $5,000
- Total primer mes: $23,000
Operación:
- Inferencia + mantenimiento: $2,000/mes
- Año 1 total: $41,000
IA Generativa - Chatbot
Setup:
- Developer: $3,000
- Vector database: $200/mes
- Total primer mes: $3,200
Operación:
- API OpenAI: $500-2,000/mes (según volumen)
- Mantenimiento: $200/mes
- Año 1 total: $11,600-$29,600
Ejercicio Práctico: Diseña tu Proyecto
Template de decisión:
## Mi Proyecto de IA
### 1. PROBLEMA DE NEGOCIO
¿Qué problema quieres resolver?
[Tu respuesta]
### 2. TIPO DE RESULTADO NECESARIO
- [ ] Predecir valor/categoría
- [ ] Encontrar grupos/patrones
- [ ] Crear contenido nuevo
- [ ] Otro: ___________
### 3. DATOS DISPONIBLES
- Tipo: [Tabular / Imágenes / Texto / Audio]
- Cantidad: [número]
- Etiquetados: [Sí / No]
- Calidad: [Alta / Media / Baja]
### 4. TECNOLOGÍA RECOMENDADA
Basado en lo anterior:
- [ ] ML Supervisado
- [ ] ML No Supervisado
- [ ] Deep Learning
- [ ] IA Generativa
Justificación:
[Por qué elegiste esta]
### 5. PLAN DE IMPLEMENTACIÓN
Timeline estimado: ___ semanas
Presupuesto: $___
Herramientas: [Lista]
Métrica de éxito: [¿Cómo medirás si funciona?]
Puntos Clave para Recordar
Regla 80/20: ML tradicional resuelve 80% de problemas de negocio. Empieza simple.
APIs mejor que entrenar: Para IA Generativa, SIEMPRE usa APIs (GPT-4, Claude, DALL-E).
Datos > Algoritmo: 10,000 datos con modelo simple supera 1,000 datos con DL complejo.
ROI primero: Calcula impacto de negocio ANTES de elegir tecnología.
Interpretabilidad importa: Para decisiones críticas, usa modelos explicables.
Human-in-the-loop: Las mejores soluciones combinan IA + Humanos.
Próximos Pasos
Has completado el Módulo 2: Tecnologías de IA.
Ahora dominas:
- Diferencias entre ML, Deep Learning e IA Generativa
- Cómo elegir la tecnología correcta
- Presupuestos y timelines realistas
- Errores comunes y cómo evitarlos
Siguiente: Módulo 3 - Aplicaciones Prácticas de IA en Negocios
Verás implementaciones reales paso a paso en:
- Marketing Digital
- Ventas y CRM
- Operaciones y Logística
- Atención al Cliente
Continúa tu aprendizaje →
Actualizado: Octubre 2024 Tiempo de lectura: 8 minutos Nivel: Principiante
¿Completaste esta lección?
Marca esta lección como completada. Tu progreso se guardará en tu navegador.