Lección 12 de 28Pensamiento Analítico

Hipótesis y validación

Cómo formular y probar hipótesis con datos.

10 minutos

Una de las trampas mas comunes en el analisis de datos es empezar a explorar sin direccion. "Vamos a ver que encontramos en los datos" suena razonable, pero frecuentemente lleva a descubrimientos falsos o irrelevantes.

El enfoque correcto es comenzar con una hipotesis clara y diseñar un metodo para validarla. En esta leccion, aprenderemos este proceso fundamental del pensamiento analitico.

El problema del analisis sin hipotesis

El patron peligroso: "Pescar" en los datos

Imagina que tienes una base de datos de clientes con 50 variables. Si buscas correlaciones entre todas ellas, encontraras algunas. Es estadisticamente inevitable.

El problema: Muchas de esas correlaciones seran falsas positivas (ruido que parece señal).

Ejemplo: Si analizas 100 posibles relaciones, es probable encontrar 5 "significativas" por puro azar.

Por que esto es costoso

Sin hipotesis Con hipotesis
"Veamos que encontramos" "Creemos que X afecta Y"
Multiples comparaciones Una prueba enfocada
Alto riesgo de falsos positivos Control del error
Hallazgos dificiles de interpretar Conclusion clara
No sabe que busca Sabe que encontrar y que significa

Que es una hipotesis

Una hipotesis es una afirmacion especifica y comprobable sobre la realidad. Es una prediccion sobre lo que esperamos encontrar en los datos.

Caracteristicas de una buena hipotesis

1. Especifica: Define claramente las variables y la relacion esperada

  • Mala: "Los clientes jovenes son diferentes"
  • Buena: "Los clientes menores de 30 años tienen mayor frecuencia de compra mensual"

2. Medible: Puede traducirse en numeros o categorias observables

  • Mala: "El servicio al cliente es importante"
  • Buena: "Los clientes con calificacion de servicio >= 4 tienen mayor probabilidad de recompra"

3. Falsificable: Es posible encontrar evidencia que la contradiga

  • Mala: "Los buenos lideres inspiran" (no hay forma de refutar esto)
  • Buena: "Los equipos con reuniones 1:1 semanales tienen mayor engagement"

4. Relevante: Si es verdadera, cambia una decision o accion

  • Mala: "Los usuarios de iPhone usan la app en horarios diferentes a Android"
  • Buena: "Los usuarios de iPhone tienen 30% mayor lifetime value"

La estructura de una hipotesis

Una hipotesis bien formulada sigue esta estructura:

Si [condicion/intervencion], entonces [resultado esperado],
porque [mecanismo/razon].

Ejemplos:

  • "Si ofrecemos envio gratis en compras mayores a $50, entonces el ticket promedio aumentara 15%, porque los clientes agregaran productos para alcanzar el umbral."

  • "Si reducimos el tiempo de respuesta de soporte a menos de 2 horas, entonces el NPS mejorara 10 puntos, porque la rapidez es el factor #1 de satisfaccion segun encuestas."

  • "Si enviamos recordatorios a usuarios inactivos a los 7 dias, entonces la reactivacion mejorara 25%, porque aun no han olvidado el producto."

El proceso de validacion

Una vez que tienes una hipotesis, el siguiente paso es diseñar como validarla.

Paso 1: Define que significa "validar"

Antes de analizar, decide:

  • Que resultado apoyaria la hipotesis?
  • Que resultado la refutaria?
  • Que resultado seria inconcluso?

Ejemplo:

Hipotesis: "El nuevo onboarding aumenta la activacion de usuarios."

Resultado Interpretacion
Activacion sube 10%+ Hipotesis apoyada
Activacion cambia entre -5% y +5% Resultado inconcluso
Activacion baja 5%+ Hipotesis refutada

Define estos umbrales ANTES de ver los datos. Esto evita la tentacion de interpretar cualquier resultado a tu favor.

Paso 2: Identifica los datos necesarios

Preguntas a responder:

  • Que datos necesito para probar esta hipotesis?
  • Los tenemos disponibles? Con que calidad?
  • Cual es el periodo de tiempo relevante?
  • Cual es el tamano de muestra necesario?

Ejemplo:

Hipotesis: "Los clientes que reciben el newsletter semanal tienen mayor retencion."

Datos necesarios:

  • Lista de clientes suscritos al newsletter
  • Historial de apertura de newsletters
  • Estado de retencion de cada cliente (activo/inactivo)
  • Periodo: Ultimos 12 meses
  • Tamano minimo: 500 clientes por grupo

Paso 3: Elige el metodo de validacion

Existen varios metodos, desde observacionales hasta experimentales:

Metodo 1: Analisis observacional

Comparas grupos que naturalmente difieren en la variable de interes.

Ventaja: Rapido, usa datos existentes. Desventaja: No puede establecer causalidad (correlacion solamente).

Ejemplo: Comparar retencion entre clientes que usan app vs no la usan.

Metodo 2: Cuasi-experimento

Analizas un cambio que ocurrio, comparando antes/despues o grupos afectados/no afectados.

Ventaja: Mas cercano a causalidad que observacional. Desventaja: Pueden existir factores externos que expliquen el cambio.

Ejemplo: Comparar ventas antes y despues de cambiar el precio.

Metodo 3: Experimento controlado (A/B test)

Asignas aleatoriamente a grupos y les das tratamientos diferentes.

Ventaja: El unico metodo que puede establecer causalidad. Desventaja: Requiere tiempo, infraestructura, y no siempre es posible.

Ejemplo: Mostrar diferentes versiones de landing page a usuarios aleatorios.

Tabla: Que metodo usar?

Situacion Metodo recomendado
Decision importante + tiempo disponible Experimento controlado
Exploracion inicial Analisis observacional
Cambio ya implementado Cuasi-experimento
No es posible/etico experimentar Analisis observacional + multiples fuentes
Necesitas direccion rapida Analisis observacional, luego experimento

Paso 4: Ejecuta el analisis

Con hipotesis clara, datos identificados y metodo elegido, ejecuta el analisis.

Principios clave durante ejecucion:

  1. Documenta todo: Decisiones, filtros aplicados, exclusiones hechas
  2. No cambies la hipotesis a mitad de camino
  3. Analiza segun el plan previamente definido
  4. Reporta honestamente incluso si el resultado no es el esperado

Paso 5: Interpreta resultados

Si la hipotesis fue apoyada:

  • Cual es la magnitud del efecto?
  • Es suficiente para actuar?
  • Necesitamos validacion adicional antes de escalar?

Si la hipotesis fue refutada:

  • Aprendimos algo valioso (que NO hacer)
  • La hipotesis estaba mal formulada?
  • Los datos eran adecuados para probarla?

Si el resultado fue inconcluso:

  • Necesitamos mas datos (muestra mayor)?
  • El efecto es demasiado pequeño para ser relevante?
  • Hay demasiado ruido en los datos?

Errores comunes en hipotesis y validacion

Error 1: Hipotesis demasiado vaga

Mala: "Mejorar la experiencia aumentara ventas"

Problema: Que significa "mejorar experiencia"? Cuanto aumento es "validacion"?

Mejor: "Reducir los pasos del checkout de 5 a 3 aumentara conversion 10%"

Error 2: Cambiar la hipotesis despues de ver datos

Ejemplo de trampa:

  1. Hipotesis: "El email de bienvenida aumenta activacion"
  2. Resultado: No hay efecto en activacion
  3. Revision: "Pero mira, los que abrieron el email si se activaron mas!"

Problema: Estas cambiando la hipotesis para que coincida con los datos. Esto invalida el analisis.

Solucion: Si descubres algo inesperado, formúlalo como NUEVA hipotesis a validar con nuevos datos.

Error 3: Ignorar resultados negativos

El sesgo de publicacion nos hace querer reportar solo exitos.

Problema: Los "fracasos" son igual de informativos. Saber que algo NO funciona evita desperdiciar recursos.

Solucion: Documenta y comparte hipotesis refutadas. Crea una "biblioteca de aprendizajes".

Error 4: No definir exito de antemano

Si no defines que resultado validaria tu hipotesis antes de analizar, terminaras interpretando cualquier resultado como validacion.

Solucion: Escribe tus umbrales de decision ANTES de ver los datos.

Error 5: Muestra insuficiente

Analizar 20 casos y concluir que hay una diferencia significativa.

Solucion: Calcula el tamano de muestra necesario antes de empezar. Si no tienes suficientes datos, espera o busca fuentes adicionales.

Framework practico: El canvas de hipotesis

Antes de cada analisis, completa este canvas:

CANVAS DE HIPOTESIS

1. HIPOTESIS
   "Creemos que [intervencion/variable] causa [resultado]
   porque [mecanismo]."

2. METRICAS
   - Metrica principal: _______________
   - Como se define: _______________
   - Periodo de medicion: _______________

3. DATOS NECESARIOS
   - Fuentes: _______________
   - Tamano de muestra minimo: _______________
   - Disponibilidad: _______________

4. METODO
   [ ] Observacional [ ] Cuasi-experimento [ ] Experimento

5. CRITERIOS DE EXITO (definir ANTES de analizar)
   - Hipotesis apoyada si: _______________
   - Hipotesis refutada si: _______________
   - Resultado inconcluso si: _______________

6. IMPLICACIONES
   - Si se valida, haremos: _______________
   - Si se refuta, haremos: _______________

7. RIESGOS Y LIMITACIONES
   - Variables no controladas: _______________
   - Sesgos posibles: _______________

Ejemplo completo: Aplicando el framework

Situacion

La empresa quiere saber si ofrecer una prueba gratuita de 14 dias (en lugar de 7) aumentaria las conversiones a pago.

Canvas completado

1. HIPOTESIS "Creemos que extender la prueba gratuita de 7 a 14 dias aumentara la conversion a pago en al menos 15%, porque los usuarios tendran mas tiempo para experimentar el valor del producto."

2. METRICAS

  • Metrica principal: Tasa de conversion de trial a pago
  • Como se define: (Usuarios que pagan en primeros 30 dias) / (Total que inicia trial)
  • Periodo de medicion: Cohorte de 8 semanas

3. DATOS NECESARIOS

  • Fuentes: Sistema de billing, base de usuarios
  • Tamano minimo: 1000 usuarios por grupo
  • Disponibilidad: Si, podemos hacer A/B test

4. METODO [X] Experimento: A/B test aleatorio

5. CRITERIOS DE EXITO

  • Apoyada si: Conversion aumenta 15%+ con significancia estadistica (p<0.05)
  • Refutada si: Conversion disminuye O aumenta menos de 5%
  • Inconcluso si: Aumenta 5-14% sin significancia estadistica

6. IMPLICACIONES

  • Si se valida: Implementar trial de 14 dias para todos
  • Si se refuta: Mantener trial de 7 dias, explorar otras intervenciones

7. RIESGOS

  • Variables no controladas: Calidad de leads podria variar en el periodo
  • Sesgos: Usuarios que eligen trial mas largo podrian ser diferentes

Cuando NO necesitas una hipotesis formal

Hay momentos donde la exploracion libre es apropiada:

  1. Analisis exploratorio inicial: Cuando no conoces bien los datos y necesitas familiarizarte
  2. Busqueda de anomalias: Detectar fraudes, errores, comportamientos inusuales
  3. Generacion de hipotesis: Buscando patrones que luego formalizaras como hipotesis

Pero: Incluso en estos casos, cualquier hallazgo "interesante" debe ser validado con una hipotesis formal y datos nuevos antes de actuar.

Checklist de validacion

Antes de concluir que una hipotesis fue validada:

  • La hipotesis fue definida ANTES de analizar?
  • Los criterios de exito fueron definidos previamente?
  • El tamano de muestra es suficiente?
  • El metodo es apropiado para el tipo de conclusion?
  • Consideramos explicaciones alternativas?
  • El resultado es estadisticamente significativo?
  • El efecto es suficientemente grande para importar?
  • Documentamos el proceso completo?

Puntos clave de esta leccion

  • Analizar sin hipotesis lleva a descubrimientos falsos y desperdicio de recursos
  • Una buena hipotesis es especifica, medible, falsificable y relevante
  • Define los criterios de exito ANTES de ver los datos
  • El metodo de validacion debe ser apropiado para el tipo de conclusion deseada
  • Los experimentos controlados son el unico metodo que puede establecer causalidad
  • Los resultados negativos son tan valiosos como los positivos

Proxima leccion

En el siguiente modulo comenzaremos con lectura de visualizaciones: aprenderemos a identificar que tipo de grafico usar en cada situacion y como leer correctamente la informacion que presentan.


Quiz de comprension

  1. Que hace que una hipotesis sea "falsificable" y por que es importante?
  2. Por que es importante definir criterios de exito antes de analizar?
  3. Cual es la diferencia clave entre un analisis observacional y un experimento controlado?
  4. Por que es problematico cambiar la hipotesis despues de ver los datos?

Completaste esta leccion?

Marca esta leccion como completada. Tu progreso se guardara en tu navegador.