Lección 4 de 28Tipos de Datos y Fuentes

Tipos de datos: cuantitativos vs cualitativos

Entiende las categorías fundamentales de datos.

15 minutos

Antes de poder analizar cualquier dato, necesitas entender qué tipo de dato tienes enfrente. Esta distinción fundamental determina qué análisis puedes hacer, qué visualizaciones tienen sentido, y qué conclusiones son válidas.

La clasificación fundamental

Todos los datos del universo caen en una de dos categorías principales:

Datos cuantitativos (Números)

Son datos que representan cantidades medibles. Puedes sumarlos, promediarlos, y hacer operaciones matemáticas con ellos.

Ejemplos:

  • Ventas en dólares: $45,000
  • Número de clientes: 1,250
  • Tiempo de respuesta: 3.5 horas
  • Temperatura: 22°C
  • Porcentaje de conversión: 12.5%

Datos cualitativos (Categorías)

Son datos que representan características o cualidades. Los describes con palabras, no con operaciones matemáticas.

Ejemplos:

  • Estado del cliente: "Activo", "Inactivo", "Cancelado"
  • Región: "Norte", "Sur", "Centro"
  • Satisfacción: "Muy satisfecho", "Satisfecho", "Insatisfecho"
  • Tipo de producto: "Premium", "Estándar", "Básico"
  • Color preferido: "Azul", "Rojo", "Verde"

Por qué importa esta distinción

La diferencia no es solo académica. Determina:

Aspecto Cuantitativos Cualitativos
Operaciones Promedio, suma, mediana Conteo, frecuencia, moda
Gráficos Líneas, histogramas, scatter Barras, pie, treemaps
Análisis Correlación, regresión Chi-cuadrado, análisis de clusters
Preguntas "¿Cuánto?" "¿Cuántos?" "¿Qué tipo?" "¿Cuál?"

Error común: Tratar categorías como números

Uno de los errores más frecuentes es promediar datos que parecen numéricos pero son categóricos:

Ejemplo del rating de satisfacción:

Una empresa encuesta a clientes con escala del 1 al 5:

  • 1 = Muy insatisfecho
  • 2 = Insatisfecho
  • 3 = Neutral
  • 4 = Satisfecho
  • 5 = Muy satisfecho

Resultados: [5, 4, 5, 4, 1, 5, 4, 5, 4, 1]

Análisis erróneo: "El promedio es 3.8, así que estamos bien"

Análisis correcto: "80% de clientes están satisfechos o muy satisfechos. Pero tenemos 20% muy insatisfechos, una señal de alerta que el promedio oculta."

El promedio de una escala categórica ordinal puede ser técnicamente calculable pero conceptualmente engañoso.

Subtipos de datos cuantitativos

Los datos cuantitativos se dividen en dos subtipos con diferencias importantes:

Datos continuos

Pueden tomar cualquier valor dentro de un rango, incluyendo decimales y fracciones.

Ejemplos:

  • Peso: 68.7 kg
  • Temperatura: 22.4°C
  • Tiempo: 3.75 horas
  • Porcentaje: 45.82%

Características:

  • Puedes medirlos con precisión infinita (limitada solo por tu instrumento)
  • Entre cualquier dos valores, existe otro valor posible
  • Se visualizan bien con histogramas y gráficos de línea

Datos discretos

Solo pueden tomar valores específicos, generalmente enteros. No hay valores intermedios.

Ejemplos:

  • Número de empleados: 45 (no puedes tener 45.5 empleados)
  • Cantidad de productos vendidos: 120
  • Número de quejas: 8
  • Hijos: 2

Características:

  • Usualmente son conteos de cosas
  • No tiene sentido el valor intermedio
  • Se visualizan bien con gráficos de barras

Tabla comparativa

Característica Continuo Discreto
Valores posibles Infinitos entre dos puntos Finitos, específicos
Decimales Siempre posibles Generalmente no
Origen típico Mediciones Conteos
Ejemplo clásico Altura (1.75m) Personas (3)

Subtipos de datos cualitativos

Los datos cualitativos también tienen subtipos cruciales:

Datos nominales

Son categorías sin orden intrínseco. No hay uno "mayor" o "menor" que otro.

Ejemplos:

  • Colores: Rojo, Azul, Verde
  • Departamento: Marketing, Ventas, Finanzas
  • País de origen: México, Colombia, Argentina
  • Tipo de pago: Tarjeta, Efectivo, Transferencia

Características:

  • Solo puedes contar frecuencias
  • No tiene sentido ordenarlos (aunque puedes ordenar por frecuencia)
  • La moda es la única medida de tendencia central válida

Datos ordinales

Son categorías con orden implícito, pero la distancia entre ellas no es uniforme ni medible.

Ejemplos:

  • Nivel educativo: Primaria < Secundaria < Universidad < Postgrado
  • Satisfacción: Muy insatisfecho < Insatisfecho < Neutral < Satisfecho < Muy satisfecho
  • Tamaño de camiseta: XS < S < M < L < XL
  • Prioridad: Baja < Media < Alta < Crítica

Características:

  • Puedes ordenarlos de menor a mayor
  • No puedes asumir que la diferencia entre niveles es igual
  • La mediana es más apropiada que el promedio

La trampa de los ordinales

Ejemplo del nivel educativo:

Si asignamos números:

  • Primaria = 1
  • Secundaria = 2
  • Universidad = 3
  • Postgrado = 4

¿Significa que la diferencia entre Primaria y Secundaria es igual que entre Universidad y Postgrado? Absolutamente no.

El "salto" de años de estudio es diferente. La complejidad es diferente. No puedes hacer: (1 + 4) / 2 = 2.5 = "Secundaria y media".

Regla de oro: Solo porque algo tiene números no significa que puedas hacer matemáticas con él.

El caso especial de los datos binarios

Los datos binarios son un subtipo especial que puede tratarse como cuantitativo o cualitativo:

Ejemplos:

  • Cliente activo: Sí/No (o 1/0)
  • Email abierto: Abierto/No abierto
  • Género: Masculino/Femenino
  • Aprobado: Sí/No

La dualidad:

  • Como cualitativo: "50% de clientes están activos"
  • Como cuantitativo: "El promedio de activación es 0.5"

Ambos análisis son válidos porque en datos binarios, el promedio de 0s y 1s es igual al porcentaje de 1s.

Cómo identificar el tipo de dato correcto

Usa estas preguntas diagnósticas:

Pregunta 1: ¿Tiene sentido el promedio?

Si el promedio tiene sentido... Ejemplo Tipo
Sí, claramente "Promedio de ventas: $1,200" Cuantitativo
Sí, pero cuidado "Promedio de satisfacción: 4.2" Cuantitativo (pero ordinal)
No, es absurdo "Promedio de departamentos: 2.3" Cualitativo

Pregunta 2: ¿Puedes ordenarlo naturalmente?

Si el orden... Tipo
Es inherente y objetivo Ordinal o Cuantitativo
Depende de cómo lo mires Nominal
No existe Nominal

Pregunta 3: ¿La distancia entre valores es uniforme?

Si la distancia... Tipo
Es uniforme y medible (ej: $100, $200, $300) Cuantitativo
Existe orden pero distancia variable Ordinal
No hay distancia, solo categorías Nominal

Árbol de decisión visual

¿El dato representa una cantidad medible?
│
├── SÍ → ¿Puede tomar cualquier valor en un rango?
│        │
│        ├── SÍ → CUANTITATIVO CONTINUO
│        │
│        └── NO (solo enteros/conteos) → CUANTITATIVO DISCRETO
│
└── NO → ¿Las categorías tienen un orden natural?
         │
         ├── SÍ → CUALITATIVO ORDINAL
         │
         └── NO → CUALITATIVO NOMINAL

Ejemplos prácticos por área de negocio

Marketing

Dato Tipo Subtipo Por qué
Gasto en publicidad Cuantitativo Continuo Cantidad medible en decimales
Canal de adquisición Cualitativo Nominal Categorías sin orden
Calificación de campaña (A,B,C,D) Cualitativo Ordinal Categorías con orden
CTR (Click-Through Rate) Cuantitativo Continuo Porcentaje medible
Número de leads Cuantitativo Discreto Conteo de personas

Ventas

Dato Tipo Subtipo Por qué
Monto de venta Cuantitativo Continuo Cantidad en dinero
Etapa del pipeline Cualitativo Ordinal Prospecto < Calificado < Propuesta < Cierre
Industria del cliente Cualitativo Nominal Sin orden natural
Días para cerrar Cuantitativo Discreto Conteo de días
Tamaño de empresa (PYME, Enterprise) Cualitativo Ordinal Orden por tamaño

Recursos Humanos

Dato Tipo Subtipo Por qué
Salario Cuantitativo Continuo Cantidad de dinero
Departamento Cualitativo Nominal Sin orden
Nivel del puesto (Junior, Senior, Lead) Cualitativo Ordinal Jerarquía
Años de experiencia Cuantitativo Continuo Tiempo medible
Número de certificaciones Cuantitativo Discreto Conteo

Operaciones

Dato Tipo Subtipo Por qué
Tiempo de entrega Cuantitativo Continuo Horas/días medibles
Estado del pedido Cualitativo Ordinal Pendiente < En proceso < Enviado < Entregado
Proveedor Cualitativo Nominal Sin orden
Cantidad en inventario Cuantitativo Discreto Conteo de unidades
Porcentaje de defectos Cuantitativo Continuo Ratio medible

Conversión entre tipos de datos

A veces necesitas convertir datos de un tipo a otro:

Cuantitativo a Cualitativo (Binning/Agrupación)

Ejemplo: Edad (continuo) → Grupo de edad (ordinal)

Edad original Grupo de edad
18-25 Jóvenes
26-35 Adultos jóvenes
36-50 Adultos
51+ Adultos mayores

Cuándo hacerlo:

  • Para simplificar análisis
  • Para crear segmentos accionables
  • Para proteger privacidad

Riesgo: Pierdes precisión y granularidad.

Cualitativo a Cuantitativo (Codificación)

Ejemplo: Satisfacción (ordinal) → Número (discreto)

Nivel Código
Muy insatisfecho 1
Insatisfecho 2
Neutral 3
Satisfecho 4
Muy satisfecho 5

Cuándo hacerlo:

  • Para usar en modelos estadísticos
  • Para calcular scores compuestos

Riesgo: Asumes que las distancias son iguales cuando quizás no lo son.

Ejercicio práctico: Clasifica estos datos

Para cada dato, indica si es cuantitativo o cualitativo, y su subtipo:

Dato Tipo Subtipo
1. Temperatura del servidor (°C)
2. Estado del ticket (Abierto/En progreso/Cerrado)
3. Número de seguidores en redes sociales
4. Tipo de dispositivo (Mobile/Desktop/Tablet)
5. NPS Score (-100 a +100)
6. Código postal
7. Hora del día (0-24)
8. Frecuencia de compra (Ocasional/Regular/Frecuente)
9. Duración de llamada en segundos
10. Motivo de contacto

Respuestas

  1. Temperatura del servidor: Cuantitativo, Continuo
  2. Estado del ticket: Cualitativo, Ordinal
  3. Número de seguidores: Cuantitativo, Discreto
  4. Tipo de dispositivo: Cualitativo, Nominal
  5. NPS Score: Cuantitativo, Continuo (aunque se derive de ordinales)
  6. Código postal: Cualitativo, Nominal (los números no tienen significado matemático)
  7. Hora del día: Cuantitativo, Continuo (es tiempo)
  8. Frecuencia de compra: Cualitativo, Ordinal
  9. Duración de llamada: Cuantitativo, Continuo
  10. Motivo de contacto: Cualitativo, Nominal

Nota sobre código postal: Este es un ejemplo clásico de dato que parece numérico pero es categórico. El código 01000 no es "menor" que 99999 de manera significativa. No puedes promediar códigos postales.

Puntos clave de esta lección

  • Los datos se dividen en cuantitativos (números medibles) y cualitativos (categorías)
  • Los cuantitativos pueden ser continuos (cualquier valor) o discretos (valores específicos)
  • Los cualitativos pueden ser nominales (sin orden) u ordinales (con orden)
  • Solo porque algo tenga números no significa que puedas hacer matemáticas con él
  • El tipo de dato determina qué análisis y visualizaciones son válidos
  • Puedes convertir entre tipos, pero siempre hay trade-offs

Próxima lección

En la siguiente lección, exploraremos dónde viven los datos en tu empresa: las fuentes internas y externas que alimentan tus análisis.


Quiz de comprensión

  1. ¿Cuál es la diferencia fundamental entre datos cuantitativos y cualitativos?
  2. ¿Por qué no deberías promediar códigos postales aunque sean números?
  3. ¿Qué característica distingue a los datos ordinales de los nominales?
  4. ¿Cuál es la diferencia entre datos continuos y discretos?
  5. Da un ejemplo de un dato que parece numérico pero es realmente cualitativo.

Completaste esta leccion?

Marca esta leccion como completada. Tu progreso se guardara en tu navegador.