02. Instalación y Configuración del Entorno
Configura Python, Anaconda, Jupyter Notebook y tu primer entorno de desarrollo
En esta lección configurarás tu entorno de desarrollo completo para análisis de datos con Python. Al finalizar, tendrás instalado Python, Anaconda, Jupyter Notebook y escribirás tu primer código.
¿Qué vamos a instalar?
Anaconda: La distribución completa
Anaconda es una distribución de Python que incluye:
- ✅ Python 3.11+ (la versión más reciente)
- ✅ Jupyter Notebook (entorno interactivo)
- ✅ +250 librerías científicas pre-instaladas (Pandas, NumPy, Matplotlib, etc.)
- ✅ Conda (gestor de paquetes y entornos)
- ✅ Anaconda Navigator (interfaz gráfica)
💡 ¿Por qué Anaconda y no Python solo? Anaconda te ahorra horas de configuración. Instala todo lo necesario para data analytics en un solo paso, evitando conflictos de dependencias que son comunes cuando instalas Python directamente.
Instalación paso a paso
Paso 1: Descargar Anaconda
- Visita anaconda.com/download
- Selecciona tu sistema operativo:
- Windows: Descarga el instalador
.exe - macOS: Descarga el instalador
.pkg - Linux: Descarga el script
.sh
- Windows: Descarga el instalador
- Descarga la versión más reciente (Python 3.11+)
Tamaño de descarga: ~600 MB (incluye todo lo necesario)
Paso 2: Instalar Anaconda
En Windows:
# 1. Ejecuta el instalador .exe
# 2. Acepta los términos de licencia
# 3. Selecciona "Just Me" (recomendado)
# 4. Ruta de instalación: C:\Users\TuNombre\anaconda3
# 5. ✅ MARCA "Add Anaconda to my PATH environment variable"
# 6. ✅ MARCA "Register Anaconda as my default Python"
# 7. Haz clic en "Install" (tardará 5-10 minutos)
En macOS:
# 1. Abre el archivo .pkg descargado
# 2. Sigue el asistente de instalación
# 3. Acepta la ubicación por defecto: /Users/TuNombre/anaconda3
# 4. Completa la instalación
En Linux:
# 1. Abre la terminal
# 2. Navega a la carpeta de descargas
cd ~/Downloads
# 3. Da permisos de ejecución al script
chmod +x Anaconda3-2024.XX-Linux-x86_64.sh
# 4. Ejecuta el instalador
bash Anaconda3-2024.XX-Linux-x86_64.sh
# 5. Acepta la licencia (presiona Enter y luego 'yes')
# 6. Confirma la ubicación de instalación (presiona Enter)
# 7. Cuando pregunte "Do you wish to update your shell profile?" → YES
Paso 3: Verificar la instalación
Abre una nueva terminal o Command Prompt y ejecuta:
# Verificar versión de Python
python --version
# Resultado esperado: Python 3.11.X
# Verificar versión de Conda
conda --version
# Resultado esperado: conda 24.X.X
# Verificar instalación de Jupyter
jupyter --version
# Resultado esperado: Lista de versiones de Jupyter
⚠️ Problema común: Si aparece "command not found" o "no se reconoce el comando", cierra completamente tu terminal y ábrela de nuevo. Anaconda necesita reiniciar la terminal para actualizar el PATH.
Tu primer Jupyter Notebook
¿Qué es Jupyter Notebook?
Jupyter Notebook es el entorno favorito de los analistas de datos porque:
- 📝 Combina código, visualizaciones y texto explicativo en un solo documento
- ▶️ Ejecutas código de forma interactiva (celda por celda)
- 📊 Visualizas gráficos directamente en el documento
- 🔄 Iteras rápidamente sin reejecutar todo el script
Iniciar Jupyter Notebook
# Opción 1: Desde la terminal
jupyter notebook
# Opción 2: Desde Anaconda Navigator
# 1. Abre Anaconda Navigator
# 2. Haz clic en "Launch" en Jupyter Notebook
Se abrirá automáticamente tu navegador en http://localhost:8888
Crear tu primer notebook
Crea una carpeta para el curso:
- En Jupyter, haz clic en "New" → "Folder"
- Renombra la carpeta a "python-data-analytics"
- Ingresa a la carpeta
Crea un nuevo notebook:
- Haz clic en "New" → "Python 3 (ipykernel)"
- Renombra el notebook a "01-primer-notebook"
Tu primer código Python
Hello, Data World!
Escribe en la primera celda:
# Mi primer código Python
print("Hello, Data World!")
print("Estoy aprendiendo Python para análisis de datos")
Ejecutar: Presiona Shift + Enter o haz clic en el botón ▶️
Resultado esperado:
Hello, Data World!
Estoy aprendiendo Python para análisis de datos
Variables básicas
# Variables fundamentales
nombre = "Analista de Datos"
años_experiencia = 0 # Por ahora...
salario_objetivo = 95000
aprendiendo_python = True
print(f"Mi rol: {nombre}")
print(f"Experiencia: {años_experiencia} años")
print(f"Objetivo salarial: ${salario_objetivo:,}")
print(f"¿Aprendiendo Python?: {aprendiendo_python}")
Resultado:
Mi rol: Analista de Datos
Experiencia: 0 años
Objetivo salarial: $95,000
¿Aprendiendo Python?: True
Operaciones matemáticas
# Análisis de datos básico
ventas_enero = 150000
ventas_febrero = 180000
ventas_marzo = 165000
# Calcular total y promedio
total_ventas = ventas_enero + ventas_febrero + ventas_marzo
promedio_ventas = total_ventas / 3
crecimiento = ((ventas_marzo - ventas_enero) / ventas_enero) * 100
print(f"Total de ventas Q1: ${total_ventas:,}")
print(f"Promedio mensual: ${promedio_ventas:,.2f}")
print(f"Crecimiento Jan-Mar: {crecimiento:.1f}%")
Resultado:
Total de ventas Q1: $495,000
Promedio mensual: $165,000.00
Crecimiento Jan-Mar: 10.0%
Tu primer análisis de datos
Vamos a analizar datos reales con Python puro (sin librerías todavía):
# Dataset simple: ventas diarias de una semana
ventas_diarias = [1200, 1450, 1100, 1800, 1950, 2100, 1750]
dias = ["Lun", "Mar", "Mié", "Jue", "Vie", "Sáb", "Dom"]
# Análisis exploratorio básico
total = sum(ventas_diarias)
promedio = total / len(ventas_diarias)
mejor_dia = max(ventas_diarias)
peor_dia = min(ventas_diarias)
# Encontrar qué día tuvo mejor/peor venta
indice_mejor = ventas_diarias.index(mejor_dia)
indice_peor = ventas_diarias.index(peor_dia)
print("=== REPORTE DE VENTAS SEMANALES ===")
print(f"Total: ${total:,}")
print(f"Promedio diario: ${promedio:,.2f}")
print(f"Mejor día: {dias[indice_mejor]} (${mejor_dia:,})")
print(f"Peor día: {dias[indice_peor]} (${peor_dia:,})")
print(f"Variación: ${mejor_dia - peor_dia:,}")
Resultado:
=== REPORTE DE VENTAS SEMANALES ===
Total: $11,350
Promedio diario: $1,621.43
Mejor día: Sáb ($2,100)
Peor día: Mié ($1,100)
Variación: $1,000
Anatomía de Jupyter Notebook
Tipos de celdas
Code cells (celdas de código):
# Aquí escribes código Python
resultado = 2 + 2
print(resultado)
Markdown cells (celdas de texto):
# Título de sección
## Subsección
Texto explicativo con **negritas** y *itálicas*.
- Lista 1
- Lista 2
Atajos de teclado esenciales
| Atajo | Acción |
|---|---|
Shift + Enter |
Ejecutar celda y avanzar |
Ctrl + Enter |
Ejecutar celda (quedarse) |
A |
Insertar celda arriba |
B |
Insertar celda abajo |
DD |
Eliminar celda |
M |
Convertir a Markdown |
Y |
Convertir a Code |
Tab |
Autocompletar |
Shift + Tab |
Mostrar documentación |
💡 Pro tip: Presiona
Hen modo comando para ver todos los atajos de teclado disponibles.
Instalar librerías adicionales
Aunque Anaconda incluye las librerías principales, a veces necesitarás instalar otras:
# Instalar una librería con conda (preferido)
conda install nombre-libreria
# Instalar con pip (alternativa)
pip install nombre-libreria
# Actualizar una librería
conda update nombre-libreria
# Listar todas las librerías instaladas
conda list
Verificar librerías para data analytics
# Verificar que las librerías clave estén instaladas
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
print(f"Pandas version: {pd.__version__}")
print(f"NumPy version: {np.__version__}")
print(f"Matplotlib version: {plt.matplotlib.__version__}")
print(f"Seaborn version: {sns.__version__}")
print("\n✅ Todas las librerías están instaladas correctamente!")
Resultado esperado:
Pandas version: 2.X.X
NumPy version: 1.2X.X
Matplotlib version: 3.X.X
Seaborn version: 0.1X.X
✅ Todas las librerías están instaladas correctamente!
Entornos virtuales con Conda
Los entornos virtuales te permiten tener diferentes configuraciones de Python para diferentes proyectos:
# Crear un entorno nuevo
conda create --name data-analytics python=3.11
# Activar el entorno
conda activate data-analytics
# Desactivar el entorno
conda deactivate
# Listar todos los entornos
conda env list
# Eliminar un entorno
conda env remove --name nombre-entorno
🎯 Buena práctica: Crea un entorno específico para cada proyecto importante. Esto evita conflictos entre versiones de librerías.
Configuración de VS Code (opcional pero recomendado)
Muchos analistas profesionales usan Visual Studio Code además de Jupyter:
Instalar VS Code
- Descarga desde code.visualstudio.com
- Instala las siguientes extensiones:
- Python (de Microsoft)
- Jupyter (de Microsoft)
- Pylance (para autocompletado avanzado)
Ventajas de VS Code
- ✅ Intellisense potente (autocompletado inteligente)
- ✅ Debugging avanzado
- ✅ Git integrado
- ✅ Terminal integrada
- ✅ Puede ejecutar Jupyter notebooks directamente
Solución de problemas comunes
Problema 1: "conda no se reconoce como comando"
Solución Windows:
# Agregar Anaconda al PATH manualmente
# 1. Busca "Variables de entorno" en el menú inicio
# 2. Edita "Path" en Variables del sistema
# 3. Agrega: C:\Users\TuNombre\anaconda3
# 4. Agrega: C:\Users\TuNombre\anaconda3\Scripts
# 5. Reinicia la terminal
Solución macOS/Linux:
# Agregar Anaconda al PATH
echo 'export PATH="$HOME/anaconda3/bin:$PATH"' >> ~/.bashrc
source ~/.bashrc
Problema 2: Jupyter no encuentra kernel
# Reinstalar el kernel de Python
python -m ipykernel install --user
Problema 3: Error al importar librerías
# Actualizar Anaconda y todas las librerías
conda update --all
# Si persiste, reinstalar la librería específica
conda uninstall nombre-libreria
conda install nombre-libreria
Checklist de instalación
Antes de continuar a la siguiente lección, verifica:
- ✅ Anaconda instalado correctamente
- ✅
python --versionfunciona en terminal - ✅
conda --versionfunciona en terminal - ✅ Jupyter Notebook abre en el navegador
- ✅ Puedes crear y ejecutar celdas en Jupyter
- ✅ Puedes importar pandas, numpy, matplotlib sin errores
- ✅ Creaste tu carpeta "python-data-analytics"
Recursos adicionales
Documentación oficial
Tutoriales en video
- "How to Install Anaconda for Data Science" (YouTube)
- "Jupyter Notebook Tutorial for Beginners" (YouTube)
Cheat sheets útiles
Resumen de la lección
✅ Anaconda es la distribución completa de Python para data analytics ✅ Jupyter Notebook es el entorno interactivo favorito de analistas ✅ Aprendiste a crear notebooks, ejecutar código y usar atajos de teclado ✅ Escribiste tu primer código Python y realizaste análisis básicos ✅ Configuraste tu entorno completo y verificaste que todo funciona
🎯 Próxima lección: 03. Variables, Tipos de Datos y Operadores
¡Tu entorno está listo! En la siguiente lección aprenderás los fundamentos de Python: variables, tipos de datos y operadores. 🚀
¿Completaste esta lección?
Marca esta lección como completada. Tu progreso se guardará en tu navegador.