Lección 2 de 29Módulo 1: Fundamentos de Python

02. Instalación y Configuración del Entorno

Configura Python, Anaconda, Jupyter Notebook y tu primer entorno de desarrollo

20 minutos

En esta lección configurarás tu entorno de desarrollo completo para análisis de datos con Python. Al finalizar, tendrás instalado Python, Anaconda, Jupyter Notebook y escribirás tu primer código.

¿Qué vamos a instalar?

Anaconda: La distribución completa

Anaconda es una distribución de Python que incluye:

  • ✅ Python 3.11+ (la versión más reciente)
  • ✅ Jupyter Notebook (entorno interactivo)
  • ✅ +250 librerías científicas pre-instaladas (Pandas, NumPy, Matplotlib, etc.)
  • ✅ Conda (gestor de paquetes y entornos)
  • ✅ Anaconda Navigator (interfaz gráfica)

💡 ¿Por qué Anaconda y no Python solo? Anaconda te ahorra horas de configuración. Instala todo lo necesario para data analytics en un solo paso, evitando conflictos de dependencias que son comunes cuando instalas Python directamente.

Instalación paso a paso

Paso 1: Descargar Anaconda

  1. Visita anaconda.com/download
  2. Selecciona tu sistema operativo:
    • Windows: Descarga el instalador .exe
    • macOS: Descarga el instalador .pkg
    • Linux: Descarga el script .sh
  3. Descarga la versión más reciente (Python 3.11+)

Tamaño de descarga: ~600 MB (incluye todo lo necesario)

Paso 2: Instalar Anaconda

En Windows:

# 1. Ejecuta el instalador .exe
# 2. Acepta los términos de licencia
# 3. Selecciona "Just Me" (recomendado)
# 4. Ruta de instalación: C:\Users\TuNombre\anaconda3
# 5. ✅ MARCA "Add Anaconda to my PATH environment variable"
# 6. ✅ MARCA "Register Anaconda as my default Python"
# 7. Haz clic en "Install" (tardará 5-10 minutos)

En macOS:

# 1. Abre el archivo .pkg descargado
# 2. Sigue el asistente de instalación
# 3. Acepta la ubicación por defecto: /Users/TuNombre/anaconda3
# 4. Completa la instalación

En Linux:

# 1. Abre la terminal
# 2. Navega a la carpeta de descargas
cd ~/Downloads

# 3. Da permisos de ejecución al script
chmod +x Anaconda3-2024.XX-Linux-x86_64.sh

# 4. Ejecuta el instalador
bash Anaconda3-2024.XX-Linux-x86_64.sh

# 5. Acepta la licencia (presiona Enter y luego 'yes')
# 6. Confirma la ubicación de instalación (presiona Enter)
# 7. Cuando pregunte "Do you wish to update your shell profile?" → YES

Paso 3: Verificar la instalación

Abre una nueva terminal o Command Prompt y ejecuta:

# Verificar versión de Python
python --version
# Resultado esperado: Python 3.11.X

# Verificar versión de Conda
conda --version
# Resultado esperado: conda 24.X.X

# Verificar instalación de Jupyter
jupyter --version
# Resultado esperado: Lista de versiones de Jupyter

⚠️ Problema común: Si aparece "command not found" o "no se reconoce el comando", cierra completamente tu terminal y ábrela de nuevo. Anaconda necesita reiniciar la terminal para actualizar el PATH.

Tu primer Jupyter Notebook

¿Qué es Jupyter Notebook?

Jupyter Notebook es el entorno favorito de los analistas de datos porque:

  • 📝 Combina código, visualizaciones y texto explicativo en un solo documento
  • ▶️ Ejecutas código de forma interactiva (celda por celda)
  • 📊 Visualizas gráficos directamente en el documento
  • 🔄 Iteras rápidamente sin reejecutar todo el script

Iniciar Jupyter Notebook

# Opción 1: Desde la terminal
jupyter notebook

# Opción 2: Desde Anaconda Navigator
# 1. Abre Anaconda Navigator
# 2. Haz clic en "Launch" en Jupyter Notebook

Se abrirá automáticamente tu navegador en http://localhost:8888

Crear tu primer notebook

  1. Crea una carpeta para el curso:

    • En Jupyter, haz clic en "New" → "Folder"
    • Renombra la carpeta a "python-data-analytics"
    • Ingresa a la carpeta
  2. Crea un nuevo notebook:

    • Haz clic en "New" → "Python 3 (ipykernel)"
    • Renombra el notebook a "01-primer-notebook"

Tu primer código Python

Hello, Data World!

Escribe en la primera celda:

# Mi primer código Python
print("Hello, Data World!")
print("Estoy aprendiendo Python para análisis de datos")

Ejecutar: Presiona Shift + Enter o haz clic en el botón ▶️

Resultado esperado:

Hello, Data World!
Estoy aprendiendo Python para análisis de datos

Variables básicas

# Variables fundamentales
nombre = "Analista de Datos"
años_experiencia = 0  # Por ahora...
salario_objetivo = 95000
aprendiendo_python = True

print(f"Mi rol: {nombre}")
print(f"Experiencia: {años_experiencia} años")
print(f"Objetivo salarial: ${salario_objetivo:,}")
print(f"¿Aprendiendo Python?: {aprendiendo_python}")

Resultado:

Mi rol: Analista de Datos
Experiencia: 0 años
Objetivo salarial: $95,000
¿Aprendiendo Python?: True

Operaciones matemáticas

# Análisis de datos básico
ventas_enero = 150000
ventas_febrero = 180000
ventas_marzo = 165000

# Calcular total y promedio
total_ventas = ventas_enero + ventas_febrero + ventas_marzo
promedio_ventas = total_ventas / 3
crecimiento = ((ventas_marzo - ventas_enero) / ventas_enero) * 100

print(f"Total de ventas Q1: ${total_ventas:,}")
print(f"Promedio mensual: ${promedio_ventas:,.2f}")
print(f"Crecimiento Jan-Mar: {crecimiento:.1f}%")

Resultado:

Total de ventas Q1: $495,000
Promedio mensual: $165,000.00
Crecimiento Jan-Mar: 10.0%

Tu primer análisis de datos

Vamos a analizar datos reales con Python puro (sin librerías todavía):

# Dataset simple: ventas diarias de una semana
ventas_diarias = [1200, 1450, 1100, 1800, 1950, 2100, 1750]
dias = ["Lun", "Mar", "Mié", "Jue", "Vie", "Sáb", "Dom"]

# Análisis exploratorio básico
total = sum(ventas_diarias)
promedio = total / len(ventas_diarias)
mejor_dia = max(ventas_diarias)
peor_dia = min(ventas_diarias)

# Encontrar qué día tuvo mejor/peor venta
indice_mejor = ventas_diarias.index(mejor_dia)
indice_peor = ventas_diarias.index(peor_dia)

print("=== REPORTE DE VENTAS SEMANALES ===")
print(f"Total: ${total:,}")
print(f"Promedio diario: ${promedio:,.2f}")
print(f"Mejor día: {dias[indice_mejor]} (${mejor_dia:,})")
print(f"Peor día: {dias[indice_peor]} (${peor_dia:,})")
print(f"Variación: ${mejor_dia - peor_dia:,}")

Resultado:

=== REPORTE DE VENTAS SEMANALES ===
Total: $11,350
Promedio diario: $1,621.43
Mejor día: Sáb ($2,100)
Peor día: Mié ($1,100)
Variación: $1,000

Anatomía de Jupyter Notebook

Tipos de celdas

Code cells (celdas de código):

# Aquí escribes código Python
resultado = 2 + 2
print(resultado)

Markdown cells (celdas de texto):

# Título de sección
## Subsección

Texto explicativo con **negritas** y *itálicas*.

- Lista 1
- Lista 2

Atajos de teclado esenciales

Atajo Acción
Shift + Enter Ejecutar celda y avanzar
Ctrl + Enter Ejecutar celda (quedarse)
A Insertar celda arriba
B Insertar celda abajo
DD Eliminar celda
M Convertir a Markdown
Y Convertir a Code
Tab Autocompletar
Shift + Tab Mostrar documentación

💡 Pro tip: Presiona H en modo comando para ver todos los atajos de teclado disponibles.

Instalar librerías adicionales

Aunque Anaconda incluye las librerías principales, a veces necesitarás instalar otras:

# Instalar una librería con conda (preferido)
conda install nombre-libreria

# Instalar con pip (alternativa)
pip install nombre-libreria

# Actualizar una librería
conda update nombre-libreria

# Listar todas las librerías instaladas
conda list

Verificar librerías para data analytics

# Verificar que las librerías clave estén instaladas
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

print(f"Pandas version: {pd.__version__}")
print(f"NumPy version: {np.__version__}")
print(f"Matplotlib version: {plt.matplotlib.__version__}")
print(f"Seaborn version: {sns.__version__}")

print("\n✅ Todas las librerías están instaladas correctamente!")

Resultado esperado:

Pandas version: 2.X.X
NumPy version: 1.2X.X
Matplotlib version: 3.X.X
Seaborn version: 0.1X.X

✅ Todas las librerías están instaladas correctamente!

Entornos virtuales con Conda

Los entornos virtuales te permiten tener diferentes configuraciones de Python para diferentes proyectos:

# Crear un entorno nuevo
conda create --name data-analytics python=3.11

# Activar el entorno
conda activate data-analytics

# Desactivar el entorno
conda deactivate

# Listar todos los entornos
conda env list

# Eliminar un entorno
conda env remove --name nombre-entorno

🎯 Buena práctica: Crea un entorno específico para cada proyecto importante. Esto evita conflictos entre versiones de librerías.

Configuración de VS Code (opcional pero recomendado)

Muchos analistas profesionales usan Visual Studio Code además de Jupyter:

Instalar VS Code

  1. Descarga desde code.visualstudio.com
  2. Instala las siguientes extensiones:
    • Python (de Microsoft)
    • Jupyter (de Microsoft)
    • Pylance (para autocompletado avanzado)

Ventajas de VS Code

  • ✅ Intellisense potente (autocompletado inteligente)
  • ✅ Debugging avanzado
  • ✅ Git integrado
  • ✅ Terminal integrada
  • ✅ Puede ejecutar Jupyter notebooks directamente

Solución de problemas comunes

Problema 1: "conda no se reconoce como comando"

Solución Windows:

# Agregar Anaconda al PATH manualmente
# 1. Busca "Variables de entorno" en el menú inicio
# 2. Edita "Path" en Variables del sistema
# 3. Agrega: C:\Users\TuNombre\anaconda3
# 4. Agrega: C:\Users\TuNombre\anaconda3\Scripts
# 5. Reinicia la terminal

Solución macOS/Linux:

# Agregar Anaconda al PATH
echo 'export PATH="$HOME/anaconda3/bin:$PATH"' >> ~/.bashrc
source ~/.bashrc

Problema 2: Jupyter no encuentra kernel

# Reinstalar el kernel de Python
python -m ipykernel install --user

Problema 3: Error al importar librerías

# Actualizar Anaconda y todas las librerías
conda update --all

# Si persiste, reinstalar la librería específica
conda uninstall nombre-libreria
conda install nombre-libreria

Checklist de instalación

Antes de continuar a la siguiente lección, verifica:

  • ✅ Anaconda instalado correctamente
  • python --version funciona en terminal
  • conda --version funciona en terminal
  • ✅ Jupyter Notebook abre en el navegador
  • ✅ Puedes crear y ejecutar celdas en Jupyter
  • ✅ Puedes importar pandas, numpy, matplotlib sin errores
  • ✅ Creaste tu carpeta "python-data-analytics"

Recursos adicionales

Documentación oficial

Tutoriales en video

  • "How to Install Anaconda for Data Science" (YouTube)
  • "Jupyter Notebook Tutorial for Beginners" (YouTube)

Cheat sheets útiles

Resumen de la lección

Anaconda es la distribución completa de Python para data analytics ✅ Jupyter Notebook es el entorno interactivo favorito de analistas ✅ Aprendiste a crear notebooks, ejecutar código y usar atajos de teclado ✅ Escribiste tu primer código Python y realizaste análisis básicos ✅ Configuraste tu entorno completo y verificaste que todo funciona


🎯 Próxima lección: 03. Variables, Tipos de Datos y Operadores

¡Tu entorno está listo! En la siguiente lección aprenderás los fundamentos de Python: variables, tipos de datos y operadores. 🚀

¿Completaste esta lección?

Marca esta lección como completada. Tu progreso se guardará en tu navegador.