¿Qué es el NVIDIA DGX Spark?
El NVIDIA DGX Spark es la primera supercomputadora de IA personal de escritorio de NVIDIA. Anunciado en el CES 2025, combina la GPU B200 (arquitectura Blackwell) con una CPU Grace ARM de 20 núcleos en un dispositivo del tamaño de un Mac Mini. Es esencialmente una versión compacta del DGX H100 que llenan racks enteros en centros de datos.
Especificaciones técnicas
GPU: 1x NVIDIA B200 con 128 GB de memoria HBM3e
CPU: NVIDIA Grace (ARM Neoverse N2) 20 núcleos
Memoria total unificada: 128 GB (GPU + CPU comparten el mismo pool)
Rendimiento: 1 Petaflop FP8 — suficiente para correr modelos de hasta 200 mil millones de parámetros localmente
Almacenamiento: NVMe SSD de alta velocidad
Conectividad: Thunderbolt 5, USB 4, HDMI, Ethernet 25GbE
Consumo: ~170W en carga máxima
Precio estimado: $3,000-5,000 USD
¿Para qué sirve?
El DGX Spark está diseñado para desarrolladores de IA e investigadores que necesitan inferir y entrenar modelos localmente sin depender de la nube. Casos de uso principales:
- Correr modelos Llama 3 70B o Gemma 3 27B localmente con velocidad real
- Fine-tuning de modelos pequeños con datos propietarios (sin subir datos a la nube)
- Desarrollo y pruebas de aplicaciones de IA antes de desplegar en producción
- Análisis de datos sensibles que no pueden salir del edificio
Comparativa vs cloud
Una instancia A100 en AWS cuesta ~$3 USD/hora. El DGX Spark se amortiza en ~1,000 horas de uso — menos de 6 meses para quienes trabajan con IA diariamente.
Software incluido
Viene con NVIDIA AI Enterprise, que incluye: CUDA 12, cuDNN 9, TensorRT, Triton Inference Server, NeMo para fine-tuning, y acceso a NGC (NVIDIA GPU Cloud) para descargar modelos preentrenados.