DeepSeek V4 se lanza con NVIDIA Blackwell, habilitando IA de contexto de 1M de tokens

Iris Coleman 25 abr 2026 00:10

DeepSeek V4, impulsado por NVIDIA Blackwell, ofrece IA de contexto de 1M de tokens con menor sobrecarga de memoria e inferencia más rápida, orientado a flujos de trabajo de contexto largo.

DeepSeek V4 se lanza con NVIDIA Blackwell, habilitando IA de contexto de 1M de tokens

DeepSeek ha presentado sus modelos de IA de cuarta generación, DeepSeek-V4-Pro y DeepSeek-V4-Flash, ampliando los límites de la inferencia de contexto largo. Estos modelos, disponibles ahora a través de los endpoints acelerados por GPU Blackwell de NVIDIA, están diseñados para gestionar hasta una ventana de contexto de 1 millón de tokens, un avance significativo para aplicaciones como programación avanzada, análisis de documentos y flujos de trabajo de IA agéntica.

El insignia DeepSeek-V4-Pro cuenta con 1,6 billones de parámetros totales y 49 000 millones de parámetros activos, mientras que el DeepSeek-V4-Flash, más orientado a la eficiencia, presenta 284 000 millones de parámetros totales y 13 000 millones de parámetros activos. Ambos modelos tienen licencia MIT y se adaptan a casos de uso diferenciados: Pro para razonamiento avanzado y Flash para tareas de alta velocidad como resúmenes y enrutamiento.

Avances arquitectónicos para la IA de contexto largo

DeepSeek V4 se basa en la arquitectura Mixture-of-Experts (MoE) de la compañía, introduciendo innovaciones orientadas a superar los desafíos de la inferencia de contexto largo. El nuevo mecanismo de atención híbrido combina Compressed Sparse Attention (CSA) y Heavily Compressed Attention (HCA), logrando una reducción del 73% en los FLOPs de inferencia por token y una reducción del 90% en el uso de memoria caché KV en comparación con su predecesor, DeepSeek V3.2.

¿Por qué es importante esto? A medida que las ventanas de contexto se amplían, gestionar la eficiencia de memoria y cómputo se vuelve crucial. Las aplicaciones de IA de contexto largo, como el razonamiento de múltiples turnos, la integración de herramientas y los flujos de trabajo extensos, requieren modelos que puedan retener y procesar grandes cantidades de datos contextuales sin cuellos de botella. Las mejoras de DeepSeek V4 abordan estos puntos críticos, convirtiéndolo en un sólido candidato para empresas que buscan escalar sistemas impulsados por IA.

Integración con NVIDIA Blackwell

DeepSeek V4 está estrechamente integrado con la plataforma Blackwell de NVIDIA, aprovechando su infraestructura acelerada por GPU para un rendimiento escalable. Las pruebas iniciales en el hardware NVIDIA GB200 NVL72 muestran que DeepSeek-V4-Pro supera los 150 tokens por segundo por usuario, con optimizaciones en curso que se espera mejoren aún más el rendimiento.

La arquitectura de Blackwell está diseñada para modelos de inteligencia con billones de parámetros, lo que la convierte en una opción natural para las demandas computacionales de DeepSeek V4. Los desarrolladores pueden crear prototipos con estos modelos a través de los endpoints alojados de NVIDIA en build.nvidia.com o implementarlos directamente usando NVIDIA NIM para configuraciones de infraestructura personalizadas.

Casos de uso objetivo y flexibilidad de implementación

La capacidad de DeepSeek V4 para gestionar contextos de 1M de tokens abre nuevas oportunidades para la programación de contexto largo, flujos de trabajo basados en recuperación e IA agéntica. Su flexibilidad se ve además potenciada por herramientas de implementación como SGLang y vLLM, que ofrecen configuraciones adaptadas a diferentes necesidades de latencia y rendimiento, desde setups de baja latencia hasta configuraciones multi-GPU para operaciones a gran escala.

Este enfoque en la flexibilidad de implementación subraya una tendencia más amplia: a medida que los modelos de IA abiertos se acercan a la frontera de la inteligencia, las empresas están desplazando su atención desde la selección de modelos hacia la optimización de infraestructura. El objetivo final es reducir el costo por token manteniendo el rendimiento, y DeepSeek V4 se alinea de lleno con esta prioridad.

Primeros pasos

Los desarrolladores pueden acceder a DeepSeek V4 a través de múltiples canales, incluidos Hugging Face y los endpoints de API de NVIDIA. Para las empresas y desarrolladores que buscan integrar IA de contexto largo en sus flujos de trabajo, DeepSeek V4 ofrece una combinación convincente de escalabilidad, eficiencia y capacidades de razonamiento avanzado.

Con sus avances arquitectónicos y su integración fluida con NVIDIA Blackwell, DeepSeek V4 establece un nuevo estándar para la IA de contexto largo. A medida que crece la demanda de sistemas agénticos y ventanas de contexto más amplias, modelos como estos desempeñarán un papel fundamental en la configuración de la próxima generación de aplicaciones de IA.

Fuente de la imagen: Shutterstock

deepseek v4
nvidia blackwell
modelos de ia
inferencia de contexto largo

DeepSeek V4 se lanza con NVIDIA Blackwell, habilitando IA con contexto de 1M de Token

DeepSeek V4 se lanza con NVIDIA Blackwell, habilitando IA de contexto de 1M de tokens

Avances arquitectónicos para la IA de contexto largo

Integración con NVIDIA Blackwell

Casos de uso objetivo y flexibilidad de implementación

Primeros pasos

También te puede interesar

Las acciones de Trade Desk (TTD) suben un 6% tras la masiva compra insider de 150 millones de dólares por parte del CEO

Los inversores de XRP y Bitcoin están 'atrapados', ¿pero hay una salida?

'Esta es la línea': MAGA estalla por el masivo éxito de la fiesta de Grindr en el Washington D.C. de Trump

Noticias en tendencia

El abogado personal 'lowlife' de Trump está deslizando aún más el DOJ hacia el bolsillo de Trump

SpaceX, Lockheed Martin entre las 12 empresas seleccionadas para el programa de defensa espacial Golden Dome

Chainlink amplía su alcance mediante el lanzamiento en AWS Marketplace

Coinbase está dando a XRP la misma herramienta institucional de futuros que ofrece para Bitcoin y el oro

Actualización del Mercado Cripto - 25 de abril de 2026: Los bajistas pagando mientras los tiburones acumulan

Noticias en vivo 24/7

Precios de criptos