DeepSeek

Modelos de lenguaje de pesos abiertos, muy potentes y de bajo costo, con variantes especializadas en código.

Modelos de lenguaje

¿Qué es?

DeepSeek es una compañía de investigación en inteligencia artificial de origen chino que desarrolla modelos de lenguaje de pesos abiertos (open weights). Sus modelos compiten en calidad con GPT-4 y Claude 3.5 Sonnet, pero con un costo de entrenamiento y uso mucho menor. Para desarrolladores destacan DeepSeek-V3 y la serie DeepSeek-Coder, optimizados para programación y lógica matemática. A diferencia de modelos cerrados como GPT o Gemini, DeepSeek permite tanto el uso vía API pública como la descarga del modelo para ejecutarlo en tu propia infraestructura, lo que lo hace muy atractivo para arquitecturas RAG de alto rendimiento con presupuesto ajustado.

Ventajas

Desventajas

Funciona mejor para

Enlaces recomendados

← Volver a todas las guías