Bienvenidos a esta guía sobre DeepSeek Guía Rápida. Comparte este articulo y síguenos para recibir más guías y cursos.

Esta guía es parte de un curso mucho más grande en donde te enseñamos a convertirte en hacker de 0 a 100. Desde los conocimientos más básicos hasta conseguir empleo.

Para saber más comente a continuación, respondemos todos y cada uno de los comentarios.

Para saber más comente a continuación, respondemos todos y cada uno de los comentarios.

Índice

¿Te gustaría enterarte de cuando lanzamos descuentos y nuevos cursos?

DeepSeek, una empresa china de inteligencia artificial, está revolucionando la industria con sus modelos de lenguaje de gran tamaño, de código abierto y de bajo costo, desafiando a los gigantes tecnológicos estadounidenses.

Y es asi como una empresa emergente china ha irrumpido en el mundo de la inteligencia artificial, inquietando a los gigantes de Silicon Valley, sacudiendo los mercados bursátiles mundiales y desafiando las suposiciones sobre lo que la inteligencia artificial puede lograr. DeepSeek combina financiación a nivel de fondos de cobertura, ambición de código abierto y una misión arraigada de superar la inteligencia humana, todo ello mientras logra eclipsar a nombres establecidos como OpenAI. Sin embargo, con un crecimiento tan rápido surgen preguntas. 

¿Estamos presenciando una auténtica revolución de la IA o se trata de una exageración? En las siguientes secciones, revelaremos la fundación y la filosofía de DeepSeek, compararemos sus modelos con los de los incondicionales de la IA como ChatGPT y analizaremos los sorprendentes cambios que ha provocado en el mercado.

¿Qué es DeepSeek?

DeepSeek es una empresa de desarrollo de inteligencia artificial con sede en Hangzhou, China. La empresa fue fundada por Liang Wenfeng, un graduado de la Universidad de Zhejiang, en mayo de 2023. Wenfeng también cofundó High-Flyer, un fondo de cobertura cuantitativo con sede en China que posee DeepSeek. Actualmente, DeepSeek opera como un laboratorio de investigación de inteligencia artificial independiente bajo el paraguas de High-Flyer. El monto total de la financiación y la valoración de DeepSeek no se han revelado públicamente.

DeepSeek se centra en el desarrollo de LLM de código abierto. El primer modelo de la empresa se lanzó en noviembre de 2023. La empresa ha iterado varias veces su LLM principal y ha desarrollado varias variaciones diferentes. Sin embargo, no fue hasta enero de 2025, después del lanzamiento de su modelo de razonamiento R1, que la empresa se hizo famosa a nivel mundial.

La empresa ofrece múltiples servicios para sus modelos, incluida una interfaz web, una aplicación móvil y acceso API .

El nuevo enfoque de DeepSeek para el razonamiento LLM

DeepSeek ha presentado un enfoque innovador para mejorar las capacidades de razonamiento de los modelos de lenguaje grandes (LLM) a través del aprendizaje por refuerzo (RL), que se detalla en su reciente artículo sobre DeepSeek-R1. Esta investigación representa un avance significativo en la forma en que podemos mejorar la capacidad de los LLM para resolver problemas complejos a través del aprendizaje por refuerzo puro, sin depender en gran medida del ajuste fino supervisado.

Esta guía ofrece una descripción técnica detallada para ayudarlo a aprovechar DeepSeek de manera eficaz.

Introducción a DeepSeek

Los usuarios pueden acceder a DeepSeek a través de varios canales:

  1. Integración de API: para desarrolladores que desean integrar DeepSeek en sus aplicaciones
  2. Interfaz web: para interacción directa con el modelo
  3. Implementación de código abierto: para aquellos que desean ejecutar el modelo localmente o modificarlo para usos específicos

Implicaciones futuras

El desarrollo de DeepSeek representa un paso importante en la evolución de la tecnología de IA. A medida que la plataforma siga evolucionando, es probable que:

  • Seguir impulsando las capacidades de la IA en dominios especializados
  • Contribuir a la democratización de la tecnología de IA
  • Impulsar la innovación en la arquitectura de modelos y los métodos de entrenamiento.
  • Influir en el desarrollo de futuros sistemas de IA

Comparación entre OpenAI y DeepSeek

DeepSeek representa el último desafío para OpenAI, que se estableció como líder de la industria con el debut de ChatGPT en 2022. OpenAI ha ayudado a impulsar la industria de la IA generativa con su familia de modelos GPT, así como su clase o1 de modelos de razonamiento.

Si bien ambas empresas están desarrollando LLM de IA generativa, tienen enfoques diferentes.

IA abiertaBúsqueda profunda
Año de fundación20152023
SedeSan Francisco, California.Hangzhou, China
Enfoque de desarrolloAmplias capacidades de IA
Modelos eficientes de código abierto
Modelos claveGPT-4o, o1DeepSeek-V3, DeepSeek-R1
Modelos especializadosDall-E (generación de imágenes),
Whisper (reconocimiento de voz)
DeepSeek Coder (codificación), Janus Pro (modelo de visión)
Precios de API
(por millón de tokens)
o1: $15 (entrada), $60 (salida)DeepSeek-R1: $0,55 (entrada), $2,19 (salida)
Política de código abiertoLimitadoMayormente de código abierto
Enfoque de formaciónAjuste fino supervisado y basado en instruccionesAprendizaje por refuerzo
Costo de desarrolloCientos de millones de dólares por o1 (estimado)Según la compañía, DeepSeek-R1 costará menos de 6 millones de dólares

Descripción técnica de DeepSeek-R1

Arquitectura del modelo:

DeepSeek-R1 no es un modelo singular, sino una familia de modelos que incluye: DeepSeek-R1-Zero y DeepSeek-R1

DeepSeek es una innovadora plataforma impulsada por IA de origen chino, diseñada para transformar la forma en que extraemos, analizamos e interpretamos datos complejos. Ya sea en biotecnología, procesamiento de lenguaje natural o análisis de big data, DeepSeek permite a investigadores, empresas y desarrolladores descubrir información avanzada sobre datos con precisión.

Permítanme aclarar las diferencias clave entre DeepSeek-R1 y DeepSeek-R1-Zero:

La distinción primaria

DeepSeek-R1-Zero representa el experimento inicial del equipo que utiliza aprendizaje de refuerzo puro sin ningún ajuste fino supervisado. Comenzaron con su modelo base y aplicaron el aprendizaje de refuerzo directamente, dejando que el modelo desarrollara capacidades de razonamiento a través de prueba y error. Si bien este enfoque logró resultados impresionantes (71 % de precisión en AIME 2024), tenía algunas limitaciones significativas, particularmente en legibilidad y consistencia del lenguaje. Cuenta con 671 mil millones de parámetros, utilizando una arquitectura de mezcla de expertos (MoE) donde cada token activa parámetros equivalentes a 37 mil millones. Este modelo muestra comportamientos de razonamiento emergentes, como autoverificación, reflexión y razonamiento de cadena de pensamiento larga (CoT).

DeepSeek-R1 , por el contrario, utiliza un enfoque de entrenamiento de múltiples etapas más sofisticado. En lugar de un aprendizaje de refuerzo puro, comienza con un ajuste fino supervisado en un pequeño conjunto de ejemplos cuidadosamente seleccionados (llamados «datos de inicio en frío» que es antes de aplicar el aprendizaje de refuerzo). Este enfoque aborda las limitaciones de DeepSeek-R1-Zero y, al mismo tiempo, logra un rendimiento aún mejor. Este modelo también mantiene el recuento de 671 mil millones de parámetros, pero logra una mejor legibilidad y coherencia en las respuestas.

Comparación del proceso de formación

Metodología de entrenamiento:

  • Aprendizaje por refuerzo : a diferencia de los modelos tradicionales que se basan predominantemente en el aprendizaje supervisado, DeepSeek-R1 utiliza el aprendizaje por refuerzo de forma extensiva. El entrenamiento aprovecha la optimización de políticas relativas al grupo (GRPO), centrándose en la precisión y las recompensas de formato para mejorar las capacidades de razonamiento sin la necesidad de datos etiquetados extensos.
  • Técnicas de destilación : para democratizar el acceso a modelos de alto rendimiento, DeepSeek también ha lanzado versiones destiladas de R1, que van desde 1.500 millones a 70.000 millones de parámetros. Estos modelos se basan en arquitecturas como Qwen y Llama, lo que demuestra que el razonamiento complejo se puede encapsular en modelos más pequeños y eficientes. El proceso de destilación implica ajustar estos modelos más pequeños con datos de razonamiento sintético generados por el DeepSeek-R1 completo, preservando así un alto rendimiento a un costo computacional reducido.

El proceso de entrenamiento de DeepSeek-R1-Zero es sencillo:

  • Empezar con el modelo base
  • Aplicar el aprendizaje de refuerzo directamente
  • Utilice recompensas simples basadas en la precisión y el formato

El proceso de entrenamiento de DeepSeek-R1 tiene cuatro etapas distintas:

  1. Ajuste inicial supervisado con miles de ejemplos de alta calidad
  2. Aprendizaje por refuerzo centrado en tareas de razonamiento
  3. Recopilación de nuevos datos de entrenamiento mediante muestreo de rechazo
  4. Aprendizaje de refuerzo final en todos los tipos de tareas

Métricas de rendimiento:

  • Puntos de referencia de razonamiento : DeepSeek-R1 ha mostrado resultados impresionantes en varios puntos de referencia:
  • AIME 2024 : Se logró una tasa de aprobación del 79,8 %, en comparación con el 79,2 % del examen o1–1217 de OpenAI.
  • MATH-500 : Obtuvo un impresionante 97,3 %, ligeramente por delante del 96,4 % de o1–1217.
  • SWE-bench verificado : superó las tareas de programación, lo que demuestra su competencia en codificación.
  • Rentabilidad : la API para DeepSeek-R1 tiene un precio de $0,14 por millón de tokens de entrada para accesos de caché, lo que la hace significativamente más económica que modelos comparables como el o1 de OpenAI.

Limitaciones y trabajo futuro

El documento reconoce varias áreas de mejora:

  • El modelo a veces tiene dificultades con tareas que requieren formatos de salida específicos.
  • Se podría mejorar el desempeño en tareas de ingeniería de software
  • La mezcla de idiomas en contextos multilingües plantea desafíos
  • Los pocos intentos de dar indicaciones degradan constantemente el rendimiento

El trabajo futuro se centrará en abordar estas limitaciones y ampliar las capacidades del modelo en áreas como llamada de funciones, interacciones de múltiples turnos y escenarios complejos de juego de roles.

Implementación y accesibilidad

  • Código abierto y licencias : DeepSeek-R1 y sus variantes se publican bajo la licencia MIT, lo que promueve la colaboración y el uso comercial de código abierto, incluida la destilación de modelos. Esta medida es fundamental para fomentar la innovación y reducir las barreras de entrada en el desarrollo de modelos de IA.
  • Formatos del modelo:
  • Ambos modelos y sus versiones destiladas están disponibles en formatos como GGML, GGUF, GPTQ y HF, lo que permite flexibilidad en cómo se implementan localmente.

1. Acceso web a través de la plataforma de chat DeepSeek:

La plataforma DeepSeek Chat proporciona una interfaz fácil de usar para interactuar con DeepSeek-R1 sin ningún requisito de configuración.

  • Pasos para acceder :
  • Navegar a la plataforma DeepSeek Chat
  • Regístrese para obtener una cuenta o inicie sesión si ya tiene una.
  • Después de iniciar sesión, seleccione el modo “Deep Think – Pensamiento profundo” para experimentar las capacidades de razonamiento paso a paso de DeepSeek-R1.

2. Acceso a través de la API de DeepSeek:

Para el acceso programático, DeepSeek ofrece una API compatible con el formato de OpenAI, lo que permite la integración en varias aplicaciones.

Pasos para utilizar la API :

a. Obtener una clave API :

b. Configure su entorno :

  • Establezca el base_urlen https://api.deepseek.com/v1.
  • Utilice su clave API para la autenticación, generalmente a través del Bearer Token en el encabezado HTTP.

c. Realizar llamadas API :

  • Utilice la API para enviar indicaciones y recibir respuestas de DeepSeek-R1.
  • La documentación detallada y los ejemplos están disponibles en la documentación de la API de DeepSeek .

3. Ejecución local de DeepSeek-R1:

Ambos modelos (R1 y R1-Zero):

  • Requisitos de hardware: los modelos completos requieren un hardware importante debido a su tamaño. Se recomienda una GPU con una cantidad sustancial de VRAM (como Nvidia RTX 3090 o superior). Para el uso de la CPU, necesitarás al menos 48 GB de RAM y 250 GB de espacio en disco, aunque el rendimiento sería lento sin la aceleración de la GPU.
  • Modelos simplificados: para la implementación local con hardware que consume menos recursos, DeepSeek ofrece versiones simplificadas. Estas varían de 1,5 B a 70 B de parámetros, lo que las hace adecuadas para sistemas con hardware más modesto. Por ejemplo, el modelo 7 B puede ejecutarse en una GPU con al menos 6 GB de VRAM o en una CPU con aproximadamente 4 GB de RAM para el formato GGML/GGUF.

Herramientas de software para ejecución local:

Ollama

Puede utilizar Ollama para servir los modelos localmente: (Ollama es una herramienta para ejecutar modelos de IA de código abierto localmente en su máquina. Descárguela aquí: https://ollama.com/download )

A continuación, deberá extraer y ejecutar el modelo DeepSeek R1 localmente.

Ollama ofrece distintos tamaños de modelos: básicamente, los modelos más grandes equivalen a una IA más inteligente, pero necesitan una mejor GPU. Aquí está la lista:

1.5B version (smallest):
ollama run deepseek-r1:1.5b

8B version:
ollama run deepseek-r1:8b

14B version:
ollama run deepseek-r1:14b

32B version:
ollama run deepseek-r1:32b

70B version (biggest/smartest):
ollama run deepseek-r1:70b

Para comenzar a experimentar con DeepSeek-R1, es recomendable comenzar con un modelo más pequeño para familiarizarse con la configuración y garantizar la compatibilidad con su hardware. Puede iniciar este proceso abriendo su terminal y ejecutando el siguiente comando:

ollama run deepseek-r1:8b

Envío de solicitudes a DeepSeek-R1 descargado localmente a través de Ollama:

Ollama proporciona un punto final de API para interactuar con DeepSeek-R1 de forma programática. Asegúrese de que el servidor Ollama se esté ejecutando localmente antes de realizar solicitudes de API. Puede iniciar el servidor ejecutando lo siguiente:

ollama serve

Una vez que el servidor esté activo, puedes enviar una solicitud de curlla siguiente manera:

curl -X POST http://localhost:11434/api/generate -d '{
"model": "deepseek-r1",
"prompt": "Your question or prompt here"
}'

Reemplace "Your question or prompt here"con la entrada real que desea proporcionar al modelo. Este comando envía una solicitud POST al servidor Ollama local, que procesa la solicitud utilizando el modelo DeepSeek-R1 especificado y devuelve la respuesta generada.

Otros métodos para ejecutar/acceder a los modelos localmente son:

vLLM/SGLang: se utiliza para servir los modelos localmente. Se pueden utilizar comandos como vllm serve deepseek-ai/DeepSeek-R1-Distill-Qwen-32B — tensor-parallel-size 2 — max-model-len 32768 — enforce-eager para las versiones simplificadas.

Introducción a DeepSeek en Linux

1. Configuración del entorno

Antes de utilizar DeepSeek, asegúrese de que su sistema cumpla estos requisitos previos:

  • Sistema operativo : Linux (se recomienda Ubuntu 20.04+) o Windows 10/11
  • Versión de Python : 3.8 o superior.
  • Dependencias : TensorFlow, PyTorch, NumPy, pandas y matplotlib.

Instalar Python y Pip

sudo apt update
sudo apt install python3 python3 - pip - y

Crear un entorno virtual

python3 -m venv deepseek_env
source deepseek_env/bin/activate

Instalar las bibliotecas necesarias

pip install tensorflow torch numpy pandas matplotlib
pip install deepseek-sdk

Autenticación y configuración de API

Cree una cuenta en la plataforma DeepSeek y recupere su clave API desde el panel de control. Autentique sus llamadas API de la siguiente manera:

from deepseek_sdk import DeepSeek
from deepseek_sdk import DeepSeek

# Initialize DeepSeek client
client = DeepSeek(api_key="YOUR_API_KEY")

Uso de DeepSeek para el análisis de datos

1. Cargar un conjunto de datos

DeepSeek admite varios formatos de datos, como CSV, JSON y Excel, para cargas. Cargue conjuntos de datos de forma programada mediante el SDK:

# Cargar conjunto de datos
response = client.upload_dataset(file_path="/path/to/your/dataset.csv")

if response.success:
print("Dataset uploaded successfully!")
else:
print("Error:", response.error)

2. Entrenamiento de un modelo de IA

Ajuste un modelo en su conjunto de datos para obtener información útil:

# Entrenar un modelo
model = client.train_model(
dataset_id="your_dataset_id",
model_type="classification",
parameters={"epochs": 10, "learning_rate": 0.001}
)

print("Model Training Status:", model.status)

print ( "Estado de entrenamiento del modelo:" , model.status)

3. Ejecución de consultas de datos

Analice datos a través de consultas complejas:

# Consulta de datos
query_result = client.query_data(
dataset_id="your_dataset_id",
query="SELECT * WHERE age > 30"
)

print("Query Result:", query_result.data)

4. Visualización de información

Genere visualizaciones claras y significativas:

import matplotlib.pyplot as plt

# Generar un gráfico de barras
chart_data = client.generate_chart(
dataset_id="your_dataset_id",
chart_type="bar",
x_axis="category",
y_axis="sales"
)

plt.bar(chart_data["x"], chart_data["y"])
plt.show()

Implementación y escalamiento

DeepSeek ofrece opciones de implementación flexibles que se adaptan a diversos entornos. Para uso en producción:

Implementación Dockerizada Aproveche Docker para implementaciones consistentes y escalables:

docker pull deepseek/deepseek:latest
docker run -d -p 8080:8080 --name deepseek deepseek/deepseek:latest

Integración de Kubernetes Utilice Kubernetes para escalar DeepSeek en múltiples nodos:

apiVersion: apps/v1
kind: Deployment
metadata:
name: deepseek-deployment
spec:
replicas: 3
selector:
matchLabels:
app: deepseek
template:
metadata:
labels:
app: deepseek
spec:
containers:
- name: deepseek
image: deepseek/deepseek:latest
ports:
- containerPort: 8080

Implementación en la nube Implemente en plataformas en la nube como AWS, GCP o Azure, utilizando instancias de aprendizaje automático para lograr un rendimiento óptimo.

DeepSeek R1 ya está disponible en Azure AI Foundry y GitHub

Cómo utilizar DeepSeek en el catálogo de modelos

Un GIF sobre cómo usar DeepSeek en el catálogo de modelos en modelos de Azure AI Foundry y GitHub.
  • Si no tiene una suscripción a Azure, puede registrarse para obtener una cuenta de Azure aquí .
  • Busque DeepSeek R1 en el catálogo de modelos.
  • Abra la tarjeta del modelo en el catálogo de modelos en Azure AI Foundry.
  • Haga clic en implementar para obtener la API de inferencia y la clave y también para acceder al área de juegos. 
  • En menos de un minuto, deberías llegar a la página de implementación que muestra la API y la clave. Puedes probar tus indicaciones en el área de juegos.
  • Puede utilizar la API y la clave con varios clientes.

Comience a usar Azure AI Foundry aquí  y seleccione el modelo DeepSeek.

En GitHub, puedes explorar recursos adicionales y guías paso a paso para integrar DeepSeek R1 sin problemas en tus aplicaciones. Lee la publicación del blog sobre modelos de GitHub .

Los clientes podrán utilizar versiones refinadas del modelo DeepSeek R1 para ejecutarlo localmente en sus PC Copilot+. Lea la publicación del blog de Windows Developer .

Mejores prácticas

  • Preparación de datos : asegúrese de que sus datos estén limpios, validados y preprocesados ​​para lograr los mejores resultados.
  • Monitoreo del modelo : monitoree periódicamente la precisión del modelo y vuelva a entrenarlo utilizando conjuntos de datos actualizados según sea necesario.
  • Seguridad : proteja sus claves API y emplee medidas sólidas de protección de datos para garantizar el cumplimiento de las regulaciones de privacidad de datos.
  • Documentación : consulte la documentación oficial de DeepSeek para obtener las últimas actualizaciones y configuraciones avanzadas.

DeepSeek ofrece a los usuarios un conjunto de herramientas avanzado para extraer información de conjuntos de datos complejos. Si sigue esta guía completa, podrá aprovechar sus capacidades para impulsar la innovación y lograr el éxito basado en datos. Esté atento a las actualizaciones y explore todo el potencial de DeepSeek a medida que evoluciona.

Conclusiones:

Esta progresión de DeepSeek-R1-Zero a DeepSeek-R1 representa un importante proceso de aprendizaje en la investigación. Mientras que DeepSeek-R1-Zero demostró que el aprendizaje por refuerzo puro podía funcionar, DeepSeek-R1 demostró cómo la combinación del aprendizaje supervisado con el aprendizaje por refuerzo podía crear un modelo aún más capaz y práctico.

DeepSeek la IA como ChatGPT pero Open Source (es Gratis)

3 Libros De Regalo con 100 Prompts. Aprende a Ejecutar la IA de forma local (Privada), a usar Agentes IA con Deepseek

Accede ahora desde este enlace: https://achirou.com/deepseek

Lo que aprenderás

  • Creación de un Agente de IA con Deepseek
  • Prompt engineering (ingenieria de prompt) con deepseek
  • Uso de Deepseek con Practica para diferentes tareas (creación de ebook, Marketing digital, etc)
  • Creación de Agente de IA con deepseek
  • Practica de creación de Agente con IA
  • Ejecuta la IA Generativa LLM de forma Local para mayor Privacidad

¿Te gustaría aprovechar el poder de la inteligencia artificial sin depender de herramientas de pago? DeepSeek es una alternativa open-source a ChatGPT que te permite automatizar tareas, mejorar tu productividad y ofrecer servicios basados en IA sin restricciones.

En este curso 100% práctico, aprenderás a utilizar DeepSeek para diferentes aplicaciones, desde la generación de contenido hasta el marketing digital y la automatización de procesos. Además, te enseñaremos a crear tu propio agente de IA personalizado con DeepSeek, lo que te permitirá desarrollar soluciones inteligentes adaptadas a tus necesidades o a las de tus clientes.

Como bono especial, recibirás 3 libros con 100 prompts para que puedas aplicar lo aprendido de inmediato en distintas áreas:

  • Vender servicios con IA
  • Aumentar tu productividad
  • Simplificar tareas complejas

¿Qué aprenderás?

Creación de un agente de IA con DeepSeek
Ingeniería de prompt aplicada a DeepSeek
Uso práctico de DeepSeek en tareas como:

  • Creación de eBooks
  • Automatización de contenido
  • Estrategias de marketing digital
    Implementación de agentes de IA en distintos casos de uso
    Ejercicios prácticos para desarrollar tus propias soluciones

Este curso es ideal para freelancers, emprendedores, marketers y cualquier persona que quiera aprovechar la IA sin costos adicionales.

¡Únete ahora y descubre cómo DeepSeek puede transformar tu manera de trabajar!

Accede ahora desde este enlace: https://achirou.com/deepseek

No te detengas, sigue avanzando

Aprende con nuestros más de 100 cursos que tenemos disponibles para vos

¿Te gustaría enterarte de cuando lanzamos descuentos y nuevos cursos?

Sobre la autora

Romina Orlando

Con más de 20 años de experiencia en liderazgo, gestión financiera y empresarial. Brindo Educación y Consultoría a profesionales, bancos y empresas. Puedes seguirme en mis redes:

Compartimos estos recursos para ayudar a la comunidad. COMPARTE y Siéntete libre de agregar más sugerencias en los comentarios a continuación, respondemos todos y cada uno de los comentarios.