Introducción a DeepSeek
La startup china de inteligencia artificial DeepSeek ha ganado fama recientemente y está avanzando a un ritmo vertiginoso, superando a sus competidores y generando conversaciones sobre las virtudes del software de código abierto. Sin embargo, han surgido varias preocupaciones de seguridad sobre la empresa, lo que ha llevado a organizaciones privadas y gubernamentales a prohibir el uso de DeepSeek.
¿Qué es DeepSeek?
DeepSeek es una startup china fundada por Liang Wenfeng en mayo de 2023. La empresa ha desafiado a las empresas de inteligencia artificial establecidas con su enfoque de código abierto. Según Forbes, la ventaja de DeepSeek radica en el hecho de que está financiada solo por High-Flyer, un fondo de cobertura también dirigido por Wenfeng, lo que le da a la empresa un modelo de financiamiento que apoya el crecimiento y la investigación rápidos.
- La empresa lanzó la versión completa de R1, su modelo de razonamiento de código abierto, que puede superar al modelo o1 de OpenAI.
- La aplicación de asistente de AI de DeepSeek, que ejecuta el modelo V3, superó a ChatGPT en descargas en la App Store.
- DeepSeek R1 alcanzó el tercer lugar en la Chatbot Arena de HuggingFace, compitiendo con varios modelos Gemini y ChatGPT-4o.
¿Qué es DeepSeek R1?
R1 es el modelo de razonamiento insignia de DeepSeek, que se lanzó en su totalidad el 21 de enero. El modelo funciona al mismo nivel o superior al modelo o1 de OpenAI en varias pruebas de matemáticas, codificación y razonamiento.
- R1 se basa en el modelo V3 y utiliza tecnología de Alibaba y Meta.
- Lo que hace que R1 sea interesante es que, a diferencia de la mayoría de los demás modelos de tecnología de punta, es de código abierto, lo que significa que cualquier persona puede descargarlo y utilizarlo.
- DeepSeek no ha divulgado el conjunto de datos de entrenamiento de R1.
Costos y ventajas
DeepSeek es más barato que los modelos comparables de EE. UU. El acceso a la API de R1 comienza en $0,14 por un millón de tokens, una fracción de los $7,50 que cobra OpenAI por el nivel equivalente.
- DeepSeek afirma en un artículo de investigación de la empresa que su modelo V3, que se puede comparar con un modelo de chatbot estándar como Claude, costó $5,6 millones para entrenar.
- Algunos expertos sugieren que los costos de DeepSeek no incluyen los costos de infraestructura, I+D, datos y personal anteriores.
Preocupaciones de seguridad y privacidad
Han surgido varias preocupaciones de seguridad sobre DeepSeek, incluyendo:
- La empresa tiene vínculos directos con servidores y empresas en China que están bajo el control del gobierno chino.
- Se ha descubierto programación oculta que puede enviar datos de usuario, incluyendo información de identificación, consultas y actividad en línea, a China Mobile, una empresa de telecomunicaciones operada por el gobierno chino.
- La aplicación móvil de DeepSeek tiene varias fallas, incluyendo datos no cifrados y una mala almacenamiento de datos.
- La base de datos interna de DeepSeek era accesible públicamente y contenía historiales de chat, claves de API de usuario y otros datos sensibles.
Política de privacidad
La política de privacidad de DeepSeek establece que la empresa recopila una gran cantidad de información, incluyendo:
- Dirección IP, identificadores de dispositivo únicos y cookies
- Fecha de nacimiento, nombre de usuario, dirección de correo electrónico y/o número de teléfono, y contraseña
- Entrada de texto o audio, prompt, archivos cargados, comentarios, historial de chat o otro contenido que el usuario proporciona a la empresa
La política también establece que la empresa puede transferir información personal fuera del país donde vive el usuario, incluyendo para uno o más de los propósitos establecidos en la política.
Impacto en la industria de la IA
El éxito de R1 de DeepSeek resalta un cambio en la industria de la IA que podría empoderar a los laboratorios y investigadores más pequeños para crear modelos competitivos y diversificar las opciones. Las organizaciones sin el financiamiento o personal de OpenAI pueden descargar R1 y afinarlo para competir con modelos como o1.
- El éxito de DeepSeek también plantea dudas sobre la necesidad de grandes modelos y gastos en la investigación de IA.
- La empresa ha logrado avances notables en la eficiencia computacional, lo que podría conducir a una mayor adopción de modelos de IA más eficientes y menos costosos.