Liang Wenfeng, cofundador de DeepSeek que podría transformar la industria de la IA (Imagen GPT)
Por Daniel Olivero González
Actualizado 20 de octubre de 2025
La irrupción de DeepSeek agitó el estanque de la IA con una mezcla de asombro y pánico. La ballena azul de su marca sugiere profundidad y serenidad; el mercado, en cambio, la leyó por momentos como un leviatán capaz de desordenar jerarquías, presupuestos y certezas sobre quién marca el ritmo tecnológico.
DeepSeek es una startup china fundada en 2023 por Liang Wenfeng en Hangzhou y financiada por el hedge fund High-Flyer, del propio Liang. No es un taller artesanal: es un equipo que desarrolló modelos grandes con una tesis insistente —eficiencia antes que músculo bruto— y con un pie en el código abierto. Ese origen y estructura están bien documentados y explican parte del revuelo que provoca cada anuncio.
La sorpresa no fue solo comunicacional. En enero de 2025, el estreno de su modelo de razonamiento R1 y su apertura sacudieron a la industria: repositorios, tarjetas técnicas y comparativas empezaron a circular, alimentando la idea de que China podía competir con investigación propia y modelos abiertos.
¿Qué trae de nuevo? Su familia de modelos V2/V3 combinó Mixture-of-Experts con Multi-head Latent Attention (MLA): menos cómputo por token, menos memoria en el KV cache, mejor rendimiento por dólar. No es humo: hay paper técnico y código disponible.
El dinero (o la falta de él). Parte del mito DeepSeek nació de su promesa de hacer “más con menos”. Se habló de menos de US$6 millones para entrenar un modelo competitivo —una cifra que The Guardian difundió como señal del “momento Sputnik” de la IA china— y, meses después, la propia empresa aseguró en un paper que su versión R1 costó US$294 mil entrenarla. El primer dato suena plausible para generaciones previas; el segundo, rompe esquemas y aún se discute fuera del documento técnico. En ambos casos, la idea de fondo es la misma: eficiencia radical.
Mercados en alerta. El 27 de enero de 2025, la narrativa de “hacer más con menos hardware” se tradujo en números rojos: Nvidia sufrió una caída intradía que terminó en un desplome histórico de US$589.000 millones de capitalización bursátil, el mayor borrón de valor de una empresa en un solo día, en medio del nerviosismo por el impacto de DeepSeek. La ola pegó también al Nasdaq y al resto de fabricantes y proveedores vinculados a IA.
¿Leviatán o ballena sabia? Depende desde dónde se mire. Para Silicon Valley, R1 y sus sucesores cuestionan el monopolio de la innovación cerrada; para desarrolladores y ecosistemas periféricos, la apertura de modelos y pesos es una pista de aterrizaje. Para los reguladores, un desafío: cómo convivir con flujos de conocimiento que no respetan fronteras.
Por qué importa de verdad. Si la tesis de DeepSeek se consolida, cambian tres cosas:
Costos y barreras de entrada. Si se puede entrenar o afinar con chips permitidos en China (H800/H20) y aun así competir, disminuye el premio por el hardware más caro y se acelera la adopción en más países y empresas.
Reuters
Modelo de competencia. La mezcla de código abierto + arquitecturas eficientes obliga a gigantes a justificar precios y lock-in con valor tangible —no solo con branding.
GitHub
Velocidad de iteración. Comunidades enteras pueden auditar, forkar y mejorar; eso corrige sesgos, baja alucinaciones y multiplica casos de uso. (DeepSeek afirma mejoras de razonamiento y menor tasa de errores en sus revisiones de 2025).
Cointelegraph
Claro: no todo son certezas. Falta ver replicabilidad independiente de sus costos de entrenamiento, desempeño sostenido en producción, y cuán “abiertos” permanecen los componentes críticos a medida que crece la presión comercial. También resta despejar dudas sobre fuentes de datos y cumplimiento normativo en distintos mercados.
Mi veredicto. DeepSeek no es un monstruo que venga a tragarse la industria ni un santo patrono del acceso libre. Es, hoy, una ballena sabia que demostró que hay profundidad fuera del carril dominante: eficiencia más apertura como vector competitivo.
Ese movimiento ya forzó respuestas de incumbentes y obligó a mirar más allá del “cuánto cómputo tienes”. Si la promesa se mantiene —y si terceros validan sus costos y rendimiento—, no estamos ante un susto pasajero, sino ante un cambio de patrón: menos capital “bruto”, más ingeniería fina y colaboración.
El océano tecnológico seguirá revuelto. Pero que una ballena enseñe a nadar mejor nunca fue mala noticia. Lo inquietante, para algunos, es que no nada sola.
© [2025] [Daniel Olivero González]. Todos los derechos reservados.



Comentarios
Publicar un comentario