Según un foro de Reddit de entusiastas de la IA, DeepSeek, cuando se le pregunta, se refiere a sí mismo como un modelo desarrollado por OpenAI, una respuesta similar a la dada por ChatGPT.
Esto subraya el punto general de que los datos curados y la salida refinada de OpenAI fueron clave para el desarrollo del Modelo de Lenguaje Grande de DeepSeek, R1.
OpenAI ha enfatizado que la nueva plataforma de código abierto de China, DeepSeek, está utilizando una técnica de entrenamiento conocida como “destilación”. Esta técnica implica entrenar un modelo más pequeño con la salida de un modelo más grande, creando una copia simplificada sin la necesidad de los extensos y costosos datos del original. Este punto realmente hizo caer las acciones de NVIDIA, ya que fabrican las GPU líderes en el mercado que son esenciales para el entrenamiento y desarrollo de LLM.
Impacto en el Mercado
La noción de que DeepSeek ‘destiló’ los datos de OpenAI para su entrenamiento ha agitado los mercados financieros debido a la posibilidad de acceder a un rendimiento similar al de OpenAI sin la necesidad de una infraestructura costosa.
Sin embargo, este puede no ser un enfoque particularmente sostenible para las organizaciones que necesitan restricciones más estrictas sobre las alucinaciones. El hecho de que los pesos sean públicos, pero los datos de entrenamiento sean algo improvisados y manipulados, añade a esa preocupación de rendimiento. Aún así, el poder ahora disponible para profesionales independientes y organizaciones más pequeñas está potenciando nuevos desarrollos en aplicaciones.
En un guiño al logro, Microsoft ha anunciado que el modelo DeepSeek R1 estará disponible en la plataforma Azure AI y GitHub. Además, Microsoft planea crear una versión más pequeña y destilada del modelo R1 para su uso con PCs Windows 11 Copilot+.
A pesar de la controversia, DeepSeek sigue despertando interés entre los usuarios y las empresas tecnológicas. AMD, por ejemplo, se ha sumado a la tendencia, animando a los usuarios a operar Modelos Destilados DeepSeek R1 en sus tarjetas gráficas Ryzen™ AI y Radeon™. A pesar de las impresionantes capacidades, algunos usuarios han expresado su preocupación respecto a la funcionalidad de los modelos destilados.
Es así:
Está la IA DeepSeek de China, que es una IA de chat basura que está siendo sobrevalorada.Está el DeepSeek R1 de AMD, la aplicación más tangible y verificable del modelo DeepSeek para el rendimiento gráfico y el avance de la IA.
Por último, los Modelos de Código Abierto de los que los demás derivan tienen una adopción generalizada
— Momala (@likeaking.bsky.social) 29 de enero de 2025 a las 8:34 PM
Varios han informado tiempos de procesamiento lentos, con un usuario refiriéndose al modelo destilado como ‘estúpido’. Curiosamente, los pesos del modelo son de código abierto y, como tal, pueden ejecutarse de manera segura localmente en una computadora personal.
Ironía en los Datos de Entrenamiento
La cuestión de los derechos de los datos también ha surgido, con OpenAI enfrentando críticas por su propio uso de datos extraídos sin adquirir derechos de los propietarios de los sitios web. Muchos creen que la supuesta destilación de los datos de OpenAI por parte de DeepSeek es una forma de justicia poética. La controversia en torno al uso de datos en la IA subraya la necesidad de una deliberación cuidadosa sobre los derechos de los datos dentro de la industria, destacando la delgada línea entre el avance y la infracción. Sin embargo, la queja de OpenAI marca un momento significativo en el desarrollo de la IA y cómo se perciben los derechos de los datos.

