Qué es DeepSeek, la IA china de código abierto

On / A Nueva empresa de desarrolladores de IA Está revolucionando el panorama digital. Su nombre es VeteranoY es una startup china fundada en 2023 especializada en la creación de modelos de código abierto. Ellos han sido su Prototipos más recientes Depseek R1 y Deepseek V3 Aquellos que han llevado a todos los focos apuntan al desarrollador chino y lo colocan como un competidor firme para otros gigantes de la industria.

El hecho de que esta IA de código abierto sea tan competitiva como la tecnología Operai y eso requiere chips de menor capacidad, ha causado que Se cuestiona el liderazgo tecnológico de las empresas estadounidenses como Nvidiaeso Vio sus acciones caer en un 10%.

Del mismo modo, también ha habido una caída significativa en los mercados de valores, especialmente en el Nasdaqeso 3.77% colapsado. Por su parte, el futuro del Dow Jones pierde 1.04%mientras que los de S&P 500 Fall 2.29%. Estas reacciones negativas comenzaron a demostrar el viernes pasado, cuando las acciones estadounidenses cayeron al mercado.

Actualmente hay una serie de Restricciones impuestas por los Estados Unidos, lo que prohíbe la venta de chips avanzados a las empresas chinas. Algo que no ha impedido que Deepseek progrese en su investigación tecnológica. El periodista Holger Zschaepitz Explicó en sus redes sociales que, el hecho de que Depseek parece «Habiendo construido un innovador modelo de inteligencia artificial a un precio extremadamente bajo y sin acceso a chips de última generación, cuestionar la utilidad de los cientos de miles de millones de dólares en gastos de capital que están siendo invertidos en esta industria».

De China #Epseekeek Podría representar la mayor amenaza para los mercados de capital estadounidense como la compañía sems para haber construido un modelo de AI grundbroking a un precio extremadamente bajo y tener acceso a chips de vanguardia, cuestionando la utilidad de los cientos de miles de miles de miles de miles de miles de miles de miles de miles de millones … pic.twitter.com/wmvyczprgt

– Holger Zschaepitz (@SchulDensuehner) 24 de enero de 2025

Que es Deepseek

Depseek fue fundado en 2023 por Liang wenfengquien también es fundador de High-Flyer Capital Management, una cobertura que actualmente es la única compañía que financia a Deepseek. Él El primer producto de la compañía fue Coder de DeepseekUn modelo de código abierto especializado en tareas de codificación, lanzado en noviembre de 2023.

En este momento, Equipo de Deepseek Consiste principalmente en Jóvenes de las mejores universidades chinasCentrándose en la innovación tecnológica. Por otro lado, no tener inversores externos al presentar un Modelo de financiamiento único ha permitido a la empresa evolucionar sin presiones hacia proyectos de IA a largo plazo.

Por supuesto, Deepseek Sí, está sujeto a evaluaciones del regulador de Internet de Chinacuyo trabajo es asegurarse de que esta tecnología cumpla con los «valores socialistas fundamentales». Esto implica que IA no responde a ciertas consultas que consideren problemas delicados.

Por ejemplo, le he preguntado sobre las protestas de Tiananmén Plaza en 1989 y también sobre la Guerra Civil en España, y su respuesta ha sido totalmente diferente. Si bien afirma no poder responder al primer problema, me ofrece un resumen sobre el segundo tema.

Deepseek r1

El 20 de noviembre, la startup china presentó una vista previa de su AI Deepseek R1 y el 20 de enero lo lanzó en una versión abierta. Este es un modelo de razonamiento de código abierto cuyo rendimientocomo él dice exceder O1 de OpenAi en ciertos parámetros.

Específicamente, los parámetros en los que se destaca R1 son AIME (mide la eficiencia de un modelo de IA), Matemáticas-500 (centrado en problemas matemáticos) y el banco swe veridiado (tareas de programación).

Ser un modelo de razonamiento, R1 es capaz de verificarse y las respuestas que daa través de un pensamiento profundo. Esto supone que Tus tiempos de respuesta son un poco más lentos que los de otras generaciones, pero garantiza respuestas más completas y exitosas. Deepseek R1 Razón a través de tareas, planificando de antemano y ejecuta acciones que le permitan alcanzar el resultado correcto.

Solo han pasado 3 días desde que salió Deepseek R1 y es una locura

Spoiler: Chatgpt se queda atrás.

13 ejemplos increíbles hasta ahora (no te pierdas el quinto) pic.twitter.com/qshnwemp7d

– Filipe | Ai (@Filicroval) 24 de enero de 2025

Este contiene 671,000 millones de parámetros (Variables internas utilizadas por los modelos AI para tomar predicciones o tomar decisiones), aunque el desarrollador ha lanzado dos versiones reducidas que varían de 1.500 millones a 70,000 millones de parámetros. De esta manera, pueden adaptarse al sistema en el que van a ser ejecutados, por ejemplo, la versión más pequeña es admisible para una computadora portátil, mientras que para la versión completa se requiere un hardware de alta potencia.

Actualmente, el modelo R1 es Disponible en la cara abrazada bajo una licencia MIT y sin restricciones comerciales.

Deepseek v3

Solo unos días después de lanzar R1 en la versión abierta, Depseek presentó su modelo V3. Este es un Modelo de lenguaje MOE (mezcla de expertos)lo que significa que se basa en una arquitectura neuronal avanzada Capaz de dividir el aprendizaje entre varios «expertos» especializados en tareas o subconjuntos de datos concretos. De esta manera, las fortalezas de varios modelos especializados se combinan para Lograr el rendimiento general superior.

Deepseek v3 está compuesto de 671,000 millones de parámetroscon 37,000 millones activados para cada token. Este modelo es Capaz de manejar varias tareas basadas en textocomo el trabajo de codificación, traducción y escritura, a través de indicaciones descriptivas.

Según los datos publicados por la propia Compañía, Deepseek V3 Excede los modelos, ya que llama a 3.1 405b, Claude 3.5 o GPT-4O en varios parámetros.

Introducción Deepseek-v3!

El mayor salto hacia adelante hasta ahora:
⚡ 60 tokens/segundo (¡3x más rápido que V2!)
Capacidades mejoradas
Compatibilidad de la API intacta
Modelos y documentos de código abierto

1/n pic.twitter.com/p1dv9gj2sd

– Deepseek (@deepseek_ai) 26 de diciembre de 2024

Del mismo modo, esto ha dado mucho de qué hablar por el hecho de que para su desarrollo fueron utilizados 2,788 millones de horas de capacitación y cuestan 5,5 millones de dólares. Si bien esta última figura es abrumadora, si la comparamos con el modelo GPT-4 de OpenAi Es «modesto», ya que algunos fueron invertidos 80 millones de dólares.

V3 se ha lanzado bajo una licencia que permite a los desarrolladores descargarlo y modificarlo Para una gran mayoría de las aplicaciones, incluidas las aplicaciones comerciales. Puedes acceder a este modelo en el Sitio web de Deepseeken Github o en su aplicación.

Foto: Deepseek

Versión Completa Qué es DeepSeek, la IA china de código abierto

Related Posts

Dialpad incorpora información sobre llamadas a Gemini Enterprise

Cómo Databricks CustomerLake revoluciona el mercado de CDP

El verdadero problema de Martech no es la tecnología

Por qué la búsqueda con IA ignora el contenido generado por IA

El verdadero desafío de la experiencia del cliente no es la tecnología

Premium Content

Adobe Challens Openi: Así es como generar videos con Firefly, gratis (pero tenga cuidado con los límites)

Cambiar el Seguro Social para siempre: SSA eliminará un sistema de pago que afectará a todos los jubilados y beneficiarios

El trailer oficial de la temporada 4 del programa matutino

Red de Noticias

Es De Latino News

Acerca de EDL

Welcome Back!

Retrieve your password