La inteligencia artificial de Liang Wenfeng ha dado un paso importante en la industria, presionando así competencias como ChatGPT, Géminis, Meta y Copilot.
Sin embargo, más allá de convertirse en rival, muchos investigadores Han tomado su sistema como referencia para aprender de la tecnología Deepseek R1.
Este es el proyecto más barato y poderoso de hoy, pero hay Una forma de hacerlo aún más económicoaunque en una pequeña y menos alcance.
Recientemente, esto se ha logrado gracias a un equipo de investigadores de la Universidad de California, Berkeley.
Deepseek puede ser una base sólida para la creación de IAS más bajos
Computadora hoy
Un nuevo proyecto llama la atención de muchas personas. Él Jiayi Pan estudiante de doctoradoque forma parte de la investigación de Berkeley AI (BAIR), ha compartido en el proceso de una investigación muy interesante para la industria de la inteligencia artificial.
El equipo se ha centrado en trabajar con Deepseek r1-cero para generar un modelo ligero y compacto que se puede incorporar a un juego de cuenta regresiva para ver cómo se comporta.
Aunque probaron varios tipos, como 0.5b, 1.5b, 3b y 7b, concluyeron que 3 mil millones de parámetros (3B LM) es el tamaño ideal Funcionar correctamente.
En comparación con la versión original, serían aproximadamente 668 mil millones de menos parámetros.
Para la cuenta regresiva, el modelo aprende a buscar y la autoverificación. Para el número de multiplicación, el modelo aprende a desglosar el problema usando la regla de desactivación y resolverlo paso a paso. Y cuesta $ 30 capacitar al modelo. Esperamos que este proyecto ayude a desmitificar la investigación emergente de la escala RL y hacerlo más accesible. – Jiayi Pan.
Con uno Base de modelos de idiomas (LM) y RL Han logrado procesar la capacitación con éxito. Al principio, solo dio respuestas aleatorias, pero la cuenta regresiva con IA, ha podido corregirse y resolver problemas con el razonamiento.
Al mismo tiempo, se mantiene el aprendizaje automático, por lo que a medida que avanza, obtiene más información y Mejora exponencial. El código Jiayi-pan se encuentra en GitHub y monitoreando todo el proyecto en Wandb.
El más impactante de todo esto es que la recreación de esta IA Ha salido en solo 30 dólares (aproximadamente 28.87 euros) porque han usado los archivos de 0.55 dólares por millón de Deepseek, siendo un total de 54 paquetes.
Con Openai, donde vale $ 15 por millón de chips, tal vez les hubiera costado alrededor de $ 810 (aproximadamente 779.58 euros).
Esto indudablemente marca la diferencia y muestra que Depseek es un modelo ideal para obtener resultados impresionantes a un precio extremadamente bajo.
Saber Cómo trabajamos en Informática.
Etiquetas: Inteligencia artificial
Con información de Telam, Reuters y AP








