Phi-3-Mini es el primero de una familia de modelos de lenguajes pequeños que Microsoft planea lanzar en las próximas semanas. Phi-3-Small y Phi-3-Medium están en proceso. A diferencia de los modelos de lenguaje grandes como ChatGPT de OpenAI y Gemini de Google, los modelos de lenguaje pequeños se entrenan en conjuntos de datos mucho más pequeños y se dice que son mucho más asequibles para los usuarios.
Nos complace presentar Phi-3, una familia de modelos abiertos de IA desarrollados por Microsoft. Los modelos Phi-3 son los modelos de lenguaje pequeño (SLM) más capaces y rentables disponibles, superando a los modelos del mismo tamaño y del siguiente tamaño en una variedad de puntos de referencia de lenguaje, razonamiento, codificación y matemáticas.
Misha Bilenko Vicepresidente corporativo, Microsoft GenAI
¿Para qué son? Por un lado, el tamaño reducido de este modelo de lenguaje puede hacerlo adecuado para ejecutarlo localmente, por ejemplo como una aplicación en un teléfono inteligente. Algo del tamaño de ChatGPT vive en la nube y requiere una conexión a Internet para acceder.
Mientras que se dice que ChatGPT tiene más de un billón de parámetros, Phi-3-Mini tiene sólo 3.800 millones. Sanjeev Bora, que trabaja con genAI en el ámbito de la atención médica, escribe: “La cantidad de parámetros en un modelo generalmente dicta su tamaño y complejidad. Los modelos más grandes con más parámetros generalmente son más capaces, pero tienen el costo de mayores requisitos computacionales. La elección del tamaño a menudo depende del problema específico que se aborda”.
Phi-3-Mini fue entrenado con un conjunto de datos relativamente pequeño de 3,3 billones de tokens: instancias de lenguaje humano expresadas numéricamente. Pero todavía son muchas fichas.
Por qué nos importa. Si bien en general se informa, y Microsoft lo confirma, que estos SLM serán mucho más asequibles que los grandes LLM, es difícil encontrar detalles exactos sobre el precio. Sin embargo, tomando la promesa al pie de la letra, uno puede imaginar una democratización de la genAI, poniéndola a disposición de empresas muy pequeñas y propietarios únicos.
Necesitamos ver qué pueden hacer estos modelos en la práctica, pero es posible que casos de uso como escribir un boletín de marketing, crear líneas de asunto de correo electrónico o redactar publicaciones en redes sociales simplemente no requieran el poder gigantesco de un LLM.
Profundice más: cómo funcionan los agricultores sin fines de lucro mercado está aprovechando la IA
Correo electrónico:
Ver términos.
La publicación Microsoft presenta un nuevo modelo de lenguaje pequeño apareció por primera vez en MarTech.
Versión en Inglés Microsoft presenta un nuevo modelo de lenguaje pequeño