Microsoft presentó Phi-3 Mini, un nuevo modelo de IA para smartphones

El nuevo modelo de Microsoft promete ofrecer un rendimiento similar a GPT-3.5 de OpenAI en dispositivos móviles.

Microsoft lanzó Phi-3 Mini, la última versión de su modelo de lenguaje diseñado para ejecutarse en smartphones modernos.

Con 3.800 millones de parámetros, Phi-3 Mini está entrenado en un conjunto de datos más pequeño en comparación con modelos más grandes como GPT-4. Sin embargo, promete ofrecer un rendimiento similar a GPT-3.5 de OpenAI en el campo de la Inteligencia Artificial.

Phi-3 Mini ya está disponible en plataformas como Azure, Hugging Face y Ollama. A su vez, Microsoft planea lanzar versiones de tamaño mediano y grande de Phi-3 en el futuro cercano, con 7 mil millones y 14 mil millones de parámetros respectivamente.

En diciembre, la compañía lanzó Phi-2, que funcionó tan bien como modelos más grandes como Llama 2. Ahora, desde Microsoft explican que Phi-3 funciona mejor que la versión anterior y puede proporcionar respuestas cercanas a las de un modelo 10 veces más grande que él.

En diálogo con The Verge, Eric Boyd, vicepresidente corporativo de Microsoft Azure AI Platform, destacó que Phi-3 Mini es tan capaz como GPT-3.5 de OpenAI y otros modelos más grandes, “solo que en un factor de forma más pequeño”.

En comparación con modelos más grandes, los modelos de IA más pequeños suelen ser más económicos de ejecutar y funcionan mejor en dispositivos personales como teléfonos móviles y computadoras portátiles.

Según trascendió en The Information, a principios de este año, Microsoft estaba formando un equipo centrado específicamente en modelos de IA más livianos. De hecho, junto a Phi, la empresa también ha construido Orca-Math, un modelo centrado en la resolución de problemas matemáticos.

Cómo se entrenó Phi-3

De acuerdo con Boyd, Phi-3 fue entrenado con un “plan de estudios”, un enfoque similar a cómo los niños aprenden de los cuentos antes de dormir, utilizando palabras simples y estructuras de oraciones amplias.

“No hay suficientes libros para niños, así que tomamos una lista de más de 3.000 palabras y le pedimos a un LLM que hiciera ‘libros para niños’ para enseñar Phi”, explicó.

El experto añadió que Phi-3 simplemente se basó en lo aprendido en iteraciones anteriores. Mientras que Phi-1 se centró en la codificación y Phi-2 comenzó a aprender a razonar, Phi-3 es mejor codificando y razonando.

Asimismo, si bien Phi-3 tiene algunos conocimientos generales, Boyd aceptó que no puede igualar la amplitud de conocimiento de modelos más grandes como GPT-4.

A pesar de ello, Phi-3 Mini representa un avance significativo en el desarrollo de modelos de IA más pequeños y eficientes, ofreciendo un amplio rendimiento en dispositivos móviles y mostrando el compromiso de Microsoft con la innovación en este campo.