Proyecto de código abierto de la semana de SD Times: Phi-3

Phi-3 es una familia de pequeños modelos de lenguaje de código abierto desarrollados y puestos a disposición por Microsoft. “Los modelos de lenguaje pequeño están diseñados para funcionar bien en tareas más simples, son más accesibles y fáciles de usar para organizaciones con recursos limitados y pueden optimizarse más fácilmente para satisfacer necesidades específicas. Son adecuados para aplicaciones que necesitan ejecutarse localmente en un dispositivo, donde una tarea no requiere un razonamiento profundo y se necesita una respuesta rápida”, escribió Misha Bilenko, vicepresidente corporativo de Microsoft GenAI, en una publicación de blog. La idea detrás del desarrollo de un modelo tan pequeño se inspiró en el investigador de Microsoft, Ronan Elden, que le leyó un cuento antes de dormir a su hija, lo que lo llevó a pensar “¿cómo aprendió esta palabra? ¿Cómo sabe cómo conectar estas palabras?» Aplicando este concepto a la inteligencia artificial, Elden preguntó qué pasaría si un modelo de IA fuera entrenado solo con palabras que pudieran entender un niño de 4 años. Phi-3 está disponible en una variedad de opciones: Phi-3-vision es un modelo de parámetros de 4.2B capaz de comprender tanto texto como visión. Phi-3-mini es un modelo de parámetros de 3.8B, disponible en opciones de longitud de contexto de 128K y 4K. Phi -3-small es un modelo con parámetros 7B, disponible en opciones de longitud de contexto 128K y 4K Phi-3-medium es un modelo con parámetros 14B, disponible en opciones de longitud de contexto 128K y 4K Phi-3-vision es el primer modelo multimodal de la familia y puede generar información a partir de gráficos y diagramas «Phi-3-vision se basa en las capacidades de lenguaje del Phi-3-mini, y continúa integrando un lenguaje sólido y una calidad de razonamiento de imagen en un modelo pequeño», escribió Bilenko. Según Microsoft, en comparación con otros modelos, el Phi-3 funciona bien. Por ejemplo, Phi-3-small supera a GPT-3.5T en una variedad de pruebas comparativas de lenguaje, razonamiento, codificación y matemáticas, mientras que Phi-3-medium supera a Gemini 1.0 Pro. Además, Phi-3-vision supera a Claude-3 Haiku. y Gemini 1.0 Pro V en tareas generales de razonamiento visual, OCR y tareas de comprensión de tablas y gráficos. Todos los modelos Phi-3 están actualmente disponibles en Azure AI y Hugging Face.

About Francisco

Check Also

Libro electrónico: Una guía práctica para construir una estrategia de datos e IA

Libro electrónico: Una guía práctica para crear una estrategia de datos e inteligencia artificial | …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *