Meta lanza los dos primeros modelos de Llama 3

Meta ha revelado la próxima generación de Llama, una familia de modelos de lenguaje grande (LLM) de código abierto desarrollados por la empresa. Meta considera que las plantillas Llama 3 son «las mejores plantillas de código abierto en su clase, punto», dijo la compañía en una publicación de blog. Lanzó los dos primeros modelos de la familia Llama 3, uno con parámetros 8B y otro con 70B. La compañía afirma que estos modelos son significativamente mejores que los modelos Llama 2 y ofrecen tasas de falso rechazo mucho más bajas, mejor alineación y mayor diversidad en las respuestas de los modelos. Según Meta, las características específicas del modelo, como el razonamiento, la generación de código y el seguimiento de instrucciones, también se han mejorado significativamente. Llama 3 ha sido previamente entrenado con más de 15T tokens de fuentes disponibles públicamente, lo que hace que el conjunto de entrenamiento de Llama 3 sea siete veces más grande que el conjunto de datos de entrenamiento de Llama 2, con también cuatro veces más código. Según Meta, durante el desarrollo de Llama 3, también desarrolló un nuevo conjunto de evaluación humana para evaluación comparativa, que contiene 1.800 sugerencias en 12 casos de uso. Estos incluyen pedir consejo, generar ideas, clasificar, responder preguntas cerradas, codificar, escribir creativamente, extraer, interpretar un personaje/persona, responder preguntas abiertas, razonar, reescribir y el resumen. El modelo de parámetros 70B venció a Claude Sonnet, Mistral Medium, GPT 3.5 y Llama 2 utilizando este nuevo conjunto de evaluación. «Con Llama 3, nos propusimos crear los mejores modelos abiertos que estén a la par con los mejores modelos propietarios disponibles en la actualidad», escribió Meta. Meta ha trabajado con muchas empresas para que Llama 3 esté lo más disponible posible. Estará disponible en AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM y Snowflake. Además, algunos proveedores de hardware también ofrecerán soporte, incluidos AMD, AWS, Dell, Intel, NVIDIA y Qualcomm. Durante los próximos meses, Meta planea actualizar Llama 3 con nuevas funciones, ventanas de contexto más largas y más tamaños de modelo. También comenzará a lanzar más modelos Llama 3 en los próximos meses. Meta dijo que sus modelos más grandes superan los parámetros de 400 mil millones. «En los próximos meses lanzaremos más modelos con nuevas características que incluyen multimodalidad, la capacidad de convertir a múltiples idiomas, una ventana de contexto mucho más larga y capacidades generales más sólidas», escribió Meta.

About Francisco

Check Also

Shopware AI Chatbot usando ChatGPT y Llama 3

Shopware AI Chatbot que utiliza ChatGPT y Llama 3 permite al cliente hacer preguntas al …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *