Meta Llama 3.1 Después de lanzar los modelos Llama 3 el 18 de abril de 2024, Meta dijo que su objetivo para el futuro es hacer que Llama 3 sea multilingüe y multimodal, tenga un contexto más amplio y continúe mejorando el rendimiento general de las funciones LLM, como el razonamiento y la codificación. . El martes, Meta marcó un progreso significativo hacia este objetivo con el lanzamiento de la colección Llama 3.1 de modelos de lenguajes grandes (LLM) multilingües, que incluye contextos dramáticamente más largos, herramientas mejoradas y capacidades multilingües. Con la marca del acuerdo de licencia de modelo abierto personalizado de Meta, los modelos Llama 3.1 representan un paso significativo en la dirección de una innovación de IA de fácil acceso para aplicaciones comerciales y de investigación. En su último lanzamiento, Meta presentó versiones actualizadas de los modelos 8B y 70B junto con el lanzamiento del 405B. Estos modelos utilizan las herramientas más recientes, tienen una longitud de contexto de 128 KB y tienen capacidades de razonamiento más sólidas. Como resultado, estos modelos pueden manejar casos de uso más complejos, incluido el resumen de texto de formato largo, junto con agentes conversacionales multilingües y asistentes de codificación. Resumen: Plantillas disponibles de Llama 3.1 Meta Llama 3.1-405B Meta Llama 3.1-70B Meta Llama 3.1-8B Compatibilidad de plantillas de Llama 3.1 con productos Webkul Chatbot de IA Magento 2 que utiliza LLM de código abierto Plantillas disponibles de Meta Llama 3.1: El modelo 405B es el punto fuerte de lama 3.1. Como su nombre indica, contiene 405 mil millones de parámetros, superando al Nemotron-4-340B-Instruct de NVIDIA. Se convirtió en el LLM de código abierto más grande del mundo en ese momento. Llama-3.1-405B compite con los mejores modelos de IA en términos de habilidades de vanguardia en conocimientos generales, habilidades de conducción, matemáticas, uso de herramientas y traducción de idiomas. Meta dice que el modelo 405B está entrenado en más de 15 billones de tokens utilizando 16 mil GPU H100, lo que lo convierte en el primer modelo Llama entrenado a esta escala. Llama-3.1-405B está construido sobre una arquitectura Transformer estándar basada únicamente en el decodificador, un diseño común a muchos modelos exitosos de lenguajes grandes. La arquitectura Llama-3.1-405B se basa en la arquitectura Transformer convencional de solo decodificador, común a muchos LLM exitosos pero con adaptaciones menores. Estas pequeñas adaptaciones mejoran la estabilidad y el rendimiento del modelo durante el entrenamiento. A pesar de ser un modelo muy potente, Llama-3.1-405B será difícil para un desarrollador promedio trabajar con él debido a la necesidad de grandes recursos y habilidades computacionales. El Llama-3.1-70B logra un equilibrio entre rendimiento y eficiencia, lo que lo convierte en una excelente opción para una variedad de aplicaciones. El modelo funciona excepcionalmente bien en resumen de texto, clasificación de texto, razonamiento, modelado de lenguaje, generación de código y seguimiento de instrucciones. Supera a otros modelos de tamaño similar en numerosos puntos de referencia. Gracias a su pequeño tamaño es más fácil de gestionar en hardware estándar. El Llama-3.1-8B prioriza la velocidad y el bajo consumo de recursos, lo que lo hace ideal para dispositivos con recursos computacionales limitados. A pesar de su menor tamaño, ofrece un rendimiento competitivo en comparación con otros modelos de tamaño similar en diversas tareas. Compatibilidad de las plantillas Llama 3.1 con los productos Webkul: Magento AI Chatbot que utiliza la extensión LLM Open Source permite a los clientes utilizar un chatbot con tecnología de IA en su tienda. Los clientes utilizarán el chatbot virtual de IA para obtener información del producto y hacer cualquier pregunta que tengan. Chatbot es compatible con todos los modelos Llama-3.1, lo que le permite utilizar el nuevo y potente LLM de Meta para potenciar su chatbot. El mayor tamaño del contexto, el soporte multilingüe y el poder de razonamiento en los modelos Llama 3.1 beneficiarán a Chatbot AI. Con una velocidad más rápida, soporte multilingüe y capacidad de razonamiento, mejora el rendimiento general del chatbot de IA.
Check Also
La estabilidad general de la aplicación mejora a medida que las sesiones sin fallos se acercan al 100%
Instabug ha publicado el informe Outlook 2024 de estabilidad de aplicaciones móviles, que arroja luz …