Gemma 2 recibe tres nuevos productos: una versión con parámetros 2B, ShieldGemma y Gemma Scope

Gemma 2 recibe tres nuevos productos: una versión con parámetros 2B, ShieldGemma y Gemma Scope

Google anunció tres nuevos productos que forman parte de la familia Gemma 2, una serie de modelos abiertos de IA presentados en junio. Las nuevas ofertas incluyen Gemma 2 2B, ShieldGemma y Gemma Scope. Gemma 2 2B es una opción de 2 mil millones de parámetros, que se suma a los tamaños existentes de 27 mil millones y 9 mil millones de parámetros. Según Google, este nuevo tamaño equilibra rendimiento y eficiencia y puede superar a otros modelos de su clase, incluidos todos los modelos GPT-3.5. Está optimizado con la biblioteca NVIDIA TensorRT-LLM y está disponible como NVIDIA NIM, lo que lo hace ideal para una variedad de tipos de implementación, como centros de datos, nube, estaciones de trabajo locales, PC y dispositivos perimetrales. Gemma 2 2B también se integra con Keras, JAX, Hugging Face, NVIDIA NeMo, Ollama y Gemma.cpp y pronto también se integrará con MediaPipe. Y gracias a su pequeño tamaño, puede ejecutarse en el nivel gratuito de GPU T4 en Google Colab, lo que, según Google, hará que «la experimentación y el desarrollo sean más fáciles que nunca». Ahora está disponible a través de Kaggle, Hugging Face o Vertex AI Model Garden y se puede utilizar en Google AI Studio. A continuación, ShieldGemma es un conjunto de clases de seguridad para detectar contenido malicioso en las entradas y salidas del modelo. Se dirige específicamente al discurso de odio, el acoso, el contenido sexual explícito y el contenido dañino. Los modelos de ShieldGemma son abiertos y están diseñados para permitir la colaboración y la transparencia en la comunidad de desarrollo de IA y se suman al conjunto existente de clasificadores de seguridad en el kit de herramientas de IA responsable de la empresa. Está disponible en diferentes tamaños de modelos para satisfacer sus diferentes necesidades. Por ejemplo, el modelo 2B es ideal para la clasificación en línea, mientras que 9B y 27B pueden proporcionar un mejor rendimiento para escenarios fuera de línea donde la latencia no es un problema. Según Google, todos los tamaños de modelos utilizan optimizaciones de velocidad de NVIDIA para mejorar el rendimiento. Finalmente, Gemma Scope proporciona una mayor transparencia sobre cómo los modelos de Gemma 2 toman sus decisiones y puede permitir a los investigadores comprender cómo Gemma 2 identifica patrones, procesa información y hace predicciones. Utiliza codificadores automáticos dispersos (SAE) para examinar puntos específicos en el modelo y «desempacar la información densa y compleja que procesa Gemma 2, expandiéndola a una forma que sea más fácil de analizar y comprender», explicó Google en una publicación de blog. “Estos lanzamientos representan nuestro compromiso continuo de brindar a la comunidad de IA las herramientas y recursos necesarios para construir un futuro en el que la IA beneficie a todos. «Creemos que el acceso abierto, la transparencia y la colaboración son esenciales para desarrollar una IA segura y beneficiosa», escribió Google. También te puede interesar… Google lanza Gemma, un nuevo modelo de IA diseñado pensando en los investigadores de IA. RAG es el próximo avance emocionante para los LLM

About Francisco

Check Also

Una guía básica para empezar a implementar la IA en equipos de desarrollo de software

Una guía básica para empezar a implementar la IA en equipos de desarrollo de software

En el panorama digital hipercompetitivo actual, la inteligencia artificial ya no es sólo una palabra …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *