ServiceNow, Hugging Face y NVIDIA lanzan nuevos LLM abiertos para desarrolladores

ServiceNow, Hugging Face y NVIDIA se han asociado para lanzar una nueva familia de LLM abiertos llamada StarCoder2 que está diseñada para desarrolladores.

StarCoder2 recibió capacitación en programación 619 y está destinado a proporcionar a los desarrolladores funciones como generación de código, generación de flujo de trabajo y resumen de texto, por nombrar algunas. Las empresas prevén que los modelos StarCoder2 serán útiles tanto para los ingenieros de software como para los ciudadanos desarrolladores.

Fue desarrollado dentro del código grande community, que es un grupo dedicado al desarrollo responsable de LLM. El proyecto fue administrado tanto por ServiceNow como por Hugging Face.

StarCoder 2 viene en tres tamaños de modelo diferentes: ServiceNow entrenó un modelo de 3 mil millones de parámetros, Hugging Face entrenó un modelo de 7 mil millones de parámetros y NVIDIA entrenó un modelo de 15 mil millones de parámetros.

Los modelos más pequeños están diseñados para ofrecer un rendimiento potente utilizando pequeñas cantidades de potencia informática. Según las empresas, el modelo de 3 mil millones de parámetros iguala el rendimiento del modelo de 15 mil millones de parámetros de la versión original de StarCoder.

Los usuarios podrán ajustar estos modelos para satisfacer sus necesidades específicas, utilizando herramientas de código abierto como NVIDIA NeMo o Hugging Face TRL.

«StarCoder2 es un testimonio del poder combinado de la colaboración científica abierta y las prácticas responsables de IA con una cadena de suministro de datos ética», dijo Harm de Vries, líder del equipo de desarrollo StarCoder2 de ServiceNow y codirector de BigCode. “El modelo de acceso abierto de última generación mejora el rendimiento de la IA generativa anterior para aumentar la productividad de los desarrolladores y les proporciona igual acceso a los beneficios de la IA de generación de código, lo que a su vez permite a las organizaciones de cualquier tamaño cumplir más fácilmente con sus necesidades completas. potencial de negocio”.

Leandro von Werra, ingeniero de aprendizaje automático de Hugging Face y codirector de BigCode, añadió: “Los esfuerzos conjuntos liderados por Hugging Face, ServiceNow y NVIDIA permiten el lanzamiento de potentes modelos base que permiten a la comunidad crear una amplia gama de aplicaciones más de manera eficiente con total transparencia en los datos y la capacitación. StarCoder2 es un testimonio del potencial del código abierto y de la ciencia abierta mientras trabajamos para democratizar la IA responsable”.


Source link

About David Lopez

Check Also

Una mejor seguridad web significa menos comodidad, por ahora

La web hace nuestra vida más cómoda. Podemos pedir una camiseta o una pizza con …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *