OpenAI resuelve el problema de los datos estructurados para los desarrolladores

OpenAI resuelve el problema de los datos estructurados para los desarrolladores

OpenAI presentó «Resultados estructurados», una nueva función API diseñada para abordar el desafío de larga data de generar datos estructurados de manera confiable a partir de grandes modelos de lenguaje (LLM). La característica, ahora disponible, garantiza que los resultados generados por el modelo se adhieran a los esquemas JSON definidos por el desarrollador. La generación de datos estructurados a partir de entradas no estructuradas es la piedra angular de muchas aplicaciones de IA en la actualidad. Los desarrolladores aprovechan la API de OpenAI para crear asistentes sofisticados que pueden recuperar datos, responder preguntas complejas mediante llamadas a funciones, extraer datos estructurados para una ingesta de datos fluida y habilitar flujos de trabajo de varios pasos donde los LLM pueden tomar especificaciones de acciones. Sin embargo, las limitaciones inherentes de los LLM a la hora de producir resultados estructurados de forma coherente han llevado a los desarrolladores a utilizar soluciones alternativas, como herramientas de código abierto, técnicas de solicitud complejas e intentos de solicitud repetidos. Estas soluciones alternativas, si bien son funcionales, añaden complejidad y comprometen la eficiencia. Los resultados estructurados de OpenAI prometen eliminar estas soluciones. Esto se logra restringiendo los modelos OpenAI para que coincidan con los esquemas proporcionados por los desarrolladores y entrenando los modelos para comprender mejor y adherirse a estructuras de datos complejas. «Los resultados estructurados resuelven este problema restringiendo los modelos de OpenAI para que coincidan con los patrones proporcionados por los desarrolladores y entrenando nuestros modelos para comprender mejor los patrones complicados», dijo OpenAI en una publicación de blog. Las evaluaciones internas que utilizan esquemas JSON complejos han mostrado resultados notables. El último modelo, gpt-4o-2024-08-06, logró una puntuación perfecta del 100 % en cumplimiento de los resultados estructurados, una mejora significativa con respecto al anterior gpt-4-0613, que obtuvo una puntuación inferior al 40 %. Los resultados estructurados se ofrecen en dos implementaciones clave: Llamada a función: este método, habilitado al establecer estricto: verdadero dentro de una definición de función, permite a los desarrolladores definir la estructura precisa de los datos devueltos por las funciones llamadas desde el modelo. Esta característica es compatible con todos los modelos que admiten las herramientas, incluidos gpt-4-0613, gpt-3.5-turbo-0613 y posteriores. Parámetro de formato de respuesta: este enfoque permite a los desarrolladores proporcionar un esquema JSON a través de la nueva opción json_schema dentro del parámetro Response_format. Esto es especialmente útil cuando el modelo necesita responder directamente a los usuarios en un formato estructurado sin invocar herramientas. Actualmente, esta función es compatible con los últimos modelos GPT-4o: gpt-4o-2024-08-06 y gpt-4o-mini-2024-07-18. Establecer estricto: verdadero dentro de Response_format garantiza que la salida del modelo se ajuste al esquema proporcionado. OpenAI ha priorizado la seguridad en los resultados estructurados, asegurando que se alinee con las políticas de seguridad preexistentes. El modelo conserva la capacidad de rechazar solicitudes no seguras, lo que se indica a los desarrolladores mediante un nuevo valor de cadena de rechazo en las respuestas de la API. Esto permite la detección programática de desperdicios, lo que garantiza un comportamiento predecible y un manejo de errores simplificado. Específicamente, la ausencia de un valor de rechazo y un proceso de compilación exitoso (indicado por Finish_reason) garantizan una salida JSON válida que coincida con el esquema definido por el desarrollador. Se ha integrado soporte nativo para resultados estructurados en los SDK de Python y Node de OpenAI, lo que los hace más fáciles de usar. Los desarrolladores pueden definir esquemas para herramientas o formatos de respuesta proporcionando un objeto Pydantic o Zod, que los SDK convierten automáticamente a un esquema JSON. Los SDK también manejan la deserialización de respuestas JSON en estructuras de datos tipificadas y manejan basura potencial. Nuestro modelo GPT-4o más nuevo cuesta un 50% menos en tokens de entrada y un 33% menos en tokens de salida. También admite resultados estructurados, lo que garantiza que los resultados de su modelo coincidan exactamente con sus esquemas JSON. pic.twitter.com/9HXp5UAHth – Desarrolladores de OpenAI (@OpenAIDevs) 7 de agosto de 2024 Los desarrolladores que deseen comenzar con resultados estructurados pueden consultar los documentos de OpenAI aquí. (Foto de Growtika) Ver también: Hugging Face se asocia con NVIDIA para democratizar la inferencia de IA ¿Quiere aprender más sobre IA y big data de la mano de los líderes de la industria? Consulte la AI & Big Data Expo que se llevará a cabo en Ámsterdam, California y Londres. El evento completo se llevará a cabo simultáneamente con otros eventos importantes, incluida la Conferencia de Automatización Inteligente, BlockX, la Semana de Transformación Digital y la Cyber ​​​​Security & Cloud Expo. Explore otros próximos eventos y seminarios web de tecnología empresarial proporcionados por TechForge aquí. Etiquetas: IA, inteligencia artificial, desarrolladores, gpt-4o, json, modelo de lenguaje grande, llm, openai, datos estructurados

About Francisco

Check Also

Sitio web de Odoo Adquirente de pagos Square

Sitio web de Odoo Adquirente de pagos Square

Rahul Gulati 3 Badge Rahul es un analista de negocios especializado en la plataforma Odoo. …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *