El “secreto” detrás de la sofisticada telemetría de NVIDIA: el papel de Buckets, Speedo y Continuous Virtual Binning (CVB)

Ya había escrito un artículo muy similar hace casi un año sobre el binning de la GeForce RTX 4070 y la diferencia entre tarjetas MSRP y OC. Sin embargo, la parte teórica de la segunda página fue un poco descuidada, muy equivocadamente en mi opinión. El lanzamiento de las supertarjetas se acerca y siempre surge la pregunta de cómo NVIDIA conseguirá utilizar la energía suministrada de forma mucho más eficiente. Por supuesto, no puedo ni quiero publicar un documento técnico aquí o abrumar por completo al lector con frivolidades técnicas, pero si desglosas todo a un nivel normal, creo que en realidad es bastante emocionante de leer.

Binning como preselección y el papel del “Speedo”

Por supuesto, tengo que aprovechar esta oportunidad para explicarte los términos más importantes. Pero antes que nada, seamos bastante generales. Binning se refiere a la clasificación de las GPU de una serie de modelos en diferentes clases de calidad (“depósitos”) dentro de un cierto rango de origen. Por ejemplo, sabemos contenedor 0 (peor) y contenedor 1 (mejor). Por lo tanto, las GPU individuales de un «cubo» de este tipo también pueden diferir entre sí, pero sólo dentro de las tolerancias especificadas (la llamada «lotería de GPU» en el cliente). Lo que antes se consideraba parcialmente defectuoso acaba en una categoría de peso inferior en una GPU más delgada con los mismos chips iniciales y también se vuelve a clasificar en cubos. Sin embargo, el resto inutilizable se convierte en desperdicio.

Cuando compras una tarjeta gráfica, puede que sea un producto con diferentes velocidades de reloj anunciadas, pero todas tienen el mismo diseño y el mismo proceso de fabricación. Sin embargo, las GPU están separadas entre sí debido a la variación del proceso (variaciones de calidad). Sin embargo, todos tienen algo en común: una especificación de máximo rendimiento llamada TGP (también conocida como Total GPU Power). Esto también me permite estropear el “binning virtual”, del que hablaré más adelante.

Después de los cubos viene el siguiente paso. Aquí, la primera preselección se utiliza generalmente para reunir otros «cubos» (refinados) con velocidades de reloj casi idénticas. Como es bien sabido, el AIC y el cliente final siempre dan la mayor importancia a la relación rendimiento-energía requerida, por lo que NVIDIA ofrece a los clientes exactamente esos “cubos” que solo incluyen chips que también ofrecen el mismo rendimiento con un TGP similar. . Esto puede ser más económico o más sediento, pero dentro del grupo, todas las GPU son al menos más o menos igualmente rápidas. La única diferencia entre los «cubos» es el diferente consumo de energía.

Dependiendo del nivel de calidad, estos cangilones pueden funcionar con voltajes muy diferentes. La especificación de energía es el rendimiento virtual máximo de dicho depósito. Al final, la implementación real consiste únicamente en operar chips más lentos a un voltaje más alto y chips más rápidos a un voltaje más bajo para lograr el mejor rendimiento para un entorno de rendimiento determinado. La velocidad del reloj del chip (lenta o rápida) está controlada por una variable llamada «Speedo», que se graba en la GPU durante el llamado flujo ATE como parte de la fase FT (prueba final).

Ahora tengo que explicar algunas cosas. ATE significa «Equipo de prueba automatizado». Estos son sistemas que prueban automáticamente componentes electrónicos o placas de circuito impreso para determinar su funcionalidad y calidad (para aumentar la eficiencia de la producción y reducir la tasa de errores). La “Fase de prueba final” es la última fase de prueba en un proceso de producción o desarrollo, donde se rectifican todos los errores previamente identificados y se prueba la funcionalidad, el rendimiento y la calidad del producto.

«Speedo» es un término utilizado en la industria de semiconductores para circuitos que monitorean las variaciones de proceso, voltaje y temperatura (PVT) en circuitos integrados. Estos circuitos Speedo especializados permiten a las GPU ajustar dinámicamente su rendimiento y consumo de energía teniendo en cuenta la respuesta de los chips a los cambios de proceso, voltaje y temperatura. Estos ajustes se pueden lograr, por ejemplo, cambiando la frecuencia del reloj y el voltaje de suministro. Llegaré a esto en la página siguiente.

Es importante tener en cuenta que el término «Speedo» no está estandarizado y puede tener diferentes significados en distintas empresas. Sin embargo, se puede dar una explicación general de cómo se suele utilizar este término:

  • Medición del rendimiento y la calidad.:
    Los sistemas Speedo se utilizan para medir el rendimiento y la calidad de los dispositivos semiconductores. Por lo general, esto implica evaluar la velocidad a la que puede funcionar un chip y determinar su rendimiento máximo.
  • Variaciones del proceso:
    En la fabricación de semiconductores, existen variaciones naturales en el proceso de fabricación. Estas variaciones pueden afectar el rendimiento de los chips individuales. Un sistema Speedo ayuda a identificar y cuantificar estas variaciones.
  • Proceso de agrupación:
    Una vez fabricados y probados los chips, a menudo se clasifican mediante un proceso llamado «binning». Aquí, los chips se clasifican según su rendimiento y otros parámetros. Las mediciones del velocímetro son una parte esencial de este proceso, ya que determinan qué tan bien se desempeña un chip y en qué categoría de desempeño se encuentra.
  • Comentarios de optimización y diseño:
    Los datos de Speedo también se pueden utilizar para optimizar el proceso de fabricación y mejorar los diseños de chips futuros. Al comprender cómo las diferentes decisiones de diseño afectan el rendimiento de los chips, los ingenieros pueden desarrollar mejores diseños para las generaciones futuras.
  • Dependencia de temperatura y voltaje.:
    Además de medir el rendimiento, los sistemas Speedo suelen tener en cuenta cómo el rendimiento de un chip depende de factores como la temperatura y el voltaje de suministro. Esto es importante para determinar las condiciones de funcionamiento y la confiabilidad del chip.

Por lo tanto, los sistemas Speedo son una parte importante e incluso indispensable de la industria de los semiconductores, ya que permiten una evaluación detallada y precisa del rendimiento de los dispositivos semiconductores, lo cual es esencial para el control de calidad y la categorización de productos. Veremos cuán importante es justo después de pasar página.


Source link

About Miriam Sagarzazu Olaizaola

Blogger desde hace más de 5 años, dedicada a la información tecnológica y adicta a Linux. He convertido mi afición por escribir en mi profesión.

Check Also

Explorando la sinergia entre las apuestas deportivas y las tendencias tecnológicas

Imagínese ser un entusiasta de los deportes en el mundo actual, donde la emoción del …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *