La APU AMD Instinct MI300A con GPU CDNA 3, CPU Zen 4 y memoria unificada ofrece hasta 4 veces la velocidad de las GPU discretas en HPC

Las APU Instinct MI300A de AMD ofrecen una mejora sustancial del rendimiento en cargas de trabajo HPC en comparación con las GPU discretas tradicionales. Dejando de lado las GPU discretas, las APU AMD Instinct MI300A potencian cargas de trabajo HPC con un rendimiento hasta 4 veces mayor. AMD Instinct MI300A es la realización de la plataforma “APU Exascale” diseñada hace años. La idea era colocar una GPU de alto rendimiento junto con una CPU de alto rendimiento en el mismo paquete aprovechando un grupo de memoria unificado. Para HPC, estos diseños de acelerador/coprocesador ofrecen mayores beneficios de rendimiento por vatio, pero requieren una gran portabilidad, ajuste y mantenimiento de aplicaciones con millones de líneas de código, lo que puede resultar un poco complicado. Sin embargo, parece que los investigadores han utilizado dos modelos de programación populares, OpenMP y OpenACC, para aprovechar al máximo el gigante de las APU de próxima generación de AMD. Para este trabajo de investigación, titulado «Transferencia de aplicaciones HPC a AMD Instinct MI300A usando memoria unificada y OpenMP», se utiliza el marco OpenFOAM, que es una biblioteca C++ de código abierto: proporcionamos una maqueta del modelo de programación de APU y demostramos la facilidad y flexibilidad. Portación de códigos a MI300A con OpenMP. Elaboramos nuestro método de aceleración incremental de producción ampliamente utilizado en código de la industria: OpenFOAM. Debido a que el acelerador AMD Instinct MI300A utiliza una interfaz HBM unificada, elimina la necesidad de replicación de datos y no requiere una distinción de programación entre los espacios de memoria del host y del dispositivo. Además, el paquete de software ROCm de AMD proporciona optimizaciones adicionales que ayudan a combinar todos los segmentos de la APU en un único paquete coherente y heterogéneo. Para resumir brevemente las APU AMD Instinct MI300A: el primer paquete integrado de CPU+GPU dirigido al mercado de supercomputadoras exaescala AMD MI300A (CPU + GPU integradas) 153 mil millones de transistores Hasta 24 Zen 4 núcleos Arquitectura de GPU CDNA 3 Hasta 192 GB de memoria HBM3 Arriba a 8 chiplets + 8 pilas de memoria (proceso de 5 nm + 6 nm) Fuente de la imagen: Aarxiv Como resultado, el rendimiento obtiene una gran ventaja. En la evaluación utilizando el punto de referencia Motorcycle HPC de OpenFOAM, la APU AMD Instinct MI300A se probó con la GPU AMD Instinct MI210, NVIDIA A100 de 80 GB y NVIDIA H100 (80 GB). Las GPU AMD se ejecutaban en la pila ROCm 6.0 y las GPU NVIDIA se ejecutaban en la pila CUDA 12.2.2. El punto de referencia se configuró para ejecutarse durante 20 pasos de tiempo y el tiempo de ejecución promedio por paso de tiempo (segundos) se tomó como figura de mérito (FOM). Las tres configuraciones, más el Instinct MI300A, utilizaron una CPU discreta, por lo que se configuró una CPU con socket con administración de memoria heterogénea para permitir que las GPU direccionen la memoria del sistema y ejecuten el punto de referencia. Al llegar a las pruebas, los resultados se normalizaron para el sistema NVIDIA H100, que ofrecía el mejor rendimiento de GPU discreta entre los tres chips discretos, pero la APU Instinct MI300A logró una ganancia 4 veces mayor en comparación con NVIDIA H100 y una ganancia 5 veces mayor en comparación con el acelerador Instinct MI210. . En las GPU, más del 65% del tiempo se dedica a migraciones de páginas: actualizar tablas de GPU y copiar datos entre el host y el dispositivo. En la APU, la memoria física unificada compartida entre los núcleos de la CPU y las unidades de cómputo de la GPU elimina por completo la sobrecarga de las migraciones de páginas, lo que resulta en un aumento significativo en el rendimiento. Fuente de la imagen: Aarxiv También se descubrió que el AMD Instinct MI300A con un solo paquete de CPU Zen 4 era dos veces más rápido que una CPU Zen 4 de un solo socket con una solución de GPU discreta. La sobrecarga de la APU MI300A con múltiples procesos mejoró aún más el rendimiento 2 veces (probando con 3-6 núcleos de CPU por APU), lo cual es mucho mejor que la falta de escalabilidad en una configuración dGPU + dCPU. Como resultado, parece que las capacidades informáticas de la APU AMD Instinct MI300A no tendrán rival en el segmento HPC. NVIDIA ha dado un paso atrás con respecto al rendimiento tradicional de HPC en su línea Blackwell de próxima generación, ya que la inteligencia artificial parece ser la principal moda en estos días y, aunque AMD abordará este problema con sus aceleradores MI300X y sus futuras actualizaciones, parece que el segmento de HPC pondrá a AMD en primer plano. Fuente de noticias: Nicholas Malaya Comparte esta historia Facebook Twitter

About Carlos Carraveo Jimenez

Check Also

¡Boom, 90 vulnerabilidades de seguridad parcheadas por Intel!

Los fallos de seguridad siempre han existido y siempre existirán. Sin embargo, una vez identificados, …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *