Los puntos de referencia de la APU AMD Strix Point «Ryzen AI 9 365» revelaron IPC, latencia, rendimiento y varios aspectos de rendimiento de Zen 5

Los puntos de referencia de la APU AMD Strix Point «Ryzen AI 9 365» revelaron IPC, latencia, rendimiento y varios aspectos de rendimiento de Zen 5

Según se informa, la APU Zen 5 Zen 5 Strix Point «Ryzen AI 9 365» de AMD ha sido probada por David Huang, quien tiene un análisis en profundidad de IPC, latencia y rendimiento. La APU AMD Ryzen AI 9 365 «Strix Point» se prueba en una multitud de puntos de referencia antes del lanzamiento, el IPC de Zen 5, el rendimiento, la latencia y una nota más detallada: el blog de David Huang afirma que los números mencionados aquí se basan en una muestra de ingeniería del APU AMD Strix Point, principalmente Ryzen AI 9 365, así que tómelos con cautela, ya que pueden no ser representativos del producto final. También indica explícitamente que el sistema de prueba estaba ejecutando firmware/software no oficial del sistema. Fuente de la imagen: blog de David Huang Para empezar, David tuvo acceso a una de las primeras computadoras portátiles AMD Strix Point que, según se informa, cuenta con el SKU Ryzen AI 9 365. La plataforma de prueba utilizó memoria LPDDR5x-7500 con 32 GB. El enfoque principal de la prueba de hoy es IPC y el rendimiento, comenzando con la herramienta InstruccionesRate para medir el rendimiento/latencia de instrucciones de tres generaciones de CPU Zen, incluidas las arquitecturas Zen 3, Zen 4 y Zen 5, mientras que Zen 5 presenta. mejoras debido a su diseño radical, la arquitectura también tiene algunas desventajas que son las siguientes: El rendimiento de varias instrucciones ALU escalares se ha incrementado significativamente, pero como la cantidad de unidades vectoriales en el Zen 5 móvil se reduce a la mitad en comparación con las computadoras de escritorio y servidores, El rendimiento SIMD en esta prueba permanece sin cambios en comparación con Zen 4. Incluso en el núcleo Zen 5 con la mitad de unidades vectoriales, las operaciones de almacenamiento SIMD de todos los anchos aún se duplican en comparación con la generación anterior, y el rendimiento SIMD de carga del archivo SIMD alcanza 1:1; La capacidad de procesamiento de sucursales se ha mejorado significativamente: el número de sucursales no utilizadas que se pueden procesar por ciclo aumentó de dos a tres, y dos sucursales tomadas por ciclo. Esto debería estar relacionado con el nuevo diseño del front-end; La latencia de los cálculos de suma de enteros SIMD SSE/AVX/AVX512 de 128/256/512 bits se ha aumentado a 2 ciclos. Este cambio podría facilitar el mantenimiento de altas frecuencias. El rendimiento de las operaciones de suma de enteros SIMD de 128/256 bits se reduce a la mitad en comparación con Zen 4, pero el de 512 bits permanece sin cambios. Se especula que este problema sólo existe en los núcleos Zen 5 con media SIMD, lo que puede estar relacionado con la asignación de puertos; Se eliminó la funcionalidad de combinación nop introducida en Zen 4. Ya no es posible fusionar una declaración nop con otra declaración en la misma macrooperación; Se cambió el rendimiento de algunas operaciones de registro lógico, unificando el rendimiento de algunas operaciones de movimiento y algunas operaciones de borrado de registro a 5, lo cual es una mejora mixta con respecto a Zen 4. Las pruebas también se centran en la tubería dual frontal paralela que debería afectar la obtención y decodificación de instrucciones. y almacenamiento en caché de macrooperaciones. Se afirma que al ejecutar instrucciones NOP de diferentes longitudes y números, se pueden observar las diferencias entre Zen 4 y Zen 5. Las observaciones concluyen de la siguiente manera: Zen 5 utiliza un diseño de múltiples interfaces similar al de Tremont pero más amplio, utilizando dos. decodificadores x86 de 4 anchos y caché de macrooperaciones de al menos 8 anchos para implementar cambios de nombre de 8 anchos; Considere el siguiente fenómeno: Zen 5 no puede hacer que el ancho de banda de decodificación x86 supere 4 al ejecutar instrucciones NOP sucesivas en un solo subproceso; En la sección de rendimiento de instrucciones, se probó que dos ramas tomadas se pueden procesar en un solo ciclo; Es razonable suponer que Zen 5 no utiliza una solución de almacenamiento en caché ILD previa a la decodificación similar a Gracemont, pero debe permitir que dos decodificadores funcionen simultáneamente cuando el predictor de rama predice una rama tomada, es decir, dejar que uno de los decodificadores comience a decodificar directamente desde el próxima dirección de destino de la sucursal. Desde esta perspectiva, AMD todavía necesita depender del almacenamiento en caché de macrooperaciones para lograr un alto rendimiento en escenarios de ramas dispersas. Zen 5 no solo admite la decodificación de instrucciones x86 desde dos ubicaciones en el mismo ciclo, sino que también admite la recuperación de instrucciones desde dos ubicaciones en el caché de macrooperaciones en el mismo ciclo, para lograr dos ramas tomadas por ciclo dentro de la cobertura de la macrooperación. . cache; Cuando el núcleo ejecuta dos subprocesos SMT, cada uno puede monopolizar un decodificador, de modo que el límite de rendimiento de decodificación x86 de todo el núcleo alcanza 8 en la mayoría de los casos. Luego, las pruebas avanzan hacia los aspectos más de rendimiento de las APU AMD Strix Point. Una vez más se utiliza el chip Ryzen AI 9 365 pero esta vez se compara con el Ryzen 7 7735U (Zen 3), Ryzen 7 7840U (Zen 4) y el ya mencionado Ryzen AI 9 365 (Zen 5), pero esta vez Ambos Zen 5 y Zen 5C están disponibles en el chip que se está probando. Los núcleos Zen 5C funcionan a una frecuencia de reloj mucho más baja de solo 3,30 GHz, mientras que los núcleos Zen 5 y los otros dos chips están configurados a una frecuencia de reloj fija de 4,8 GHz. El rendimiento se evaluó con SPEC CPU 2017 y Geekbench 6 (de un solo núcleo). y multinúcleo). En las especificaciones de CPU de 2017, el chip AMD Zen 5 experimenta un aumento del +9,71 % con respecto a la oferta Zen 4 y un aumento del 22,28 % con respecto a la oferta Zen 3. Los núcleos Zen 5C casi igualan al Zen 4 IPC con una frecuencia más baja. En Geekbench 6, la mejora relativa del rendimiento con respecto a Zen 3 es de hasta un 40,94% en comparación con Zen 3 y Zen 4, es de alrededor del 13,1%. Estos números están solo en un solo núcleo. Con las pruebas multinúcleo, las APU Zen 5 «Strix Point» ven un aumento del 55,45% con respecto al Zen 3 y una mejora del 24,3% con respecto al Zen 4, pero cabe señalar que los chips Zen 3 y Zen 4 ejecutaron un TDP de 28W en comparación con 54W en la APU Ryzen AI 9 365 Zen 3 – 100,00% ST IPC (generación a generación) Zen 3 – 100,00% Zen 4 – 117,37% Zen 5 – 115,28% Geekbench 6 ST Perf (relativo) Zen 3. – 100,00% Zen 4 – 124,71% Zen 5 – 140,94% La publicación del blog de David profundiza en los diversos aspectos arquitectónicos de la arquitectura Zen 5 que alimentará no solo las APU Ryzen AI 300 “Strix Point” sino también varias CPU como la Ryzen 9000 “ Granite Ridge”, la familia de servidores EPYC “Torino” de quinta generación y varias otras APU para plataformas de escritorio y portátiles. Lo que sabemos oficialmente es que los núcleos Zen 5 vienen con un aumento promedio de IPC del 16% y varía según las cargas de trabajo, por lo que una vez más aconsejaremos a nuestros lectores que tomen estos resultados con cautela. Se espera el primer lanzamiento de Zen 5 con APU Strix a mediados de julio, seguido de chips de escritorio de alto rendimiento Ryzen 9000 a finales de julio, así que estad atentos para más información. Fuente de noticias: David Huang Comparte esta historia Facebook Twitter

About Carlos Carraveo Jimenez

Check Also

MSI actualiza las placas base AM5 con AGESA BIOS 1.2.0.0a para Ryzen 9000: ¡Curve Shaper, EXPO y OPP a bordo!

MSI actualiza las placas base AM5 con AGESA BIOS 1.2.0.0a para Ryzen 9000: ¡Curve Shaper, EXPO y OPP a bordo!

MSI ha comenzado a enviar la actualización de BIOS AGESA 1.2.0.0a para sus placas base …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *