El chip analógico de IA de China “ACCEL” supera a la competencia

Un estudio de investigación de China ha revelado que se dice que su chip de procesamiento de IA interno “ACCEL” ofrece un rendimiento 3000 veces más rápido que las GPU A100 y A800 de NVIDIA. Frente a las sanciones globales, China está trabajando para mejorar sus propias soluciones para mantener el ritmo actual de crecimiento industrial. La Universidad de Tsinghua en China desarrolló una nueva técnica para el cálculo de IA y diseñó el chip ACCEL, que aprovecha el poder de la fotónica y la tecnología analógica para lograr un rendimiento impresionante. Las cifras publicadas son muy impresionantes, pero, por supuesto, hay que tomarlas con cautela.

Fuente: Naturaleza

Sin un punto de referencia en tiempo real, no se puede afirmar que un chip sea el más rápido de su industria. Por lo tanto, ACCEL se probó en experimentos con Fashion-MNIST, la clasificación ImageNet de 3 clases y escenarios de reconocimiento de video en lapso de tiempo para determinar el rendimiento del chip de aprendizaje profundo. Logró precisiones del 85,5%, 82,0% y 92,6%, lo que demuestra que el chip se puede utilizar en diversas industrias y no se limita a un dominio específico. Esto hace que ACCEL sea particularmente interesante y será interesante ver qué perspectivas de futuro ofrece el chip.

Fuente: Naturaleza

Este chip combina las capacidades de computación analógica óptica difractiva (OAC) y computación analógica electrónica (EAC) con escalabilidad, no linealidad y flexibilidad. Para lograr tales eficiencias, el chip utiliza una arquitectura híbrida de óptica y electrónica para reducir grandes cantidades de conversiones de analógico a digital (ADC) en grandes cargas de trabajo. Esto da como resultado un rendimiento significativamente mejorado. Un artículo de investigación publicado analiza en detalle el mecanismo del chip.

Fuente: Naturaleza

Para la GPU de última generación, utilizamos NVIDIA A100, cuya velocidad de cálculo alcanza los 156 TFLOPS para float32 (ref.33). ACCEL con OAC de dos capas (400 × 400 neuronas en cada capa de OAC) y EAC de una capa (1024 × 3 neuronas) logró experimentalmente una precisión de prueba del 82,0% (línea discontinua horizontal en la Fig. 6d, e). Debido a que OAC calcula de forma pasiva, ACCEL con OAC de dos capas mejora la precisión con respecto a ACCEL con OAC de una capa sin casi ningún aumento en la latencia y el consumo de energía (Fig. 6d, e, puntos morados). Sin embargo, en una tarea de visión en tiempo real, como la conducción automática en la carretera, no podemos capturar múltiples imágenes secuenciales por adelantado para que una GPU aproveche al máximo su velocidad de procesamiento procesando múltiples flujos. simultáneamente48 (ejemplos como líneas discontinuas en la Fig. 6d, e). Para procesar imágenes secuenciales en serie con la misma precisión, ACCEL logró experimentalmente una latencia informática de 72 ns por cuadro y un consumo de energía de 4,38 nJ por cuadro, mientras que NVIDIA A100 logró una latencia de 0,26 ms por cuadro y un consumo de energía de 18,5 mJ. por cuadro.

a través de la naturaleza

Actualmente, el impacto de ACCEL y desarrollos similares de chips de IA analógicos en la industria es difícil de predecir, ya que la introducción de aceleradores de IA basados ​​en tecnología analógica aún está en el futuro. Aunque las cifras de rendimiento y las estadísticas son bastante optimistas, cabe señalar que la “implementación” en la industria no es una tarea fácil y requiere tiempo, importantes recursos financieros y una investigación exhaustiva. Sin embargo, nadie puede negar que el futuro de la informática es brillante, y es sólo cuestión de tiempo antes de que veamos tal rendimiento en la corriente principal.

Fuente: Hardware de Tom


Source link

About David Lopez

Check Also

Demostración del controlador SSD PCie 5.0 de bajo consumo de Silicon Motion: SM2508

Para completar nuestras noticias sobre el controlador SSD Computex 2024, hablemos del último proveedor importante …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *