SIE LANZA SUS SOLUCIONES BASADAS EN NVDIA PASCAL
Sistemas Informáticos Europeos, ha empezado en este mes a suministrar a sus clientes, los equipos SIE Ladon basados en las nuevas GPUs de tecnología Pascal, además de disponer de máquinas para que sus clientes puedan hacer pruebas en remoto.
Estas representan una mejora que en precios muy similares, supone el paso de 4,5 Tflops a 6,5 Tflops y de 5,1 Tflops a 9 Tflops, como podemos ver en la tabla siguiente.
Además y gracias a encontrarse todos los núcleos en un nuevo y único procesador mucho más potente que en las gamas Kepler y Maxwell, la nueva GTX 1080 ofrece tanto en simple como en doble precisión el rendimiento más potente que ha ofrecido NVDIA hasta la fecha.
Las posibilidades de cálculo paralelo que ofrece esta nueva tecnología permiten dar un salto espectacular en la reducción de tiempos de procesado. Además la GTX 1080, cambia de la tecnología de memoria GDDR5 a la GDDR5X, que también aumenta la velocidad de acceso a datos.
En las pruebas realizadas por nuestros clientes, como la UAB, se puede ver la mejora de rendimiento en programas como Amber 16, que ya está disponible para el nuevo estándar CUDA 8 RC.
Podemos ver, que la mejora frente a la tarjeta GTX Titan X (la más potente en un solo procesador de la generación anterior), es del orden de un 50% de mejora en el rendimiento.
Otras pruebas realizadas por investigadores de la URV, en códigos propios, revelan la misma tendencia.
Si recurrimos a las comparativas que han realizado los propios desarrolladores de Amber 16, vemos que la mejora se confirma de igual modo
Tienen toda la información en: http://ambermd.org/gpus/benchmarks.htm
Frente a la Titan X de edición estándar, la mejora con un test de 23.558 átomos, ronda también el 50% y llega a ser del doble frente a la K20.
También cabe destacar, que la tecnología Maxwell no era capaz de ejecutar códigos en doble precisión con eficacia, mientras que la nueva tecnología Pascal los ejecuta, con una pérdida de rendimiento que era mucho mayor en generaciones anteriores.
Además, también cabe mencionar que frente a la Tesla K40 o la GTX Titan X, se ha producido una reducción de consumo de 250 W a 150 W. Esta variación en el consumo, representa que en los equipos SIE Ladon G, que equipan 4 GPUs, reducimos el costo de mantenimiento en 400 W / h, que para sistemas que funciona 24 horas al día, supone un ahorro mensual que puede rondar los 41 euros en la factura de la luz.
Pero además, debemos considerar que esa disipación de calor, ha de ser refrigerada, con una eficiencia de 1/1,5. Es decir, que por cada watio consumido, se necesitan 1,5 W de refrigeración y por tanto el ahorro mensual puede rondar los 100 euros mensuales, es decir, 1.200 euros anuales.
Ante tanta mejora, deberíamos plantearnos, cuales son las limitaciones:
1º Que nuestros cálculos deben estar muy bien paralelizados, porque si no, no podremos migrar de cálculo en CPU a cálculo en GPU.
2º Que necesitamos hacer una migración desde la tecnología x86 a CUDA. Esto se puede afrontar con las librerías CUDA o a través de estándar como OpenACC, que facilita mucho desarrollar códigos en el estándar Open CL.
3º Que las nuevas tarjetas NVDIA Pascal, únicamente funcionan en CUDA 8. De momento, nosotros estamos realizando las pruebas con la versión CUDA 8 RC (reléase candidate), que es breve será la versión CUDA 8 definitiva. Por tanto, solo si disponemos de programas como Amber 16, tenemos los códigos binarios o hemos desarrollado nosotros mismos los códigos, podremos usar esta nueva versión de CUDA.
El consejo de SIE es que si los investigadores necesitan usar códigos que esten desarrollados en CUDA 5.5 a CUDA 7.5, sigan recurriendo a tarjeta como la NVDIA Tesla K40, en especial, si necesitan ejecutar doble precisión.
En cualquier caso, SIE tiene equipos con ambas tecnologías, por si nuestros clientes desean hacer pruebas reales y comparativas entre sus distintos programas para comparar el rendimiento.
La gama SIE Ladon, ofrece soluciones basadas en Tesla Kepler y Tesla Pascal con hasta 8 tarjetas de GPU por nodo en tan solo 2u, lo que ofrece una gran densidad de cálculo.