Sistema Informáticos EuropeosSistema Informáticos Europeos
  • Productos
    • Plataformas
    • Software
    • Soluciones
  • Servicios
    • Redes
    • Almacenamiento
    • Seguridad
    • Virtualización
  • Proyectos
    • Desarrollos HPC
    • Proyectos I+D+i
  • Novedades
    • Noticias SIE
    • Casos de éxito
    • SIE Con la ciencia
    • Otras noticias
  • Conócenos
    • Nosotros
    • Contacto

El Grupo CAPS aumenta sus Unidades de Cómputo con los procesadores AMD EPYC™ serie 9004

31 julio, 2024Novedades SIEStefano Lione

Esta evolución supone una gran mejora para sus operaciones de Arquitectura de Computadoras.

Se consigue una optimización del Clúster ‘echo’, que pertenece al grupo CAPS en la Universidad de Murcia, con un Incremento del 36% de Unidades de Cómputo con el procesador 9754 de AMD

El investigador Eduardo José Gómez Hernández, parte del grupo CAPS en la Universidad de Murcia, da su testimonio sobre las mejoras en los equipos con los procesadores AMD EPYC™ serie 9004
http://www.sie.es/wp-content/uploads/2024/07/232118950_AMD-EPYC-Bergamo-B-Roll_5.mp4

 

Eduardo José Gómez Hernández es  un estudiante de doctorado en el Departamento de Ingeniería Informática de la Universidad de Murcia. Además, realizó parte de sus estudios en la Universidad de Uppsala, Suecia.

Se desarrolla como Arquitecto de Computadoras y actualmente esta investigando con microarquitecturas x86. Sus intereses como investigador se centran, además de en Arquitectura de Computadores, en coherencia de cache, jerarquía de memoria y arquitecturas multiprocesador/multinúcleo.

Por supuesto, administra un clúster y tiene experiencia de mas de 10 años con sistemas GNU/Linux.

Dentro de la facultad de Informática de la Universidad de Murcia esta dentro de grupo CAPS. Hace poco sus equipos fueron actualizados de la mano de SIE con AMD EPYC™ 9754 y nos cuenta el genial cambio que esto supuso en su flujo de trabajo:

 

 

“A principios del 2020, el grupo de investigación CAPS (Computer Architecture & Parallel Systems) de la Universidad de Murcia, gracias al proyecto ECHO financiado por la ERC Consolidator Grant de la Unión Europea, instaló su nuevo clúster “echo” para la investigación, reemplazando al anterior, ya obsoleto, “castillo”. “echo” contaba originalmente con 10 nodos AMD EPYC™ 7002 (“Rome”) de 64 cores, al que se le suma un nodo adicional para almacenamiento, gestión de colas e inicio de sesión.

 

Con un total de 640 cores, 2.5TiB de memoria RAM y 27TiB de almacenamiento, el grupo ha sido capaz de realizar grandes progresos en sus investigaciones en el ámbito de la Arquitectura de Computadores, logrando publicar su resultados de investigación en las conferencias y revistas más importantes del campo.

 

En el año 2023, el clúster recibió su primera ampliación, añadiendo 2 nodos con un total de 4 CPUs extraídos del anterior clúster (“castillo”), y el proyecto HEEDA, financiado por el Ministerio de Ciencia e Innovación del Gobierno de España, permitió adquirir un nodo con un procesador AMD EPYC™ 7003 (“Milan”). Las nuevas máquinas se destinaron a investigar la tecnología ya deshabilitada, TSX. Mientras tanto, el nodo con AMD EPYC™ serie 7003 se suma a los 10 nodos AMD 7002 existentes, aumentando la capacidad para realizar nuevas simulaciones en nuestras investigaciones.

 

En total, para el propósito principal del grupo, contamos con de 704 cores, y dado que en nuestro trabajo realizamos cientos de miles de simulaciones mono-hilo, equivale a 704 simulaciones en paralelo. Algunas simulaciones son más rápidas y menos exigentes, mientras que otras se ejecutan durante semanas.

 

Este año, 2024, con una fracción de 1/7 del coste inicial del clúster, hemos incluido un nodo con 2 AMD EPYC™ 9754 y 1.5TiB de RAM, financiados por el Ministerio de Ciencia e Innovación del Gobierno de España bajo el proyecto DAMAS. Llegar a esta capacidad de cómputo usando como referencia el precio de la primera extensión costaría casi el doble. Este nuevo nodo aumenta en 256 el número de cores disponibles para nuestras simulaciones, llegando a un total de 960 simulaciones en paralelo, un 36% más.

“Como administrador, no es solo el hecho de que tener todo comprimido en una única máquina facilita la instalación y mantenimiento, sino que además como usuario, cuenta con las tecnologías más modernas, como AVX512, que ya estamos integrando en nuestros proyectos.“
Esta última ampliación, por sí misma ya es increíble, pero no son solo esos 256 trabajos adicionales, sino que cada uno de esos trabajos se están ejecutando, de media, un 25-40% más rápido que en el resto de máquinas, lo que nos está otorgando una capacidad de cómputo más elevada de lo que habíamos previsto. Esta mejora parece venir de dos focos principales: el incremento de la caché interna del procesador y de las mejoras propias de la arquitectura respecto a las generaciones anteriores.
Como administrador, no es solo el hecho de que tener todo comprimido en una única máquina facilita la instalación y mantenimiento, sino que además como usuario, cuenta con las tecnologías más modernas, como AVX512, que ya estamos integrando en nuestros proyectos. Principalmente, tenemos dos grupos de usuarios, los que ejecutan 100K trabajos cada 3-4 días, pero que en 24/48h han terminado, y los que ejecutan 30K trabajos cada semana, pero tardan de 3 a 7 días. Antes de la instalación del nuevo nodo, era habitual observar largas esperas, en las colas de trabajos, durante las fechas críticas antes de una publicación (lo que comúnmente llamamos deadlines). Tras la inclusión del las 2 CPUs AMD EPYC™ 9004, y a pesar del aumento de usuarios, resulta posible encontrar algún que otro hueco durante estos momentos críticos.

 

El apoyo proporcionado por el clúster “echo”, alimentado principalmente por procesadores AMD, ha sido imprescindible para el éxito del talentoso grupo de investigación CAPS. Recientemente, desde la incorporación de estos procesadores AMD en la infraestructura del grupo, han facilitado el desarrollo de investigaciones de vanguardia. El potencial de CAPS, anteriormente limitado por sus recursos hardware, ha sido liberado, posicionando a la Universidad de Murcia en el TOP 2 Europeo en arquitectura de computadores (años 2020-2024)“

Facultad de Informática de la Universidad de Murcia

  • Nota legal
  • Responsabilidad Social Corporativa
  • Web Builder and IA images by Kosta TS
© 2020 Sistemas Informáticos Europeos, todos los derechos reservados.