Las propuestas más eficientes para redes de interconexión (y por extensión para las infraestructuras TIC a las que dan soporte) serían aquellas que contribuyan en mayor medida, y transversalmente, a mejorar las prestaciones, el coste, el consumo de energía y la fiabilidad de la red. Estos cuatro aspectos serían los “pilares” en los que basar el diseño de la red, de modo que “reforzarlos” sería el objetivo básico de las técnicas empleadas en dicho diseño, tal y como puede verse en la siguiente figura:
El objetivo general de este proyecto es aumentar el nivel de eficiencia de las redes de interconexión avanzadas, de cara a su óptimo aprovechamiento en los sistemas de supercomputación y Big-Data actuales y, sobre todo, futuros. Tal y como se ha indicado en la introducción, aumentar la eficiencia de la red de interconexión implica mejorar conjuntamente sus prestaciones, su coste, su consumo de energía y su fiabilidad. Teniendo todo esto en cuenta, para conseguir el objetivo general indicado, este proyecto plantea una serie de objetivos parciales, que se detallan a continuación:
- Identificación de los requisitos de los sistemas de supercomputación y Big-Data, y del soporte ofrecido por las tecnologías avanzadas de red para poder satisfacerlos. Las aplicaciones empleadas para proporcionar, entre otros, servicios de supercomputación y de proceso y análisis de datos, requieren que las infraestructuras hardware que las soportan ofrezcan un determinado nivel de rendimiento en varios aspectos. En particular, la infraestructura (red) de interconexión de estos sistemas tendrá que cumplir con determinados requisitos para soportar las comunicaciones que genere la ejecución de las mencionadas aplicaciones. Por tanto, para diseñar eficientemente dichas infraestructuras de red es necesario analizar los requisitos concretos que deben satisfacer, en sistemas tanto actuales como futuros. Por otra parte, es también necesario conocer en profundidad las características de las tecnologías avanzadas de red, con el propósito, por un lado, de saber qué facilidades y recursos ofrecen que puedan emplearse para contribuir a la mejora de la eficiencia de la red de interconexión de los sistemas de supercomputación y Big-Data, y por otro, de analizar la viabilidad de aplicar en ellas determinadas estrategias, tanto tradicionales como novedosas, orientadas a mejorar distintos aspectos de la red.
- Mejora de las prestaciones de las redes de interconexión avanzadas. La red de interconexión debe contribuir a mejorar el rendimiento global de los sistemas de supercomputación y Big-Data, que se refleja, por ejemplo, en ejecutar las aplicaciones de manera más rápida, en atender a más aplicaciones y/o usuarios por unidad de tiempo, o en maximizar la ratio entre tiempo de servicio y recursos invertidos. En el caso concreto de la red, mejorar su rendimiento implica principalmente reducir la latencia media y máxima de los mensajes, aumentar la cantidad de información que es capaz de entregar a los destinos por unidad de tiempo, minimizar el número de mensajes que deben ser reenviados, etc. El objetivo, por tanto, es proponer diseños de red que mejoren los valores alcanzables actualmente para las métricas que permiten evaluar las prestaciones de la red. En general, se tratará de conseguir este objetivo actuando sobre aquellos aspectos del diseño de la red que pueden influir de forma más determinante en las métricas mencionadas.
- Mejora del coste del despliegue de las redes de interconexión de los sistemas de supercomputación y Big-Data. Un apartado fundamental a la hora de evaluar la viabilidad de futuros sistemas de supercomputación y Big-Data será el coste de implementación (despliegue) de dichos sistemas (también serán fundamentales los costes de mantenimiento y consumo, que pueden abordarse separadamente). El coste del despliegue vendrá dado principalmente por el coste de los nodos de cómputo y el de la red que los interconecta. El objetivo concreto es que las técnicas que se propongan en este proyecto contribuyan a reducir el coste del despliegue de la red de estos sistemas. Esto puede implicar minimizar el número de elementos de comunicación necesarios, explotando a la vez al máximo las propiedades de los elementos imprescindibles. En cualquier caso, se tomarán medidas para que la red sea capaz de trabajar en un umbral bastante alto de carga de trabajo sin que se vean afectadas las prestaciones que las aplicaciones y usuarios perciben.
- Mejora de la fiabilidad de las redes de interconexión avanzadas. Como ya se ha comentado en la introducción, los futuros sistemas de supercomputación y Big-Data estarán compuestos por, al menos, varios cientos de miles de nodos, por lo que deberían estar preparados para tolerar fallos puntuales de algunos nodos o elementos de interconexión. El objetivo concreto, por tanto, es proponer soluciones que tengan en cuenta la posibilidad de fallos en la red para sobreponerse a los mismos. En general, estas soluciones implican que el sistema deba monitorizar su propio estado de operatividad y, dinámicamente, tomar las medidas necesarias para subsanar los problemas que puedan surgir, intentando minimizar los efectos que esos problemas puedan plantear a los usuarios o aplicaciones. Cabe destacar que algunas de las medidas que se tomen para solucionar fallos pueden generar otros problemas (como un aumento de la probabilidad de congestión), que también se tratarán de resolver empleando técnicas auxiliares.
- Mejora del consumo de energía de las redes de interconexión avanzadas. Ya se ha indicado en la introducción que el consumo energético en futuros sistemas no debería ser mucho mayor que el actual, a pesar de contar previsiblemente con muchos más elementos. También se ha indicado que el consumo de la red de interconexión supone actualmente un elevado porcentaje del total del consumo del sistema. Por todo ello, un objetivo clave para mejorar la eficiencia de la red de interconexión de futuros sistemas, debe ser la reducción de su consumo energético. En este proyecto se abordará este objetivo transversalmente, desde todas las funcionalidades de la red que se pretenden mejorar, y también mediante técnicas más específicas, como pueden ser el ajuste de los anchos de banda disponibles en cada ruta, deshabilitar rutas alternativas (y así sus enlaces) para ajustarse al máximo a la demanda real del tráfico, o mejorar los propios elementos usados en la comunicación utilizando sistemas optimizados. Cabe destacar que algunas de las medidas que se tomen para ahorrar en consumo pueden generar otros problemas (como un aumento de la probabilidad de congestión), que también se tratarán de resolver empleando técnicas auxiliares.
The project objectives are the following:
- Identify the requirements of Exascale and Big-Data systems, and the support offered by advanced interconnection network technologies.
- Performance improvement of advanced interconnect technologies.
- Cost improvement of interconnection networks for Supercomputers and Big-Data systems
- Reliability improvement of advanced interconnect technologies
- Power Management improvement of advanced interconnect technologies