Técnicas Eficientes para Tecnologías de Red Avanzadas (TETRA 3)

Los grandes centros de proceso de datos (CPDs) son hoy en día infraestructuras fundamentales en la transformación digital de nuestra Sociedad. Gracias a su capacidad para resolver problemas complejos mucho más allá de la capacidad de las computadoras ordinarias, estos sistemas impulsan avances en campos tan diversos como medicina, climatología, física de partículas, transmisión de vídeo, Inteligencia Artificial (IA) generativa y, en general, aceleran significativamente el desarrollo de prácticamente cualquier sector con potencial innovador. En los CPDs, la red de interconexión es un subsistema clave que permite que cientos de miles de nodos de cómputo y almacenamiento cooperen para ejecutar las aplicaciones que se utilizan en los campos mencionados anteriormente. Estas aplicaciones generan innumerables operaciones de comunicación a las que la red debe dar soporte lo más rápidamente posible, convirtiéndose de lo contrario en el cuello de botella de todo el sistema. Hasta hace unos pocos años, un CPD era un sistema independiente y aislado, donde el único enlace que necesitaba con el mundo exterior era relativamente sencillo, habitualmente sólo para mostrar alguna visualización a los usuarios. Sin embargo, el gran volumen de datos y carga de trabajo que manejan estos sistemas en los últimos años, hace que surja la necesidad de interconectar varios CPDs, que pueden estar distribuidos geográficamente. Por otro lado, actualmente cada nodo de cómputo de los CPDs incluye una gran cantidad de aceleradores que se interconectan por medio de una red intra-nodo. Basándose en este modelo de red de interconexión con tres niveles (intra-nodo, inter-nodo e inter-CPD), desde la industria y el ámbito académico se está trabajando en desarrollar estándares de fabricación y nuevas tecnologías de red que satisfagan los requisitos de comunicación ya mencionados.

 

Efficient Techniques for Advanced Interconnect Technologies (TETRA 3)

Datacenters (DCs) are nowadays critical infrastructures in the digital transformation of our Society. Thanks to their ability to solve complex problems far beyond the capacity of ordinary computers, these systems drive advances in fields as diverse as medicine, climatology, particle physics, video transmission, generative Artificial Intelligence (AI) and, in general, significantly accelerate the development of any sector with innovative potential. In data centers, the interconnection network is a key subsystem that enables hundreds of thousands of compute and storage nodes to cooperate to run the applications used in the fields mentioned above. These applications generate countless communication operations that the network must support as quickly as possible, otherwise it becomes the bottleneck of the entire system. Until a few years ago, a DC was a stand-alone, isolated system, where the only link it needed with the outside world was simple, usually just to display some visualization to users. However, the large volume of data and workloads handled by these systems in recent years has created the need to interconnect several data centers, which may be geographically distributed. On the other hand, each compute node in the data center currently includes a variety of accelerators that are interconnected by means of an intra-node network. Based on this three-level interconnection network model (intra-node, inter-node, and inter-DC), industry and academia are working to develop manufacturing standards and new network technologies that meet the aforementioned communication requirements.