Dans ce billet, je vous présentais brièvement l’architecture UCS X-series commercialisée par Cisco depuis Juin 2021. Cette nouvelle architecture est le fruit d’un long travail de conception et d’ingénierie qui a duré plusieurs années. Le cahier des charges de ce travail comportait plusieurs parties:
Premièrement, il était évidemment nécessaire de préserver toutes les caractéristiques qui ont fait le succès de l’architecture UCS depuis 2009: la fabric unifiée, le management unifié, la résilience et redondance native, l’évolutivité sans augmentation de la complexité, la configuration au moyen de profils et de politiques (Service Profile), la programmabilité native, l’écosystème et les solutions (Cisco Validated Design), etc …
Deuxièmement, et comme illustré ci-dessous, il fallait prendre en compte l’évolution des architectures applicatives qui évoluent d’un modèle traditionnel largement virtualisé, vers un modèle basé sur les containers. La nouvelle architecture UCS-X doit permettre de supporter tous ces modèles applicatifs simultanément.
Troisièmement, il était nécessaire de prendre en compte la diversité croissante des technologies et matériels existants dans les domaines des serveurs, du réseau et du stockage (voir la partie Infra HW dans le schéma ci-dessus). Cette diversité justifie souvent l’existence de serveurs dédiés à un usage particulier car équipés ou configurés statiquement avec tels ou tels composants. Par exemple, un serveur dédié aux usages graphiques (GPU) ne peut pas en même temps accueillir un nombre important de disques, par manque de place ou de slots PCIe. Ou encore un serveur spécialisé équipé d’une certaine génération de processeurs doit être entièrement remplacé pour passer à la génération suivante de processeurs, alors que les composants spécialisés pourraient parfaitement être re-utilisés. Ces serveurs dédiés posent aussi souvent des difficultés d’intégration ou d’administration avec le reste du parc informatique. L’objectif de l’architecture UCS-X est de pouvoir assembler les composants d’un serveur en fonction des besoins applicatifs à un moment donné, et de faire évoluer chaque composant indépendamment des autres, par remplacement de ce composant uniquement.
Quatrièmement, la nouvelle architecture UCS-X doit être capable d’accueillir toutes les innovations qui vont arriver à maturité durant les prochaines années:
- l’augmentation de la consommation électrique des CPU, GPU et autres FGPA jusqu’à des niveaux qui nécessiteront un refroidissement liquide.
- l’évolution des standards PCIe (Generation 4/5/6)
- arrivée de la norme de connectivité CXL (Compute eXpress Link) qui permettra de mieux partager la mémoire entre processeurs
- le débit réseau à 100G et plus
- les cartes réseau de type SmartNIC qui déchargent la CPU principale de certaines taches.
- les disques NVMe à très haute capacité
- etc …
Et enfin, il est nécessaire de prendre en compte la cohabitation entre le cloud privé et le cloud public, et proposer une plate-forme d’administration et un modèle opérationnel le plus homogène possible pour les deux clouds. C’est le rôle de Cisco Intersight, qui est présenté dans d’autres billets sur ce blog.
Pour répondre à ce long cahier des charges, Cisco a concu l’architecture UCS-X dont voici les caractéristiques fondamentales.
Le chassis UCS X9508 est un peu plus grand que son prédécesseur le 5108 (7RU au lieu de 6RU). Il permet d’accueillir :
- en face avant des composants (“nodes”) dont le premier type disponible est le serveur de calcul X210c. D’autres types de nodes arriveront très prochainement pour héberger des fonctions telles que les accélérations graphiques (GPU), le stockage disque de grosse capacité, ou encore de la mémoire non-volatile. Le châssis est capable d’accueillir jusqu’à 8 nodes, disposés verticalement.
- en face arrière des modules d’interconnexion (positionnés horizontalement) qui sont de 2 types:
- Interconnexion réseau convergé avec deux modules “Intelligent Fabric Modules” IFM 9108 qui assurent la connexion vers les Fabric Interconnect 6400. Les IFM jouent exactement le même rôle que les IO Module dans les chassis 5108. Ils travaillent de concert avec les cartes Virtual Interface Card (VIC) de 4ème génération dans les noeuds de calcul.
- Interconnexion selon d’autres technologies ou protocoles par deux “X-Fabric Modules”. Ces modules utilisent le standard PCIe pour interconnecter les noeuds de calcul avec d’autres type de noeuds situés en face avant. Le premier type de noeud spécialisé qui sera disponible concernera l’accélération graphique (GPU).
- En face arrière également, 4 ventilateurs assurent le refroidissement de tout le châssis et de ses composants.
- Sur le coté gauche et traversant tout le châssis, six blocs d’alimentation fournissent la puissance électrique nécessaire, avec différents modes de répartition ou de redondance.
Pour garantir la durabilité et modularité maximale, le châssis 9508 ne possède pas de “fond de panier” (midplane ou backplane), c’est à dire aucune trace électrique utilisée pour interconnecter les composants entre eux. Les nodes en façade viennent se connecter directement dans les modules à l’arrière. Ainsi l’évolution vers des nodes et des modules plus puissants ou différents ne sera jamais limitée par les caractéristiques d’un fond de panier.
Le chassis 9508 est également équipé d’un système de refroidissement très sophistiqué permettant de faire face à l’augmentation constante des besoins de dissipation thermique des processeurs et autres composants présents dans les nodes et modules. Des capteurs thermiques sont présents dans tous les composants du châssis pour permettre un réglage en temps réel de la ventilation. A l’avenir, le châssis sera capable d’intégrer un système de refroidissement liquide en circuit fermé ou circuit ouvert.
Le serveur X210c M6 (schéma ci-dessous) est le premier node disponible dans la gamme UCS-X. Il s’agit d’un serveur de calcul équipé de processeur Intel Xeon de 3ème génération (“Icelake”). Il possède donc toutes les caractéristiques liées à cette gamme de processeurs: jusqu’à 40 cores par processeur, jusqu’à 8TB de mémoire RAM avec 32 barrettes DDR4, carte réseau Cisco VIC de 4ème génération, etc … . Mais la différence notable par rapport aux serveurs B200 est la présence en façade de 6 emplacements pour des disques NVMe ou SAS/SATA SSD avec contrôleur RAID. Les disques sont permutables à chaud et il est possible de combiner des disques NVMe et SSD.
La présence de disques fait du serveur X210c un serveur qui peut être utilisé à la fois comme un serveur blade (sans disques généralement) ou comme un serveur rack (avec disques) qui serait installé dans un châssis. A l’arrière du serveur, les cartes au format mLOM et mezzanine permettent l’interconnexion directe avec les modules IFM et/ou X-Fabric présents dans le chassis.
Le module IFM 9108 (schéma ci-dessous) est la première génération de modules d’interconnexion réseau convergé. Chaque module est équipé de 2 x 4 ports 25G vers les Fabric Interconnect 6400. En combinant les 2 IFM avec 2 cartes VIC dans les serveurs, il est possible d’apporter jusqu’à 100Gbps de débit Ethernet à chaque noeud de calcul. Dans le courant de l’année prochaine, un module IFM et une carte VIC plus puissantes (100G) seront commercialisés.
Le module X-Fabric a pour vocation d’interconnecter entre eux les nodes en façade pour un autre besoin que la connectivité réseau. Le premier usage qui sera disponible l’année prochaine sera un X-Fabric module pour interconnecter des nœuds X210c avec des nœuds GPU équipés de cartes GPU NVidia. D’autres nodes spécialisés sont également planifiés.
C’est ainsi qu’il sera possible au sein d’un même châssis UCS-X de faire cohabiter des applications potentiellement très différentes (bases de données, VDI, Software-defined-Storage, Hyperconvergence, etc ..) et d’adapter la configuration matérielle des nodes et modules selon les besoins des applications. La définition des configurations matérielles sera pilotée par Intersight, au moyen de profils et de policies, comme c’est déjà le cas actuellement. Lorsque les besoins des applications évoluent, l’affectation des ressources pourra être adaptée en conséquence. Et si des évolutions technologiques le justifient, il sera possible de remplacer les modules X-Fabric par un autre type de module.
Toute la configuration et le pilotage d’une solution UCS X-series se fait exclusivement au moyen de Cisco Intersight, selon un mode de configuration appelé “Intersight Managed Mode (IMM)” qui fera l’objet d’un prochain billet sur ce blog.
Toutes ces caractéristiques font de l’architecture UCS X une solution extrêmement modulaire, compacte et agile à la fois, qui permet d’héberger tous les types d’applications, avec une densité et une versatilité sans équivalent sur le marché.