Accélérer les performances des réseaux : impact de RDMA over Converged Ethernet (RoCE)
2024-12-27
L'évolution rapide des applications à calcul intensif a accentué le besoin de solutions réseau plus rapides, plus efficaces et plus évolutives. Parmi les technologies émergentes les plus innovantes pour répondre à cette demande figure Remote Direct Memory Access (RDMA) over Converged Ethernet (RoCE). Cette technologie révolutionnaire facilite les transferts de données directs entre les systèmes sans intervention du processeur, réduisant ainsi considérablement la latence et améliorant les performances globales du système. iWave, une société de conception FPGA de premier plan, est à l'avant-garde de cette avancée, avec la mise en œuvre d'une solution 100G Ethernet robuste intégrant ERNIC IP (Ethernet RDMA Network Interface Controller Intellectual Property) d'AMD dans son portefeuille de modules de traitement embarqués. Cette intégration vise à améliorer les capacités RDMA dans les applications hautes performances.
Figure 1 : RoCE facilite les transferts de données directs entre les systèmes sans intervention du processeur, réduisant ainsi considérablement la latence et améliorant les performances globales du système. (Source de l'image : iWave)
Comprendre RDMA over Converged Ethernet (RoCE)
RDMA est une technologie critique qui permet des transferts de mémoire directs entre les hôtes ou les serveurs, en contournant efficacement le processeur. Cette capacité permet aux processeurs de se concentrer sur l'exécution des applications et le traitement des données, ce qui se traduit par des améliorations significatives des performances du réseau, caractérisées par une réduction de la latence, une diminution de la charge des processeurs et une augmentation de la bande passante — et ce, de manière rentable. RoCE est un protocole réseau spécifique conçu pour faciliter les opérations RDMA sur les réseaux Ethernet. En exploitant l'infrastructure Ethernet existante, RoCE présente une option intéressante pour les organisations cherchant à améliorer les performances sans modifier leurs configurations réseau actuelles.
Types de RoCE
RoCE se décline en deux versions distinctes en fonction de l'adaptateur réseau utilisé : RoCE v1 et RoCE v2.
- RoCE v1 : ce protocole permet la communication entre deux hôtes situés dans le même domaine de diffusion Ethernet (VLAN). Il utilise Ethertype 0x8915 et limite les trames Ethernet standard à 1500 octets, tout en permettant aux trames Jumbo Ethernet de s'étendre jusqu'à 9000 octets.
- RoCE v2 : pour pallier les limites de RoCE v1, RoCE v2 introduit des améliorations dans l'encapsulation des paquets en incorporant des en-têtes IP et UDP. Cette modification permet à RoCE v2 de fonctionner de manière transparente sur les réseaux de couche 2 (couche liaison de données) et de couche 3 (couche réseau), prenant ainsi en charge le routage de couche 3 et l'évolutivité sur plusieurs sous-réseaux. Souvent appelé Routable RoCE (RRoCE), RoCE v2 prend également en charge la multidiffusion IP, étendant son champ d'application.
ERNIC IP : amélioration des capacités RDMA
ERNIC (Embedded RDMA enabled NIC) IP est un cœur IP de contrôleur d'interface réseau Ethernet RDMA personnalisable, conçu pour une intégration transparente avec les implémentations IP MAC logicielles, les MPSoC, et les FPGA AMD. Cette solution se caractérise par un haut débit, une faible latence et un mécanisme de transfert de données fiable et entièrement déchargé du matériel via Ethernet standard. iWave a démontré son engagement en faveur des avancées technologiques en mettant en œuvre avec succès une solution 100G Ethernet. Cette réalisation a été rendue possible grâce à l'utilisation du kit de développement avec MPSoC Zynq UltraScale+ d'iWave, qui intègre ERNIC IP d'AMD.
Le kit de développement MPSoC Zynq UltraScale+ est spécialement conçu pour le prototypage et l'évaluation de solutions 100G Ethernet, utilisant des connecteurs QSFP-28 haute vitesse.
Configuration de démonstration
Une configuration de démonstration typique (Figure 2) se compose des éléments suivants :
- Kit de développement avec MPSoC Zynq UltraScale+ ZU19EG d'iWave
- Advantech Mellanox ConnectX-5 100G NIC
- Sync 1588 PTP 1G NIC
- Câble MTP, modules QSFP-28 et câble Ethernet CAT6 RJ45
- Ubuntu 22.04 Server PC
Figure 2 : Configuration typique du kit de développement MPSoC Zynq UltraScale+. (Source de l'image : iWave)
Vue d'ensemble de l'architecture système
L'architecture du système est conçue pour optimiser le transfert de données, avec des rôles clairement définis entre les composants de système de traitement PS (Processing System) et de logique programmable PL (Programmable Logic). L'implémentation comprend également la synchronisation PTP (Precision Time Protocol), cruciale pour les applications en temps réel. Avec des performances remarquables, telles que la capacité à gérer des vidéos 8K à plus de 100 images par seconde, les applications potentielles couvrent divers secteurs, y compris les data centers, le multimédia et le calcul haute performance, soulignant la polyvalence et l'importance de la technologie dans les environnements informatiques modernes.
L'architecture de haut niveau du système, illustrée à la Figure 3, met en évidence les rôles distincts des composants PS et PL dans le MPSoC Zynq UltraScale+. Le système de traitement est doté d'un SoC matériel basé sur ARM Cortex-A53, essentiel pour la configuration, le contrôle et les diagnostics du système. Les composants clés de cette architecture incluent :
- Pilote 100G Ethernet MAC : garantit des performances robustes et une transmission de données à faible latence à 100 Gb/s
- Pilote de contrôleur ERNIC : responsable de la gestion des données entrantes vers DDR et de la facilitation de la communication entre l'application utilisateur et ERNIC IP via des échanges de notifications efficaces
- Bibliothèques RDMA Core et User Space : garantissent une compatibilité et des performances optimales pour les opérations RDMA dans les espaces noyau et utilisateur
Figure 3 : Mise en évidence des rôles distincts des composants de système de traitement et de logique programmable dans le MPSoC Zynq UltraScale+. (Source de l'image : iWave)
L'ERNIC IP d'AMD décharge efficacement la pile RoCE v2 sur le FPGA, le contrôleur ERNIC gérant les échanges entre les différents modules pour faciliter le transfert de données. Il génère des entrées de file d'attente de travail et envoie des notifications à ERNIC IP. Parallèlement, le sous-système 100G Ethernet du MPSoC Zynq UltraScale+ gère les couches MAC et physiques, tandis que le générateur de modèles de données est responsable de la production de modèles de données vidéo et de données brutes.
Protocole PTP (Precision Time Protocol)
L'horodatage PTP (norme IEEE 1588) joue un rôle crucial dans la synchronisation temporelle entre les systèmes d'un réseau Ethernet. Cette synchronisation est essentielle pour améliorer les performances des applications en temps réel, en permettant des échanges de données synchronisés et à faible latence au niveau de la nanoseconde.
Points forts de la configuration
Les points forts de cette configuration sont les suivants :
- Mise en œuvre de 100G Ethernet sur RoCE v2 avec AMD ERNIC IP
- Type de transport de connexion fiable
- Fonctionnalités RDMA SEND, RDMA READ et RDMA WRITE pour la gestion des paquets
- Prise en charge des types de messages RDMA Send with Immediate et RDMA Write with Immediate
- Tests de performances pour RDMA à l'aide des applications XRPING et PERFTEST
- Générateur de modèles de données personnalisés pour les modèles de données RAW et vidéo
- Insertion d'horodatages PTP avec les données
Les statistiques de débit détaillées pour les transferts de données vidéo du kit de développement MPSoC Zynq UltraScale+ vers le PC serveur révèlent des performances impressionnantes, avec la capacité à gérer des vidéos 8K à plus de 100 ips et des vidéos 4K à plus de 400 ips.
Applications potentielles
L'intégration de RDMA over Converged Ethernet et ERNIC IP ouvre de nouvelles perspectives dans divers secteurs, améliorant considérablement la connectivité, les performances et le rendement dans une gamme d'applications, notamment :
- Data centers et cloud computing : facilitation de la communication efficace entre les serveurs et accélération du traitement des données dans les architectures cloud
- Capture et transfert de vidéos/d'images : avantages pour les applications multimédias, la diffusion et les environnements de réalité virtuelle (VR)
- Solutions de stockage : transferts de données plus rapides entre les périphériques de stockage et les serveurs, améliorant ainsi les performances du système de stockage
- Calcul haute performance (HPC) : amélioration des vitesses de transfert de données et réduction de la latence dans les clusters HPC pour des tâches de calcul et des simulations plus rapides
- Dispositifs IoT Edge : collecte et transmission de données en temps réel à partir de capteurs et de dispositifs
Tandis que la demande en matière de solutions de transfert de données plus rapides et plus efficaces continue d'augmenter, RDMA over Converged Ethernet et ERNIC IP sont appelés à jouer un rôle déterminant dans l'avenir du calcul haute performance.
Conclusion
Le vaste portefeuille de plateformes FPGA et SoC FPGA d'iWave, combiné à une solide expertise technique, permet aux clients de développer des produits de pointe qui exploitent les dernières avancées en matière d'intelligence artificielle (IA), d'apprentissage automatique (ML) et d'edge computing. En s'associant à iWave, les entreprises peuvent accélérer le développement de leurs produits, réduire les risques et garder une longueur d'avance sur la concurrence dans un paysage technologique de plus en plus complexe.
Pour plus d'informations ou pour discuter d'exigences personnalisées, veuillez nous contacter à l'adresse mktg@iwave-global.com.
Avertissement : les opinions, convictions et points de vue exprimés par les divers auteurs et/ou participants au forum sur ce site Web ne reflètent pas nécessairement ceux de DigiKey ni les politiques officielles de la société.




