MapR et Cisco faces à l’enjeu du BigData : répondre aux exigences de l’Entreprise
2 min read
Optimiser les performances et l’évolutivité du Big Data avec MapR et les serveurs Cisco UCS
Généralement la première étape d‘un projet Big Data consiste à déterminer les cas d‘utilisation et à en valider les principes et les fonctionnalités sur une plateforme de tests Apache Hadoop relativement basique.
Si le choix de cet environnement de test n’est pas critique, il en va tout autrement quand il va s’agir de bâtir et de déployer une infrastructure Hadoop destinée à la production. Nous sommes alors dans le cadre d’applications sensibles qui requerront performance, disponibilité et scalabilité. Fournir des résultats en temps réel ou quasi réel exigera une faible latence. Cette faible latence est également un facteur clé qui influence le choix d‘une distribution Hadoop.
Performance et disponibilité
Pour réaliser les principales opérations (ingest, traitement et analyse des informations) la performance d’une plate-forme Hadoop est critique. Les différentes distributions d’Hadoop se distinguent par leurs choix d’architectures pour répondre aux enjeux de performances et d’évolutivité.
MapR met délibérément en avant son objectif de fournir des solutions d’entreprise particulièrement avec MapR M7 , l’architecture est optimisée pour des déploiements qui comptent sur un fort débit et une haute disponibilité sans administration supplémentaire.
La distribution Hadoop MapR a par exemple fait des choix d’architecture pour exploiter les metadata distribuées avec une performance constante.
Le document « NOSQL PERFORMANCE REPORT MAPR M7 – PERFORMANCE COMPARISON » montre un certain nombre de tests de performance entre MapR M7 edition et d’autres distributions. Le graphe portant sur la latence est particulièrement révélateur.
En combinant la distribution MapR M7 et les serveurs UCS on obtient une solution conçue, testée et validée pour exploiter des charges applicatives les plus exigeantes. MapR est également intégré avec Cisco® Tidal Enterprise Scheduler (Cisco TES) pour faciliter le travail des administrateurs en automatisant le load balancing, l’échange de données et la planification d’événement sur MapR.
.
Scalabilité
La nature même du BigData repose sur l’expansion du volume de données. Hadoop s’y prête particulièrement bien avec sa capacité d’extension du nombre de nœuds, de tables etc…La distribution MapR est là encore optimisée pour la scalabilité.
MapR M7 supporte des fichiers avec des millions de colonnes sur des milliards de de lignes (comme Apache HBase) et peut évoluer quasiment sans limite.
Cisco UCS Common Platform Architecture pour BigData
La solution Cisco UCS pour MapR repose sur l’architecture Cisco® UCS Common Platform Architecture (CPA)pour Big Data (Cisco Validated Design). La plate-forme Cisco UCS CPA est une architecture conçue pour évoluer facilement pour s’adapter aux besoins des applications dites “scale out” (architecture évoluant par ajout de modules identiques). L’architecture UCS CPA avec MapR peut être dimensionnée pour fournir des performances avancées qui permettent à Hadoop d’évoluer au rythme des applications.