19 April 2013 Leave a Comment

Big Data : Une architecture Hadoop avec la distribution MapR et les serveurs Cisco UCS

1 min read

Eric Debray

Ces dernières semaines j’ai fait plusieurs fois référence à des architectures validées en environnement Hadoop .

J’ai cité la ditribution de Hadoop par Pivotal (EMC), celle par Intel mais je me devais de poursuivre par Map R une des plus connues sans doute avec Cloudera et Hortonworks.

Vous pouvez lire les détails de la solution MapR avec les architecteurs serveurs UCS de Cisco dans ce solution brief “Cisco UCS with MapR: Delivering Advanced Performance for Hadoop Workloads“ datant de février 2013.

Si Hadoop est aujourd’hui bien identifié avec le petit éléphant qui est associé à son nom, il n’est par contre pas toujours facile de choisir une distribution parmi celles qui existent.

MapR quant à lui , explique son positionnement en insistant sur :

1- La facilité d’utilisation

Facilité de transfert de données vers ou à partir d’un cluster, partager de cluster entre utilisateurs, workloads et emplacements géographiques ? Peut-on assurer la sécurité et contrôler l’accès tout en supportant des un nombre important de fichiers ? etc..

2- La fiabilité du cluster Hadoop :

Utilisation en production pour des données critiques, prise en compte de la disponibilité par la distribution choisie pour Hadoop, fonctions de restauration et de mirroring entre clusters ?

3- La performance:

Traitement limité à des applications batch ? Goulots d’étranglement ? Utilisation efficace de l’infrastructure matérielle ?

Tel que présentée par MapR, sa distribution d’Hadoop entend prendre en compte ses critères pour tirer efficacement partir des fonctions analytiques du Big Data.

J’ai retenu parmi les innovations mises en avant par MapR :

Authors

Eric Debray

Tags:

Laisser un commentaire