Une architecture de réference Cisco pour BigData avec Pivotal HD et Hawq
1 min read
Hadoop fait partie des solutions souvent évoquées pour le BigData.
Parmi les sociétés qui offrent une distribution (voir mon précédent billet “Les Distributions Hadoop évaluées par Forrester“) on trouve la société Pivotal avec laquelle Cisco a publié, le 5 février 2014, une architecture de référence (CVD) : « Cisco UCS Common Platform Architecture Version 2 (CPA v2) for Big Data with Pivotal HD and HAWQ »
La distribution Pivotal HD de Hadoop Apache est basée sur la seconde génération de MapReduce avec YARN. Pivotal HD fournit tous les services d’une distribution Hadoop avec entre autre le support de Mapreduce, Hive Pig, Zookeeper, et Mahout .
Pivotal HAWQ profite de 10 ans d’innovation pour offrir des fonctions SQL optimisées qui exécutent des requêtes analytiques au-dessus d’Hadoop.
La solution de serveur Cisco UCS pour Pivtoal H et HAWQ est basée sur Cisco Common Platform Architecture Version2 (CPA v2) for Big Data.
CPA est une architecture conçue autour de serveur UCS pour être très évolutive et pour répondre aux besoins des applications dites « scale out »
Le document (CVD) ,mentionné dans ce billet, décrit l’architecture et le déploiement de la distribution Pivotal HD pour Hadoop avec YARN et HAWQ sur un clusteur de 64 neouds construit sur une architecture CPA à base de serveurs Cisco UCS.