Seuls 12% des données exploitées par les entreprises. Forrester vient de publier “The Forrester Wave™: Big Data Hadoop Solutions, Q1 2014”. Pour avoir accès à ce rapport cliquer ici. Un document intéressant qui revient sur l‘intérêt de Hadoop pour bâtir une solution de bigdata et qui évalue les principales solutions.
Selon Forrrester la plupart des entreprises estiment qu’elles n’exploitent que 12% de leurs données. Les principales raisons évoquées sont les organisations en silos et le manque de moyens analytiques.
Le Big Data pose la question de la valeur des données. Il devient de plus en plus difficile de déterminer quelles données ont de la valeur et surtout d’estimer leur valeur dans le futur. Il faut donc tout collecter et tout stocker… Hadoop , d’après Forrester rend possible de capturer, de stocker et d’analyser un volume important de données pour un coût raisonnable. Hadoop offre également la possibilité d’évoluer de quelques serveurs à des milliers de serveurs avec des performances optimisées.
Les différentes distributions d’Hadoop. On peut se procurer Hadoop par différentes voies. Faire le bon choix repose sur différents critères. Forrester a répertorié les différentes formes de distribution et les acteurs associés selon la classification suivante :
- Apache Open source : Tout le monde peut télécharger cette distribution sur le site hadoop.apache.org.
- Les distributeurs spécialisés en Hadoop (les pure players): On retrouve Cloudera, Hortonworks, et MapR Technologies
- Les vendeurs de logiciels d‘entreprise qui offrent des distributions Hadoop. On retrouve des entreprises comme Oracle en partenariat avec Cloudera, SAP qui s’allie avec Intel et Hortonworks. D’autres comme IBM, Microsoft, Pivotal, et Teradata ont, ou envisagent d’avoir, leur propre distribution.
- Hadoop dans le cloud.
- Les fournisseurs de solution de bigata sous forme de services managés ou dans le cloud
- Les fournisseurs d’outils spécifiques complémentaires à Hadoop.
Les Distributions Hadoop évaluées par Forrester. Forrester a procédé à une évaluation des principaux fournisseurs de Hadoop en se basant sur plusieurs critères :
- L’offre actuelle
- La strategie
- La présence sur le marché
La totalité de l’évaluation est disponible dans le document du Forrester et la synthèse ci-dessous donne un bon aperçu des résultats.
MAPR annonce la dèrnière version de sa distribution
MAPR qui apparait bien positionné dans l’évaluation de Forrester vient d’annoncer la dernière version de sa distribution incluant Hadoop 2.2 avec YARN qui sera disponible en mars.
Hadoop 2 apporte avec YARN la possibilité de développer des applications de traitement de données fonctionnant nativement sur Hadoop. La distribution Hadoop de MapR développe encore davantage les possibilités de YARN en ajoutant une interface open sous protocole NFS en plus d’HDFS, permettant aux applications non-MapReduce d’exploiter au mieux les capacités de stockage du cluster.
Cisco supporte les principales distribution Hadoop
Cisco ne figure pas bien entendu dans cette évaluation puisque n’étant pas un distributeur d’Hadoop mais par contre Cisco offre des infrastructures validées à bas e de serveurs UCS , appelées Common Platform Architecture CPA, avec les principales distributions telles que :
- Cisco UCS CPA for Big Data with Cloudera
- Cisco UCS CPA for Big Data with MapR
- Cisco UCS CPA for Big Data with Hortonworks
- Cisco UCS CPA v2 for Big Data with Intel Distribution for Apache Hadoop
- Cisco UCS Common Platform Architecture v2 for Big Data with Pivotal HD and HAWQ
1 commentaires
Big data quotea0“21st Century businesses thvire by driving abundance and then selling minimization of complexity inherent in that abundance.a0 It’s what Red Hat does with open source, what Google does with search, and what Facebook does with social.a0 It’s also what companies like Nodeable do with all the data your marketing/IT operations/sales/etc. systems throw off”—Matt Asay