Le Big Data en interne chez Cisco : Un premier cas d’usage à 40 millions de $ d’opportunités incrémentales.
2 min read
L’idée a germé il y a un peu plus de deux ans. Cisco cherchait à trouver une nouvelle manière de créer de la valeur à partir d’informations dispersées au sein de l’entreprise et dans différents systèmes. Ces informations ne consistaient pas seulement en données structurées sur les clients et les produits mais également en données non structurées que l’on trouve dans des logs, des emails, des vidéos et des images.
Si à ce moment-là Cisco avait en tête une ou deux utilisations, il souhaitait néanmoins que la plateforme qui serait mise en place puisse supporter n’importe quel cas d’utilisation.
Une plate-forme BigData conforme aux exigences d’une entreprise comme Cisco
Pour mettre à jour cette richesse cachée dans une masse d’informations distribuée globalement, la direction informatique de Cisco s’est tournée vers Hadoop, le framework open source qui supporte les applications utilisant de manière intensive un important volume de données distribuées.
Mais l’enjeu portait sur la capacité d’adapter la plateforme Hadoop open source aux exigences de l’entreprise que ce soit en termes de contrat de services (SLA) de disponibilité ou de performances.
L’équipe en charge du projet a donc construit une plateforme Hadoop d’analyse de données, qui a pris pour nom Cisco Common Platform Architecture (CPA) pour Big Data, et qui est basée sur des serveurs UCS. Cisco utilise MapR Distribution pour Apache Hadoop.
Cette plateforme a été conçue pour de hautes performances dans un environnement multi-tenants anticipant le fait que les utilisateurs internes trouveraient de nouveaux cas d’utilisation de bigdata.
La plateforme BigData tire également parti du Cisco Tidal Enterprise Scheduler (TES) qui facilite l’ordonnancement (job secheduling) et l’automatisation des workloads. Grace à des connecteurs pour Hadoop, le logiciel TES réduit les taches de programmation et de debugging.
dix fois moins de temps pour traiter 25% de données en plus .
Précédemment Cisco utilisait des techniques de datawarehouse traditionnelles pour analyser la base installée et identifier les opportunités de services pour les quatre prochains trimestres. L’analyse prenant près de 50 heures, un seul rapport par semaine pouvait être produit.
Autre limitation de l’ancienne architecture, le manque d’une source unique de données fiables. Les informations concernant des opportunités de services étaient dispersées sur de multiples data stores. Cette contrainte a pu être levée avec la nouvelle plateforme Big Data tout en permettant de traiter 25% de donnée en plus en quasiment dix fois moins de temps.
La solution permet de traiter 1,5 milliards d’enregistrements par jour.
Rien que sur ce premier cas d’utilisation Cisco estimait à 40 millions de dollars les opportunités de service incrémentales sur l’année fiscale 2013 qui s’est terminée en juillet dernier.
Toutes les entreprises peuvent profiter de l’expérience acquise par Cisco puisque la plateforme CPA (une nouvelle version existe avec les tous derniers processeurs Intel) a été validée en autre avec les différentes distributions d’Hadoop et avec les principaux acteurs de stockage.
Plus d’informations:
- l’utilisation du bigadata en interne chez Cisco : “How Cisco IT Built Big Data Platform to Transform Data Management”
- white papers disponibles:
[1] Cisco UCS with the Intel Distribution for Apache Hadoop
[2] Cisco UCS with MapR: Delivering Advanced Performance for Hadoop Workloads
[3] Cisco and Greenplum Partner to Deliver High-Performance Hadoop Solution
[4] Cisco UCS Ecosystem for Oracle: Extend Support to Big Data and Oracle NoSQL Database
[5] Cloudera Enterprise with Cisco Unified Computing System
[6] Cisco Big Data Common Platform Architecture (CPA) : Announcing SmartPlay Solution Bundles
[7] Cisco UCS with ParAccel Analytic Platform Solution: Deliver Powerful Analytics to Transform Business
[8] Extreme Performance (Million OPS) to Oracle NoSQL Database Big Data Applications
[9] Pentaho High-Performance Big Data Reference Configuration Using Cisco UCS
[10 ] Cisco UCS with StackIQ Solution: Deliver Big Infrastructure for Big Data