Cisco France Blog
Partager

40 millions de dollards d’opportunités grace à une solution bigData avec MAPR


14 March 2014


Créer de la valeur à partir d’informations existantes c’est là une des principales promesses du BigData. Encore faut il prendre conscience de ce capital et savoir l’exploiter. Toutes les entreprises possèdent ce capital de données et Cisco n’échappe pas à la règle. L’idée a pris corps il y a plus de deux avec la volonté d’exploiter des informations dispersées au sein de l’entreprise et dans différents systèmes. Ces informations ne consistaient pas seulement en données structurées sur les clients et les produits mais également en données non structurées que l’on trouve dans des logs, des emails, des vidéos et des images.

Si dans cette phase Cisco imaginait quelques cas d’usages, il était néanmoins conscient que les cas d’usages potentiels étaient nombreux et qu’il fallait par conséquent que la plateforme soit conçue pour évoluer et  supporter n’importe quel cas d’utilisation.

Une plate-forme BigData conforme aux exigences d’une entreprise comme Cisco

Pour mettre à jour cette richesse cachée dans une masse d’informations distribuée globalement, la direction informatique de Cisco s’est tournée vers Hadoop, le framework open source . Mais l’enjeu portait sur la capacité d’adapter la plateforme Hadoop open source aux exigences de l’entreprise que ce soit en termes de contrat de services (SLA) de disponibilité ou de performances.

L’équipe en charge du projet a donc construit une plateforme Hadoop d’analyse de données, qui a pris pour nom Cisco Common  MAPR logo V2Platform Architecture (CPA) pour Big Data, et qui est basée sur des serveurs UCS.  Cisco utilise la distribution hadoop de MapR  , MAPR proposant une distribution Hadoop capable de répondre au niveau d’exigence d’une prodution .

MAPR key points

Cette plateforme assure ainsi de hautes performances  dans un environnement multi-tenants anticipant le fait que les utilisateurs internes trouveraient de nouveaux cas d’utilisation de bigdata.

La plateforme BigData tire également parti du Cisco Tidal Enterprise Scheduler (TES) qui facilite l’ordonnancement (job secheduling) et l’automatisation des workloads. Grace à des connecteurs pour Hadoop, le logiciel TES réduit les taches de programmation et de debugging.

 Dix fois moins de temps pour traiter 25% de données en plus .

Précédemment Cisco utilisait des techniques de datawarehouse traditionnelles pour analyser la base installée et identifier les opportunités de services pour les quatre prochains trimestres. L’analyse prenant près de 50 heures, un seul rapport par semaine pouvait être produit.

Autre limitation de l’ancienne architecture, le manque d’une source unique de données fiables. Les informations concernant des opportunités de services étaient dispersées sur de multiples data stores. Cette contrainte a pu être levée avec la nouvelle plateforme Big Data tout en permettant de traiter 25% de donnée en plus en quasiment dix fois moins de temps. La solution permet de traiter 1,5 milliards d’enregistrements par jour.

Rien que sur ce premier cas d’utilisation Cisco estimait à 40 millions de dollars les opportunités de service incrémentales sur une année.

Toutes les entreprises peuvent profiter de l’expérience acquise par Cisco puisque la plateforme CPA (une nouvelle version existe avec les tous derniers processeurs Intel) a été validée en autre avec les différentes distributions d’Hadoop et avec les principaux acteurs de stockage.

Plus d’informations: 

Tags:
Laisser un commentaire