Cisco France Blog
Partager

Cisco et Informatica s’associent pour optimiser les datawarehouses avec hadoop


2 March 2015


Etre capable de stocker et d’exploiter une quantité de données à des fins d’analyses décisionnelles devient incontournable. Disposer de plateformes performantes, efficace à coûts maitrisés est un enjeu auquel veulent répondre Informatica et Cisco. Plutôt que d’opposer entrepôt de données (datwarehouse) et plateformes de Big Data, il est possible de les combiner judicieusement avec une plateforme hadoop.

Hadoop a été conçu par les grands acteurs du Web comme Google et Yahoo pour répondre aux contraintes techniques et financières des bases de données relationnelles. Un des intérêts de Hadoop est de pouvoir intégrer et de traiter de grands volumes de données de manière plus économique en prenant en compte la diversité des sources de données et de leurs structures.

Un entrepôt de données optimisé et une informatique décisionnelle plus performante

En utilisant hadoop et les outils qui lui sont associés on réussit à alléger la charge de l’entrepôt de données et augmenter l’efficacité de l’informatique décisionnelle et de tous traitements analytiques.

  • Transférer les données peu utilisées de l’entrepôt vers un stockage moins coûteux. Le stockage de l’entrepôt de données s’en trouve optimisé.
  • Une plus grande variété de données peut être intégrée et stockée pour fournir des informations plus précises et plus pertinentes contrairement aux bases de données relationnelles contraintes par leur format et leur modèle de données.
  • La performance du réseau n’est plus un goulet d’étranglement dans un environnement distribué tel que proposé par hadoop
  • Les données structurées et non structurées peuvent être stockées et exploitées

Informatica et Cisco s’allient autour du Big Data

C’est dans le cadre de l’optimisation d’un entrepôt de données qu’Informatica et Cisco ont annoncé une solution commune (lire l’annonce). Cette solution propose une plateforme unique pour décharger le traitement et le stockage de l’entrepôt de données vers hadoop.

informatica Cisco

Cette solution d’optimisation d’un entrepôt de données fonctionne avec une distribution hadoop Apache du choix du client qui inclut Cloudera, Hortonworks et MapR. Elle comporte tous les éléments logiciels, réseaux et infrastructures pour utiliser le Big Data sous toutes ses formes :

  • Informatica Big Data Edition : Responsable de l’intégration des données et de leur nettoyage (ELT et ETL) nativement sur Hadoop. Informatica simplifie l’acquisition (ingestion) de tous type de données tels que les transactions clients, les données mainframes, des logs de serveurs, des données de capteurs que ce soit en mode batch ou en temps réel. Pour ce faire Informatica utilise une centaine de connecteurs. Pour assurer une ingestion des données très rapide vers hadoop, Informatica utilise les connectivités natives des applications, bases de données, réseaux sociaux et des « parsers » préconçus par format d’industrie qui incluent FIX, SWIFT, HL7, HIPAA, EDI, and ASN.1.
  • Cisco Data Virtualization– Cette plateforme fédère toutes les données de l’entrepôt et de Hadoop constituent ainsi un entrepôt de données logique. Les équipes ont de cette façon une vue complète de toutes les données couplée à un accès immédiat aux données. Tous les traitements analytiques peuvent ainsi s’effectuer sur l’ensemble des données. (lire La virtualisation des Données : un atout pour internet de l’objet , Cloud et Big Data)
  • Serveurs Cisco UCS pour le traitement des données.

Le Big Data par essence cherche à résoudre le problème du stockage en flux continu de volumes de données important à un coût qui ne soit pas prohibitif. On construit ainsi le socle de données qui sera exploité par diverses applications d’analyse, de visualisation etc… De l’ingestion à la restitution un large écosystème est nécessaire. Il s’étend de l’infrastructure à l’application et s’étoffe en permanence. Le partenariat entre Cisco et Informatica illustre parfaitement la complémentarité des acteurs de cet écosystème.

Lire également le white paper « Optimize Your Data Warehouse with a Joint Solution from Cisco and Informatica »

Tags:
Laisser un commentaire