Cisco France Blog

La business Intelligence dépendante de la qualité des données.

2 min read



Dans un monde qui va de plus en plus vite, les entreprises ont bien compris que l’avenir appartiendrait à ceux qui savent « faire parler les données ». Les outils de business intelligence et les applications analytiques sont devenues incontournables et sont de plus en plus souvent  utilisables en libre-service.  Le logiciel Cisco Data preparation réduit le temps nécessaire pour mettre à disposition des analystes des données qualifiées. Un gain de temps utile pour prendre de meilleures décisions plus rapidement.

Data preparation

La qualité des données augmente la pertinence des outils de Business Intelligence. Pour être efficaces les analystes doivent pouvoir travailler sur toutes les données y compris les plus récentes. Un vrai défi pour les directions informatiques qui dépensent de plus en plus de temps à préparer les données avant de les mettre à disposition. Elles doivent entre autres agréger les données de sources multiples, identifier les doublons et ajouter des données contextuelles. Avec la puissance des outils de business intelligence disponibles aujourd’hui, chaque minute perdue à préparer les données est du temps perdu pour la prise de décision.

Réduire le temps de préparation des données. La solution Cisco Data Preparation avec un serveur UCS peut améliorer ce processus et donner la possibilité aux analystes de travailler sur des données de plus en plus nombreuses et obtenir des analyses plus abouties. Ce logiciel est une application pour l’utilisateur final qui permet à des analystes business sans connaissance technique de facilement collecter, nettoyer, associer et enrichir les données brutes qui vont alimenter les analyses. Avec cette solution, les analystes peuvent :

  • Ajouter: Inclure des données sans se soucier de leur localisation que ce soient des données provenant de Data preparation architectureHadoop Distributed File System (HDFS), de bases de données relationnelles, de tableaux ou de fichiers plats.
  • Explorer: Identifier les problèmes de qualité des données en utilisant des outils de recherche full-text, des filtres et des histogrammes. La qualité des données est visualisée pour souligner les types de problèmes rencontrés avec les données (erreurs, doublons, manquantes etc..)
  • Nettoyer. Utiliser des algorithmes sophistiqués qui travaillent sur les données sans avoir besoin de coder ou de développer des scripts. Les analyses voient les incohérences et peuvent remplir les blancs, supprimer des données, renommer les duplications ou réaliser tous types d’action pour améliorer la qualité des données.
  • Formater. D’un simple clic il est possible de mettre les fichiers dans un format mieux adapté à l’analyse.
  • Enrichir. Ajouter des données contextuelles qui rendront les analyses plus précieuses.
  • Associer: Le logiciel Cisco Data Preparation détecte les attributs communs à de multiples fichiers et accélère ainsi la fusion de données.
  • Publier: Rendre les réponses directement disponibles à partir de to QlikView, Tableau, Microsoft Excel, et toutes autres applications compatibles avec Open DataBase Connectivity (ODBC)

 

Le logiciel Cisco Data Preparation fonctionne avec Apache Spark et utilise une architecture à quatre niveaux conçue pour l’interactivité, la préparation des données en libre-service et la scalabilité. Le logiciel Cisco est installé sur un serveur UCS . La configuration recommandée est basée sur des serveurs Cisco UCS C220-M4/C240 M4 avec deux processeurs Intel Xeon E5-2680 v3, 256GB de RAM

Laisser un commentaire