Un nouveau terme est apparu récemment et a suscité pas mal de buzz : le « Big Data » ! On fait également référence à l’ère du “Zettabyte” , la quantité de données véhiculée sur les réseaux et stockée. Le terme est aussi simple que le concept est complexe.
Tout part du fait que la quantité de données créée devient gigantesque et sa croissance est phénoménale. Ces données ne sont plus cantonnées à des bases de données structurées mais proviennent de sources diverses et variées liées à la diversification des outils dont nous disposons aujourd’hui pour communiquer et créer de l’information. De plus ces informations peuvent être réparties mondialement et produites en temps réel.
voir l’étude de MC Kinsey de mai 2011: “Big Data: The Next Frontier for Innovation, Competition, and Productivity”
voir également un document de juin 2011: “extracting Value from Chaos” d’IDC
Au moins deux questions se posent :
– Quelle valeur peut-on tirer de cette profusion d’informations utile pour les entreprises et les institutions (comportement des consommateurs, études d’opinions, tendances industrielles, lutte contre la criminalité, etc.) ? On retrouve là une évolution de ce que l’on connaissait à une époque sous le nom d’infocentre, puis de datawarehouse… sauf que là il devient inimaginable d’utiliser une base de données traditionnelle.
– Comment capturer ces informations, les stocker, les analyser, les visualiser ? L’interprétation de ces données amènent de nombreuses réflexions qui touchent aussi bien à l’architecture de réseaux, qu’à la conception des bases de données et bien entendu aux méthodes d’interprétation des données
Quel écosystème pour le BigData ?
On voit d’ores et déjà , un peu comme pour le phénomène du cloud, que beaucoup de domaines d’expertise sont concernés et chaque acteur informatique commence à développer une approche, pour ne pas dire un discours, sur le sujet du « Big Data ».
Dans le domaine de l’analyse des données il semble déjà que quelques outils ont pris un peu d’avance puisque dans chaque article sur le sujet on ne manque pas de les mentionner (et j’en fait autant) : MapReduce, développé par Google, et Hadoop destinés aux applications distribuées et à la gestion intensive des données.
Cisco et le BigData:
Bien sûr Cisco ne manque pas de s’intéresser à ce sujet très prometteur en travaillant sur :
- Les réseaux pour fournir des informations pertinentes aux outils d’analyses (voir l’annonce Cisco inroduces superior Network capacity, simpler way to build next generation Internet for Zettabyte era.)
- La manipulation des « rich media », l’Internet des objets communicants (IOT)
- Le traitement et l’analyse des données avec par exemple l’Unified Computing System et les technologies « in memory » de SAP (HANA) .
et sûrement d’autres sujets que je ne n’ai pas encore identifiés nécessitant sans doute des partenariats.
Pour le moment je vous propose de regarder cette video de Shaun Kirby Cisco qui propose une méthodologie en 5 points et qui fait allusion au développement de l’Internet Of Thing (IOT) ou en français “internet des objets”.
A suivre le développement et l’interaction de écosystème autour du BigData !