Upload
pour-action-
View
408
Download
0
Embed Size (px)
Citation preview
www.idc.com
Copyright 2012 IDC. Reproduction is forbidden unless authorized. All rights reserved.
Big Data : faire face au déluge
de données non structurées
Didier KRAINC
Directeur Général
http://www.idc.fr/
1e Février 2012
©2012 IDC
Le phénomène Big Data Une terminologie « marketing » … qui identifie un phénomène et une problématique bien réels.
2
Définition: phénomène qui fait référence à
des technologies, outils, processus et
procédures accessibles, permettant à
une organisation de créer, manipuler et
gérer de très larges quantités de
données, afin de faciliter la prise de
décision rapide. Google Trends sur le terme « Big Data » - Octobre 2011
Les objectifs:
Gérer des données hétérogènes, provenant de sources multiples, de
format souvent structuré et non structuré.
Traiter de haut volume (en taille et/ou en fréquence) de données qui sont
dynamiques et changeantes
Gérer les contenus imprévisibles, sans structure ou schéma apparent
Permettre un accès, une analyse et une récupération en temps réel, ou
quasi temps réel
©2012 IDC
Big Data, Information Management et 3ème plateforme industrielle
3
Applis
et appareilsmobiles
Réseaumobile
Services
Cloud
Big data/
analytics
Social business
2011
PC
LAN/Internet
Client-
Serveur
1986
Millions d'utilisateurs
Milliersd'Applications
Centaines de Millionsd'utilisateurs
Dizaine de milliersd'applications
Milliardsd'Utilisateurs
Millionsd'Applications
Trillionsd"objets connectés"
Transformation des industries
©2012 IDC
Quelques chiffres du marché
4
2005 2010 2015
Volume de données
créées et répliquées
130 exaoctets
1,2 zettaoctets
+7 zettaoctets
1 zettaoctets = 1 trillion de Go =
1.000.000.000.000.000.000.000 octets
Coût relatif du Go
(échelle 1/7000)
1 milliard d’utilisateurs d’Internet
mobile; 500,000 applications
pour téléphones mobiles
1.2 milliards de téléphones
mobiles; 220 million smart
phones
20 millions
de smart
meters aux
US
50 millions
de
serveurs
dont la
moitié
virtuels
©2012 IDC
Les cas d’utilisations
Diagnostiques médicaux
Développement pharmacologique
Détection des fraudes
Détection du terrorisme
E-reputation et suivi du consommateur
Veille et alerte produit rapide
Réduction du taux de désabonnement
Publicité et conseils personnalisés en temps réel
Support aux services d’urgences (face à l’excès
d’information)
5
©2012 IDC
Business Cases
Un distributeur d’envergure mondial a mis en place des outils de statistiques et de scoring
pour gérer ses assortiments et ses promotions. Les données sont disponibles mondialement
à J+1 pour une base de 75 To hors tickets de caisses.
Un éditeur de jeux vidéo qui, grâce à l’analyse des données comportementales captées sur
les pages vues de son site, déduit les préférences de jeux de chacun des visiteurs. Il multiplie
par 500 le taux de transformation de sa newsletter commerciale en envoyant un email
personnalisé à chaque membre au regard des pages qu’il avait visitées.
Le New York Times a utilisé Hadoop pour générer les PDF de 11 millions d'articles publiés
entre 1851 et 1922, et l'emploie désormais pour l'analyse de texte et le web mining.
La chaîne de librairies Barnes & Noble l'utilise pour comprendre les comportements d'achats
de ses clients sur ses divers canaux de distribution.
Disney teste la technologie avec des objectifs similaires en s'appuyant sur des ressources
dans le cloud et sur des serveurs inutilisés en raison de ses efforts de virtualisation.
McAfee fait appel aux technologies Big Data pour détecter des corrélations parmi les spams.
Les Giants de San Francisco (équipe de baseball) a mis en place une tarification dynamique
permettant de modifier le prix des billets en fonction de la demande, et ce, jusqu’à la dernière
minute. L’idée étant d’adapter les tarifs à la demande pour éviter la mévente et mieux
exploiter les phénomènes d’enchères (qui profitent plutôt au marché noir). Une tarification
dynamique qui a permis une augmentation du chiffre d’affaires du club de 6 % en 2010.
6
©2012 IDC
A problématique différente, solution différente
7
Analyse de très gros volume de
données, dont la nature et le format
changent
Hadoop MapReduce
Grand volume des données de petite
taille à conserver sur une longue
période + de nombreux processus
actifs
Stockage et mise en cache des
blocs de données définis par les
applications + réseau de capacités
en load-balacing
Partage de données en réseau, avec
une garantie de récupération et de
cohérence des données
Bases de données orientées objet
Réseau d’informations et de relations
complexes entre de grands volumes
d’entités distinctes
Base de données graphiques
Grand volume de données stables et
définies, issues de processus
métiers, de transaction ou reporting
Base de données relationnelles +
solutions analytiques
©2012 IDC 8
Merci
13, rue Paul Valéry
75116 Paris
France
Fax : +33 1 56 26 26 70
http://www.idc.fr/
Didier Krainc
Directeur Général
IDC France
Direct : +33 1 56 26 26 61