Transcript
Page 1: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Typologie des données et traitements associésPartie I : Définition des termes

Par Vincent BARBEROT

Page 2: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Format des données :

Le format des données est la manière utilisée en informatique pour représenter des données sous forme de nombres binaires. C'est une convention utilisée pour représenter des données — des informations représentant un texte, une page, une image, un son, un fichier exécutable, etc. Lorsque ces données sont stockées dans un fichier, on parle de format de fichier. Une telle convention permet d'échanger des données entre divers programmes informatiques ou logiciels, soit par une connexion directe, soit par l'intermédiaire d'un fichier. On appelle interopérabilité cette possibilité d'échanger des données entre différents logiciels.

Page 3: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Gestion des données :

La gestion des données est une discipline de gestion qui tend à valoriser les données en tant que ressources numériques. La gestion des données permet d'envisager le développement d'architectures, de réglementations, de pratiques et de procédures qui gèrent correctement les besoins des organismes sur le plan de tout le cycle de vie des données. Les données sont, avec les traitements, l'un des deux aspects des systèmes d'information traditionnellement identifiés, et l'un ne peut aller sans l'autre pour un management du système d'information cohérent. La gestion des données est une vision du management du système d'information qui se construit simplement autour de la nature de la donnée et non en fonction d'un système et ses interactions.

Page 4: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Open data :

Une donnée ouverte (en anglais open data) est une information publique brute, qui a vocation à être librement accessible et réutilisable. La philosophie pratique de l'open data préconise une libre disponibilité pour tous et chacun, sans restriction de copyright, brevets ou d'autres mécanismes de contrôle. En informatique, l’open data est une information structurée publique ou privée et généralement non utilisable par un humain mais interprétable par une machine.

Page 5: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Linkeddata :

Le Web des données (Linked Data, en anglais) est une initiative du W3C (Consortium World Wide Web) visant à favoriser la publication de données structurées sur le Web, non pas sous la forme de silos de données isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d'informations. Il s'appuie sur les standards du Web, tels que HTTP et URI - mais plutôt qu'utiliser ces standards uniquement pour faciliter la navigation par les êtres humains, le Web des données les étend pour partager l'information également entre machines. Cela permet d'interroger automatiquement les données, quels que soient leurs lieux de stockage, et sans avoir à les dupliquer.

Tim Berners-Lee, directeur du W3C, a inventé et défini le terme Linked Data et son synonyme Web of Data au sein d'un ouvrage portant sur l'avenir du Web sémantique. En France, le terme Web des données est de plus en plus utilisé par la communauté des professionnels du domaine.

Page 6: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Big Data :

Big data (« grosses données » ou grande quantité de données) est une expression anglophone utilisée pour désigner des ensembles de données qui deviennent tellement volumineux qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Les perspectives du traitement des big data sont énormes, notamment pour l'analyse d'opinions ou de tendances industrielles, la génomique, l'épidémiologie ou la lutte contre la criminalité ou la sécurité. Le phénomène Big data est considéré comme l'un des grands défis informatiques de la décennie 2010-2020. Il engendre une dynamique importante tant par l'administration, que par les spécialistes sur le terrain des technologies ou des usages.

Page 7: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Smart data :

Définition par la société Camp de base => 5S (Stratégie, Sourcer, Sélectionner, Signifier, Symboliser)

J'aurai tendance à remplacer smart data par business intelligence, plus connu en français sous le nom d'informatique décisionelle.

Business Intelligence :

L’informatique décisionnelle (en anglais Business Intelligence, BI) est l'informatique à l'usage des décideurs et des dirigeants d'entreprises. Elle désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données, matérielles ou immatérielles, d'une entreprise en vue d'offrir une aide à la décision et de permettre à un décideur d’avoir une vue d’ensemble de l’activité traitée.

Page 8: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Typologie des données et traitements associésPartie II : Cycle de vie continue de la donnée

Par Vincent BARBEROT

Page 9: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Données et réseaux sociaux :

Widget : cela permet d'afficher en temps réel les données sur un site web, par exemple Twitter

Curation : cela permet de regrouper par thématique des données, par exemple Scoop-it, Pearltrees, Hootsuite, ...

Page 10: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Données ouvertes, Crunchbase base de données de TechCrunch

Crunchbase donne accès à l'ensemble des données issues des articles de Techcrunch : le nom des sociétés, le nom des dirigeants, les levées de fonds avec le nom des investisseurs.

Données ouvertes, Dbpedia base de données de Wikipedia

Dbpedia donne accès à l'ensemble des données de l'encyclopédie Wikipedia, les définitions de la première partie sont issues de Wikipédia

Page 11: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Web de données, Linked data

Non seulement DBpedia est une base de données ouverte mais en plus son organisation permet une navigation entre les données

On peut dire que le HTML est à l'homme, ce que le Linked data est à la donnée

Page 12: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Big data et smart data

Dans les définitions, j'ai émis l'idée de remplacer smart data par business intelligence. Je vais aller plus loin en remplaçant big data par analytics data

Big data ; un problème nouveau ? Pour tout le monde ?Et si nous traduisions big data par infobésité, surinformation ?

Page 13: Egide15 : Du bigdata au smartdata

EGIDE15 – 17 mars 2015 à Entreprise & Cité

Par Vincent BARBEROT

Http://www.twitter.com/networkvbHttp://www.facebook.com/Networkvb

[email protected]

+33(0) 777 902 002


Recommended