107
Information numérique : définitions et enjeux Gautier Poupeau gautier.poupeau@lespetitesca ses.net http://www.lespetitescases.n et @lespetitescases Bilan de 4 ans de réflexions sur l’information numérique (2006- 2010)

Information numérique : défintions et enjeux

Embed Size (px)

Citation preview

Information numérique : définitions et enjeux

Gautier [email protected]://www.lespetitescases.net@lespetitescases

Bilan de 4 ans de réflexions sur l’information numérique (2006-2010)

Le document numérique : caractéristiques et enjeux

L’OAIS : un cadre normatif

Du signe à la connaissance : quelques définitions

En guise de conclusion

Moyens pour assurer la maîtrise de son information

Voici un signe

Du signe à la connaissance : le signe

Voici un signe

Signifiant

Code d’écriture / Alphabet / Syntaxe

Signifié

Représentation mentale / Concept / Sens

Du signe à la connaissance : le signe

ne possède pas ne comprend paspossède comprend

Voici un signe

Signifiant

Code d’écriture / Alphabet / Syntaxe

Signifié

Représentation mentale / Concept / Sens

Du signe à la connaissance : le signe

ne possède pas ne comprend paspossède comprend

Une série de signes reliées forme une donnée

Du signe à la connaissance : données et information

Chien Animal

Une série de signes reliées forme une donnée

Du signe à la connaissance : données et information

Chien Animal

Un ensemble de données organisé et verbalisé forme une information

Un message qui possède une grammaire (une structure)

Le chien est un animal qui peut être domestiqué

Du signe à la connaissance : le document

Une information inscrite sur un support constitue un document

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vestibulum pellentesque auctor tortor non venenatis. Mauris risus ipsum, mollis vitae vulputate vitae, hendrerit non magna. Sed sagittis elit sagittis nisi convallis tempus. Etiam pharetra rhoncus enim, sit amet gravida dolor ullamcorper ut. Quisque pellentesque tristique elit, sed mollis mauris convallis ut. Cras non est dolor. In hac habitasse platea dictumst. Etiam fermentum purus ante, porttitor tincidunt sem. Quisque lacinia sem eget ipsum fringilla ac scelerisque leo tempus. Nullam vehicula, magna non pharetra scelerisque, mi ligula adipiscing elit, ut sodales justo sem vel libero. Fusce sed diam eget augue tempor tempus. Morbi leo dolor, suscipit vitae vehicula blandit, congue sit amet lacus. Suspendisse potenti. Praesent consectetur ligula a leo varius lacinia. Phasellus auctor lacinia viverra.

Du signe à la connaissance : le document

Une information inscrite sur un support constitue un document

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vestibulum pellentesque auctor tortor non venenatis. Mauris risus ipsum, mollis vitae vulputate vitae, hendrerit non magna. Sed sagittis elit sagittis nisi convallis tempus. Etiam pharetra rhoncus enim, sit amet gravida dolor ullamcorper ut. Quisque pellentesque tristique elit, sed mollis mauris convallis ut. Cras non est dolor. In hac habitasse platea dictumst. Etiam fermentum purus ante, porttitor tincidunt sem. Quisque lacinia sem eget ipsum fringilla ac scelerisque leo tempus. Nullam vehicula, magna non pharetra scelerisque, mi ligula adipiscing elit, ut sodales justo sem vel libero. Fusce sed diam eget augue tempor tempus. Morbi leo dolor, suscipit vitae vehicula blandit, congue sit amet lacus. Suspendisse potenti. Praesent consectetur ligula a leo varius lacinia. Phasellus auctor lacinia viverra.

ContenuSupport

Du signe à la connaissance : le document

Une information inscrite sur un support constitue un document

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vestibulum pellentesque auctor tortor non venenatis. Mauris risus ipsum, mollis vitae vulputate vitae, hendrerit non magna. Sed sagittis elit sagittis nisi convallis tempus. Etiam pharetra rhoncus enim, sit amet gravida dolor ullamcorper ut. Quisque pellentesque tristique elit, sed mollis mauris convallis ut. Cras non est dolor. In hac habitasse platea dictumst. Etiam fermentum purus ante, porttitor tincidunt sem. Quisque lacinia sem eget ipsum fringilla ac scelerisque leo tempus. Nullam vehicula, magna non pharetra scelerisque, mi ligula adipiscing elit, ut sodales justo sem vel libero. Fusce sed diam eget augue tempor tempus. Morbi leo dolor, suscipit vitae vehicula blandit, congue sit amet lacus. Suspendisse potenti. Praesent consectetur ligula a leo varius lacinia. Phasellus auctor lacinia viverra.

ContenuSupport

Un document se conçoit comme un ensemble logique fini d’informations (contenu)

délimité par des caractéristiques physiques (support)

Du signe à la connaissance : la connaissance

Une connaissance est un ensemble d’informations sur lequel un humain peut exercer un raisonnement

Est-ce-qu’il fait beau à Agadir au mois de Février ?

Oui, c’est très agréable.

Du signe à la connaissance : la connaissance

Une connaissance est un ensemble d’informations sur lequel un humain peut exercer un raisonnement

Ma femme va pouvoir m’offrir des vacances !

Du signe à la connaissance : la connaissance

Une connaissance est un ensemble d’informations sur lequel un humain peut exercer un raisonnement

Super, le chef va partir !...

Du signe à la connaissance : Synthèse

Ne pas confondre : La gestion des données (SGBDR, Système de gestion des graphes, BD XML…)

La gestion de l’information (Portail, Moteur de recherche)

La gestion de contenu (CMS, wiki)

La gestion des supports de l’information (Système de fichiers, Système de stockage)

La gestion des documents (GED, Archivage/Records management)

La gestion des connaissances (le cerveau humain !)

Un vieux rêve : classer le mondePour appréhender au mieux les connaissances, les hommes ont cherché des moyens de classer et contenir les informations du monde :

Vocabulaire contrôlé

Mammifère

Animal

Reptile

PrimatesHomme

Chimpanzé

Un vieux rêve : classer le mondePour appréhender au mieux les connaissances, les hommes ont cherché des moyens de classer et contenir les informations du monde :

Vocabulaire contrôlé Taxinomie

Mammifère

Animal

Reptile

PrimatesHomme

Chimpanzé

Animal

Reptile

Mammifère

PrimatesHomme

narrower

Un vieux rêve : classer le mondePour appréhender au mieux les connaissances, les hommes ont cherché des moyens de classer et contenir les informations du monde :

Vocabulaire contrôlé Taxinomie

Mammifère

Animal

Reptile

PrimatesHomme

Chimpanzé

Thésaurus

Animal

Reptile

Mammifère

PrimatesHomme

Pays de langue française

Afrique Francophone

Europe Francophone

France

Suisse RomandeFrancophonie

narrower

narrower

related

Un vieux rêve : classer le mondePour appréhender au mieux les connaissances, les hommes ont cherché des moyens de classer et contenir les informations du monde :

Vocabulaire contrôlé Taxinomie

Mammifère

Animal

Reptile

PrimatesHomme

Chimpanzé

Thésaurus Ontologie

Animal

Reptile

Mammifère

PrimatesHomme

Personne

Animal Lieu

possède habite

est originaire de

Pays de langue française

Afrique Francophone

Europe Francophone

France

Suisse RomandeFrancophonie

narrower

narrower

related

Le document numérique : caractéristiques et enjeux

L’OAIS : un cadre normatif

Du signe à la connaissance : quelques définitions

En guise de conclusion

Moyens pour assurer la maîtrise de son information

Caractéristiques du document numérique sur le Web

Imaginons un livre numérisé et accessible sur Gallica

Le document numérique n’est pas auto-porteur : le document en lui-même est séparé

du support de lecture

Dématérialisation Ubiquité Sérendipité DéstructurationDécontextualisation Push / Pull

Caractéristiques du document numérique sur le Web

Imaginons un livre numérisé et accessible sur Gallica

Dématérialisation Ubiquité Sérendipité DéstructurationDécontextualisation Push / Pull

Le document numérique se caractérise par une séparation de la mise en forme

et du contenu

Le document numérique n’est pas auto-porteur : le document en lui-même est séparé

du support de lecture

Caractéristiques du document numérique sur le Web

Imaginons un livre numérisé et accessible sur Gallica

Il n’existe qu’un exemplaire, mais il est accessible à tout moment par

plusieurs personnes en même temps.

Ubiquité Sérendipité Déstructuration Push / PullDématérialisation Décontextualisation

Le document numérique se caractérise par une séparation de la mise en forme

et du contenu

Le document numérique n’est pas auto-porteur : le document en lui-même est séparé

du support de lecture

Caractéristiques du document numérique sur le Web

Imaginons un livre numérisé et accessible sur Gallica

Sérendipité Déstructuration

Le document existe en dehors de son usage par un utilisateur

Il n’existe qu’un exemplaire, mais il est accessible à tout moment par

plusieurs personnes en même temps.

UbiquitéDématérialisation Décontextualisation

Le document numérique se caractérise par une séparation de la mise en forme

et du contenu

Le document numérique n’est pas auto-porteur : le document en lui-même est séparé

du support de lecture

Push / Pull

Caractéristiques du document numérique sur le Web

Imaginons un livre numérisé et accessible sur Gallica

La structure du document numérique ne subit pas les

mêmes contraintes

Déstructuration

La naviguation à l’écran entraîne une perte des repères cognitifs

Sérendipité

Le document existe en dehors de son usage par un utilisateur

Il n’existe qu’un exemplaire, mais il est accessible à tout moment par

plusieurs personnes en même temps.

UbiquitéDématérialisation Décontextualisation

Le document numérique se caractérise par une séparation de la mise en forme

et du contenu

Le document numérique n’est pas auto-porteur : le document en lui-même est séparé

du support de lecture

Push / Pull

Caractéristiques du document numérique sur le Web

Imaginons un livre numérisé et accessible sur Gallica

Les points d’accès à l’information sont multipliés

Push / Pull

La structure du document numérique ne subit pas les

mêmes contraintes

Déstructuration

La naviguation à l’écran entraîne une perte des repères cognitifs

Sérendipité

Le document existe en dehors de son usage par un utilisateur

Il n’existe qu’un exemplaire, mais il est accessible à tout moment par

plusieurs personnes en même temps.

UbiquitéDématérialisation Décontextualisation

Le document numérique se caractérise par une séparation de la mise en forme

et du contenu

Le document numérique n’est pas auto-porteur : le document en lui-même est séparé

du support de lecture

Caractéristiques du document numérique sur le Web

Imaginons un livre numérisé et accessible sur Gallica

Assurer l’accès à l’information numérique Assurer la continuité de l’accès

Ces différentes caractéristiques imposent deux contraintes

Les points d’accès à l’information sont multipliés

Push / Pull

La structure du document numérique ne subit pas les

mêmes contraintes

Déstructuration

La naviguation à l’écran entraîne une perte des repères cognitifs

Sérendipité

Le document existe en dehors de son usage par un utilisateur

Il n’existe qu’un exemplaire, mais il est accessible à tout moment par

plusieurs personnes en même temps.

UbiquitéDématérialisation Décontextualisation

Le document numérique se caractérise par une séparation de la mise en forme

et du contenu

Le document numérique n’est pas auto-porteur : le document en lui-même est séparé

du support de lecture

Assurer l’accès à l’information numérique : la granularité

Document Volume, tome, fascicule... Page

CollectionVue de détail

Cas des livres

Le terme « granularité » renvoie aux niveaux d’accès d’une ressource

Assurer l’accès à l’information numérique : la granularité

Document Volume, tome, fascicule... Page

CollectionVue de détail

Image(légende)

LotCollection

Cas des livres

Cas des lots d’image

Vue de détail

Le terme « granularité » renvoie aux niveaux d’accès d’une ressource

Assurer l’accès à l’information numérique : la granularité

Document Volume, tome, fascicule... Page

CollectionVue de détail

Image(légende)

LotCollection

Cas des livres

Cas des lots d’image

Vue de détail

Cas des archives du Web

Collection Résultat d’une collecte

Une page Web / une URL

Vue de détail

Le terme « granularité » renvoie aux niveaux d’accès d’une ressource

Assurer l’accès à l’information numérique : le document

Il existe plusieurs niveaux d’appréhension d’un document numérique

Cas d’un document issu d’un support physique traditionnel

Assurer l’accès à l’information numérique : le document

L’objet

Cas d’un document issu d’un support physique traditionnel

Pages

Structure physique

Il existe plusieurs niveaux d’appréhension d’un document numérique

Assurer l’accès à l’information numérique : le document

Nous étions à l'Étude, quand le Proviseur entra, suivi d'un nouveau habillé en bourgeois et d'un garçon de classe qui portait un grand pupitre. Ceux qui dormaient se réveillèrent, et chacun se leva comme surpris dans son travail.

Première partie

L’objet

Cas d’un document issu d’un support physique traditionnel

Pages

Structure physique

Le contenu

Nous étions à l'Étude, quand le Proviseur entra, suivi d'un nouveau habillé en bourgeois et d'un garçon de classe qui portait un grand pupitre.

Chapitre 1 Une nuit, vers onze heures, ils furent réveillés par le bruit d'un cheval qui s'arrêta juste à la porte. La bonne ouvrit la lucarne du grenier et parleme

Chapitre 2

Deuxième partie

Yonville-l'Abbaye (ainsi nommé à cause d'une ancienne abbaye de Capucins dont les ruines n'existent même plus) est un bourg à huit lieues de Rouen

Chapitre 1Emma descendit la première, puis Félicité, M. Lheureux, une nourrice, et l'on fut obligé de réveiller Charles dans son coin, où il s'était endormi

Chapitre 2

Structure logique

Il existe plusieurs niveaux d’appréhension d’un document numérique

Assurer l’accès à l’information numérique : le document

Nous étions à l'Étude, quand le Proviseur entra, suivi d'un nouveau habillé en bourgeois et d'un garçon de classe qui portait un grand pupitre. Ceux qui dormaient se réveillèrent, et chacun se leva comme surpris dans son travail.

Première partie

L’objet

Cas d’un document issu d’un support physique traditionnel

Pages

Fichiers

Structure physique

Le contenu

Nous étions à l'Étude, quand le Proviseur entra, suivi d'un nouveau habillé en bourgeois et d'un garçon de classe qui portait un grand pupitre.

Chapitre 1 Une nuit, vers onze heures, ils furent réveillés par le bruit d'un cheval qui s'arrêta juste à la porte. La bonne ouvrit la lucarne du grenier et parleme

Chapitre 2

Deuxième partie

Yonville-l'Abbaye (ainsi nommé à cause d'une ancienne abbaye de Capucins dont les ruines n'existent même plus) est un bourg à huit lieues de Rouen

Chapitre 1Emma descendit la première, puis Félicité, M. Lheureux, une nourrice, et l'on fut obligé de réveiller Charles dans son coin, où il s'était endormi

Chapitre 2

Structure logique

Structure numérique

Il existe plusieurs niveaux d’appréhension d’un document numérique

Assurer l’accès à l’information numérique : le document

Nous étions à l'Étude, quand le Proviseur entra, suivi d'un nouveau habillé en bourgeois et d'un garçon de classe qui portait un grand pupitre. Ceux qui dormaient se réveillèrent, et chacun se leva comme surpris dans son travail.

Première partie

L’objet

Cas d’un document issu d’un support physique traditionnel

Pages

Fichiers

Structure physique

Le contenu

Nous étions à l'Étude, quand le Proviseur entra, suivi d'un nouveau habillé en bourgeois et d'un garçon de classe qui portait un grand pupitre.

Chapitre 1 Une nuit, vers onze heures, ils furent réveillés par le bruit d'un cheval qui s'arrêta juste à la porte. La bonne ouvrit la lucarne du grenier et parleme

Chapitre 2

Deuxième partie

Yonville-l'Abbaye (ainsi nommé à cause d'une ancienne abbaye de Capucins dont les ruines n'existent même plus) est un bourg à huit lieues de Rouen

Chapitre 1Emma descendit la première, puis Félicité, M. Lheureux, une nourrice, et l'on fut obligé de réveiller Charles dans son coin, où il s'était endormi

Chapitre 2

Structure logique

Structure numérique

Il est nécessaire de refléter et de mettre en relation ces différentes structures qui sont autant de point d’accès à l’information

Il existe plusieurs niveaux d’appréhension d’un document numérique

Assurer l’accès à l’information numérique : le document

Cas d’un document nativement numérique

WARC

Il existe plusieurs niveaux d’appréhension d’un document numérique

Assurer l’accès à l’information numérique : le document

Cas d’un document nativement numérique

Ressource / URL

WARC

Structure physique

Il existe plusieurs niveaux d’appréhension d’un document numérique

Assurer l’accès à l’information numérique : le document

Cas d’un document nativement numérique

Il est nécessaire de refléter et de mettre en relation ces différentes structures qui sont autant de point d’accès à l’information

Ressource / URL

WARC

Fichiers

Structure physique

Structure numérique

Structure logique

Il existe plusieurs niveaux d’appréhension d’un document numérique

Assurer l’accès à l’information numérique : la collection

Catalogue de données structurées

Plusieurs méthodes d’accès à un document appartenant à une collection

Je recherche le document dont le titre est Madame Bovary et l’auteur

Gustave Flaubert

Assurer l’accès à l’information numérique : la collection

Catalogue de données structurées

Plusieurs méthodes d’accès à un document appartenant à une collection

Je recherche le document dont le titre est Madame Bovary et l’auteur

Gustave Flaubert

Moteur de recherche

Je recherche le document qui contient « bovary » dans méta ou

le texte intégral

Assurer l’accès à l’information numérique : la collection

Catalogue de données structurées

Plusieurs méthodes d’accès à un document appartenant à une collection

Je recherche le document dont le titre est Madame Bovary et l’auteur

Gustave Flaubert

Moteur de recherche

Je recherche le document qui contient « bovary » dans méta ou

le texte intégral

Je souhaite naviguer dans une collection particulière

Système de navigation

Assurer l’accès à l’information numérique : synthèse

La page Web doit refléter les différentes structures, contenir les éléments pour la navigation dans le document et dans la collection

Représentation numérique de la structure physique

Assurer l’accès à l’information numérique : synthèse

Structure physique

La page Web doit refléter les différentes structures, contenir les éléments pour la navigation dans le document et dans la collection

Assurer l’accès à l’information numérique : synthèse

Structure logique

La page Web doit refléter les différentes structures, contenir les éléments pour la navigation dans le document et dans la collection

Assurer l’accès à l’information numérique : synthèse

Description du document pour une mise en contexteDescription du document pour une mise en contexte

La page Web doit refléter les différentes structures, contenir les éléments pour la navigation dans le document et dans la collection

Assurer l’accès à l’information numérique : synthèse

Navigation dans le document

La page Web doit refléter les différentes structures, contenir les éléments pour la navigation dans le document et dans la collection

Assurer l’accès à l’information numérique : synthèse

Navigation dans la collection

La page Web doit refléter les différentes structures, contenir les éléments pour la navigation dans le document et dans la collection

Assurer l’accès à l’information : la méta-collection

Agréger

Pour faciliter la recherche de l’utilisateur, des portails constituent des méta-collections, véritable hub de collections de documents numériques, un exemple : Europeana

Exposer / Partager Donner accès

OAI-PMH est un protocole qui permet ce genre d’usages

Assurer l’accès à l’information numérique : Synthèse

Usage Informations nécessaires

Rechercher dans la collection, naviguer dans la collection, contextualiser la consultation de l’utilisateur

Informations descriptives et/ou bibliographiques (titre, auteur, année de création, sujets…)

Reconstituer un objet complexe (un livre), naviguer dans le document, situer l’utilisateur dans le document

Informations de structure (arborescence ou carte des différents niveaux de granularité et des relations)

Proposer une représentation numérique de l’objet, relier une représentation numérique à un nivaeau de granularité physique ou logique

Informations sur la structure numérique (liste des fichiers)

Localiser et identifier les différents niveaux de granularité

Information de référence (identifiants, URI…)

Quelles sont les informations nécessaires pour assurer l’accès à l’information numérique ?

Assurer la continuité de l’accès : problèmes de la vision actuelle du SI

Les architectes techniques, les concepteurs et les développeurs les traduisent pour

déployer

L’infrastructure matérielle et logicielle

Les utilisateurs finaux du système d’informationexpriment leurs besoins

Les experts fonctionnelsrédigent les spécifications fonctionnelles

Conception du SI

L’application est orientée processusIl n’a jamais été question de l’information

Assurer la continuité de l’accès : problèmes de la vision actuelle du SI

Les architectes techniques, les concepteurs et les développeurs les traduisent pour

déployer

L’infrastructure matérielle et logicielle

Les utilisateurs finaux du système d’informationexpriment leurs besoins

Les experts fonctionnelsrédigent les spécifications fonctionnelles

Conception du SI Conséquencessur le SI

SI = Boîte noire

L’organisationdélègue la gestion

et le stockagedes données au SI

Les utilisateurs créent l’information

L’organisation n’a aucune maîtrise de ces données, sur leur cycle de vie, sur leur évolution et sur leur pérennisation.

L’évolution des usages impose l’évolution des données et donc le changement du SI.

Les applications l’exploitent

L’application est orientée processusIl n’a jamais été question de l’information

Traditionnellement, la modélisation d’un SI est basée sur les besoins des utilisateurs.

Les processus : la partie émergée de l’iceberg• Besoins primaires : production, stockage et restitution ;• Modélisation des processus-métiers ; • Réponse directe aux besoins des utilisateurs.• Entraîne une multiplication des applications• A chaque application, sa logique propre, son format de données, ses propres mécanismes d’accès

Assurer la continuité de l’accès : problèmes de la vision actuelle du SI

Traditionnellement, la modélisation d’un SI est basée sur les besoins des utilisateurs.

Les processus : la partie émergée de l’iceberg• Besoins primaires : production, stockage et restitution ;• Modélisation des processus-métiers ; • Réponse directe aux besoins des utilisateurs.• Entraîne une multiplication des applications• A chaque application, sa logique propre, son format de données, ses propres mécanismes d’accès

Les données : la partie immergée de l’iceberg

• Les données du SI dépendent de la modélisation des processus ;• Les données sont enfermées dans chaque application formant des silos de données ;• Absence de cohérence technique et sémantique entre les silos ;• Le modèle physique de stockage des données peut être très éloigné du modèle logique ce qui rend difficile la migration, la maintenance et la compréhension du modèle ;

Assurer la continuité de l’accès : problèmes de la vision actuelle du SI

Assurer la continuité de l’accès : maîtriser les informations du SI

« Sans maîtrise, la puissance n’est rien »

Imaginez de conduire une voiture sans frein et avec des pneus lisses sur une route glissante

Assurer la continuité de l’accès : maîtriser les informations du SI

« Sans maîtrise, la puissance n’est rien »

Imaginez un entrepôt de magasin sans un inventaire

Alors, pourquoi ce serait différent avec l’information d’un SI ?

Assurer la continuité de l’accès : maîtriser les informations du SI

« Sans maîtrise, la puissance n’est rien »

Assurer la continuité de l’accès : maîtriser les informations du SI

« Sans maîtrise, la puissance n’est rien »

Données

Formats

Maîtriser les spécifications du format et son utilisation.Connaître le format, les spécificités d’utilisation pour chaque objet-données.

Assurer la continuité de l’accès : maîtriser les informations du SI

« Sans maîtrise, la puissance n’est rien »

Données

Formats

Maîtriser les spécifications du format et son utilisation.Connaître le format, les spécificités d’utilisation pour chaque objet-données.

Maîtriser les conditions de création et d’utilisation des données pour prévoir l’évolution et/ou assurer l’exploitabilité.

L’environnement applicatif

Assurer la continuité de l’accès : maîtriser les informations du SI

« Sans maîtrise, la puissance n’est rien »

Données

Formats

Maîtriser les spécifications du format et son utilisation.Connaître le format, les spécificités d’utilisation pour chaque objet-données.

Maîtriser les conditions de création et d’utilisation des données pour prévoir l’évolution et/ou assurer l’exploitabilité.

L’environnement applicatifL’environnement de stockage

Maîtriser les conditions de stockage et assurer l’intégrité des données stockées

Assurer la continuité de l’accès : maîtriser les informations du SI

« Sans maîtrise, la puissance n’est rien »

Données

Formats

Maîtriser les spécifications du format et son utilisation.Connaître le format, les spécificités d’utilisation pour chaque objet-données.

Cycle de vie

Maîtriser les processus de création, modification, accès.Tracer l’ensemble des opération sur les données

Maîtriser les conditions de création et d’utilisation des données pour prévoir l’évolution et/ou assurer l’exploitabilité.

L’environnement applicatifL’environnement de stockage

Maîtriser les conditions de stockage et assurer l’intégrité des données stockées

Assurer la continuité de l’accès : maîtriser les informations du SI

« Sans maîtrise, la puissance n’est rien »

Données

Pour maîtriser au mieux les données, il faut construire le SI autour des données avec une approche orientée données

Formats

Maîtriser les spécifications du format et son utilisation.Connaître le format, les spécificités d’utilisation pour chaque objet-données.

Cycle de vie

Maîtriser les processus de création, modification, accès.Tracer l’ensemble des opération sur les données

Maîtriser les conditions de création et d’utilisation des données pour prévoir l’évolution et/ou assurer l’exploitabilité.

L’environnement applicatifL’environnement de stockage

Maîtriser les conditions de stockage et assurer l’intégrité des données stockées

Assurer la continuité de l’accès : Synthèse

Usage Informations nécessaires

savoir quels sont les caractéristiques précises de mes données numériques

Informations techniques (format de données, caractéristiques de mon fichier)

Auditer régulièrement, assurer l’intégrité des données

Informations d’intégrité (taille du fichier, empreintes, état des support de stockage)

Assurer la traçabilité de mes données numériques

Informations de provenance

Assurer la réutilisation et l’exploitabilité des données numériques

Information de contexte et d’environnement matériel et logiciel

Quelles sont les informations nécessaires pour assurer la continuité de l’accès à l’information numérique ?

Rappel de l’ensemble des enjeux

Voici un document numérique que j’ai créé en 1998.

Rappel de l’ensemble des enjeux

Voici un document numérique que j’ai créé en 1998.

De quoi s’agit-il, déjà ? Est-ce bien ce qui est indiqué sur la disquette ?

Métadonnées descriptives

Rappel de l’ensemble des enjeux

Voici un document numérique que j’ai créé en 1998.

Je l’ai enregistré sur une disquette, est-elle toujours en bon état ?

De quoi s’agit-il, déjà ? Est-ce bien ce qui est indiqué sur la disquette ?

Métadonnées descriptives

Support

Rappel de l’ensemble des enjeux

Voici un document numérique que j’ai créé en 1998.

Je l’ai enregistré sur une disquette, est-elle toujours en bon état ?

Mon portable, acheté en 2004, n’a pas de lecteur de disquette. Où en trouver un ?

De quoi s’agit-il, déjà ? Est-ce bien ce qui est indiqué sur la disquette ?

Métadonnées descriptives

Support

Environnement matériel

Rappel de l’ensemble des enjeux

Voici un document numérique que j’ai créé en 1998.

Je l’ai enregistré sur une disquette, est-elle toujours en bon état ?

Mon portable, acheté en 2004, n’a pas de lecteur de disquette. Où en trouver un ?

J’ai créé ce document avec Claris Works. Comment vais-je retrouver ce logiciel ?

De quoi s’agit-il, déjà ? Est-ce bien ce qui est indiqué sur la disquette ?

Métadonnées descriptives

Support

Environnement matériel

Environnement logiciel /Formats du fichier

Rappel de l’ensemble des enjeux

Voici un document numérique que j’ai créé en 1998.

Je l’ai enregistré sur une disquette, est-elle toujours en bon état ?

Mon portable, acheté en 2004, n’a pas de lecteur de disquette. Où en trouver un ?

J’ai créé ce document avec Claris Works. Comment vais-je retrouver ce logiciel ?

J’ai trouvé le logiciel, mais puis-je l’installer et l’utiliser sous Windows XP ?

De quoi s’agit-il, déjà ? Est-ce bien ce qui est indiqué sur la disquette ?

Métadonnées descriptives

Support

Environnement matériel

Environnement logiciel /Formats du fichier

Système d’exploitation

Rappel de l’ensemble des enjeux

Voici un document numérique que j’ai créé en 1998.

Je l’ai enregistré sur une disquette, est-elle toujours en bon état ?

Mon portable, acheté en 2004, n’a pas de lecteur de disquette. Où en trouver un ?

J’ai créé ce document avec Claris Works. Comment vais-je retrouver ce logiciel ?

J’ai trouvé le logiciel, mais puis-je l’installer et l’utiliser sous Windows XP ?

Ça marche ! Mais j’ai perdu toute ma mise en forme …

De quoi s’agit-il, déjà ? Est-ce bien ce qui est indiqué sur la disquette ?

Métadonnées descriptives

Support

Environnement matériel

Environnement logiciel /Formats du fichier

Système d’exploitation

Authenticité / Intégrité

Le document numérique : caractéristiques et enjeux

L’OAIS : un cadre normatif

Du signe à la connaissance : quelques définitions

En guise de conclusion

Moyens pour assurer la maîtrise de son information

Moyens pour maîtriser l’information numérique

Moyensorganisationnels

Contratde service

Moyenstechniques

Systèmede gestion

Moyensréglementaires

NormesStandards

Moyenshumains

Organisationpluri-disciplinaire

Moyensstratégiques

Gestiondes risques

Moyensinformationnels

MétadonnéesRéférentiels

Les moyens stratégiques

La maîtrise de la collection numérique sur le long terme passe par une gestion des risques d’obsolescence en fonction des besoins des communautés d’utilisateurs cibles.

Une gestion des risques

Besoin des communautésd’utilisateurs cibles

Les moyens stratégiques

Une gestion des risques

Objectif : définir des politiques de préservation

Besoin des communautésd’utilisateurs cibles

Veiller à

l’adéquation

Stratégies pour pallier aux risques d’obsolescence

La maîtrise de la collection numérique sur le long terme passe par une gestion des risques d’obsolescence en fonction des besoins des communautés d’utilisateurs cibles.

Les moyens organisationnelsAfin de déterminer la structure des données à maîtriser, les responsabilités et les moyens à mettre en œuvre, le producteur des données, l’utilisateur et le gestionnaire signent

Un contrat portant sur

Les données

• la structure des données• les formats des fichiers• les modalités d’accès aux données (formes et autorisations)• les différentes métadonnées utiles et leurs formats

Les moyens organisationnels

Un contrat portant sur

Les données Les processus

• la structure des données• les formats des fichiers• les modalités d’accès aux données (formes et autorisations)• les différentes métadonnées utiles et leurs formats

• le nombre maximum de chaque type de processus sur une période de temps• le temps maximum d’exécution d’une instance de chaque type de processus• les utilisateurs autorisés à lancer chaque type de processus

Afin de déterminer la structure des données à maîtriser, les responsabilités et les moyens à mettre en œuvre, le producteur des données, l’utilisateur et le gestionnaire signent

Les moyens organisationnels

Un contrat portant sur

Les données Les processus Les modalités de stockage

• la structure des données• les formats des fichiers• les modalités d’accès aux données (formes et autorisations)• les différentes métadonnées utiles et leurs formats

• le nombre maximum de chaque type de processus sur une période de temps• le temps maximum d’exécution d’une instance de chaque type de processus• les utilisateurs autorisés à lancer chaque type de processus

• le nombre de copies• les supports de stockage• les conditions de lecture et d’écriture• les particularités de stockage (par exemple, cryptage ou compression)

Afin de déterminer la structure des données à maîtriser, les responsabilités et les moyens à mettre en œuvre, le producteur des données, l’utilisateur et le gestionnaire signent

Les moyens organisationnels

Un contrat portant sur

Les données Les processus Les modalités de stockage

La politique de préservation

• la structure des données• les formats des fichiers• les modalités d’accès aux données (formes et autorisations)• les différentes métadonnées utiles et leurs formats

• le niveau de préservation :• stockage sécurisé• possibilité de migration• conditions d’émulation

• le niveau d’attention et de surveillance (fréquence d’audit)• les durées de rétention

• le nombre maximum de chaque type de processus sur une période de temps• le temps maximum d’exécution d’une instance de chaque type de processus• les utilisateurs autorisés à lancer chaque type de processus

• le nombre de copies• les supports de stockage• les conditions de lecture et d’écriture• les particularités de stockage (par exemple, cryptage ou compression)

Afin de déterminer la structure des données à maîtriser, les responsabilités et les moyens à mettre en œuvre, le producteur des données, l’utilisateur et le gestionnaire signent

Les moyens informationnels

des métadonnées et des référentiels

La maîtrise de la collection numérique passe par une parfaite connaissance des données qui la composent et de toutes leurs caractéristiques, c’est-à-dire disposer

Exemple : un livre numérisé

1ère question : Quel est ce livre ?Métadonnées descriptives

Les moyens informationnels

des métadonnées et des référentiels

Fichiers

Structure numérique

Exemple : un livre numérisé

1ère question : Quel est ce livre ?Métadonnées descriptives

2ème question : Quels sont tous les fichiersqui résultent de la numérisation ?

Structure numérique

La maîtrise de la collection numérique passe par une parfaite connaissance des données qui la composent et de toutes leurs caractéristiques, c’est-à-dire disposer

Les moyens informationnels

des métadonnées et des référentiels

Fichiers

Structure numérique

Exemple : un livre numérisé

1ère question : Quel est ce livre ?Métadonnées descriptives

3ème question : Quels sont les formats des fichiers ?Métadonnées techniques

2ème question : Quels sont tous les fichiersqui résultent de la numérisation ?

Structure numérique

La maîtrise de la collection numérique passe par une parfaite connaissance des données qui la composent et de toutes leurs caractéristiques, c’est-à-dire disposer

Les moyens informationnels

des métadonnées et des référentiels

Fichiers

Structure numérique

Exemple : un livre numérisé

1ère question : Quel est ce livre ?Métadonnées descriptives

3ème question : Quels sont les formats des fichiers ?Métadonnées techniques

2ème question : Quels sont tous les fichiersqui résultent de la numérisation ?

Structure numérique

4ème question : l’organisation maîtrise-t-elle ces formats ?

Référentiel de formats

Formats

La maîtrise de la collection numérique passe par une parfaite connaissance des données qui la composent et de toutes leurs caractéristiques, c’est-à-dire disposer

Les moyens informationnels

des métadonnées et des référentiels

Fichiers

Structure numérique

Exemple : un livre numérisé

1ère question : Quel est ce livre ?Métadonnées descriptives

3ème question : Quels sont les formats des fichiers ?Métadonnées techniques

2ème question : Quels sont tous les fichiersqui résultent de la numérisation ?

Structure numérique

4ème question : l’organisation maîtrise-t-elle ces formats ?

Référentiel de formats

Formats

5ème question : Quand a eu lieu la numérisationet quel est le nom du scanner ?Métadonnées de provenance

La maîtrise de la collection numérique passe par une parfaite connaissance des données qui la composent et de toutes leurs caractéristiques, c’est-à-dire disposer

Les moyens informationnels

des métadonnées et des référentiels

L’objet

Pages

Fichiers

Structure physique

Structure numérique

Exemple : un livre numérisé

1ère question : Quel est ce livre ?Métadonnées descriptives

3ème question : Quels sont les formats des fichiers ?Métadonnées techniques

2ème question : Quels sont tous les fichiersqui résultent de la numérisation ?

Structure numérique

4ème question : l’organisation maîtrise-t-elle ces formats ?

Référentiel de formats

Formats

5ème question : Quand a eu lieu la numérisationet quel est le nom du scanner ?Métadonnées de provenance

6ème question : A quelle page correspond chaque fichier ?Métadonnées de structure

La maîtrise de la collection numérique passe par une parfaite connaissance des données qui la composent et de toutes leurs caractéristiques, c’est-à-dire disposer

Les moyens techniquesAfin d’assurer les termes du contrat et les niveaux de services attendus,

le gestionnaire s’appuie sur

Un système de gestion de la collection numérique composé de

Outils de contrôle qualité,d’audit et de surveillance

Système destockage sécurisé

http://www.flickr.com/photos/zigazou76/3603710759/

Outils de planificationsd’actions en masse

Objectif : Assurer une stricte indépendance entre les données et le système

Outils de récupérationet de transformation

des données

Système d’indexationet d’interrogation des

métadonnées

Outils d’enrichissementdes métadonnées

Outil de gestion des référentiels

Les moyens humainsLe système ne constituant qu’un outil de gestion, son exploitation,

son évolution et l’application concrète des termes du contrat sont assurés par

Une organisation humaine pluri-disciplinaire

Les administrateurs Les experts de préservation

• Veiller au bon fonctionnement du système• Assister le producteur en cas de problème de qualité des données• Traiter les alertes renvoyées par le système • Assurer le maintien en condition opérationnelle de l'infrastructure de stockage• Valider/programmer/lancer les planifications des tâches opérationnelles (audit, migration…)• Négocier avec le producteur• Développer les évolutions du système

Professionnels de l’exploitationdes systèmes d’information

• Gérer les risques• Accompagner les producteurs dans l‘établissement de leur politique de préservation• Gérer les référentiels• Effectuer une veille sur les formats pour engager les réflexions sur les migrations• Veiller à l’adéquation des moyens mis en œuvre avec les besoins des communautés d’utilisateur cibles• Spécifier les évolutions fonctionnelles et du modèle de données

Professionnels de l’informationspécialistes de la conservation numérique

Les moyens réglementairesAfin d’assurer la transparence nécessaire pour donner confiance aux producteurs et l’interopérabilité sur le long terme, l’ensemble des moyens mis en œuvre doivent se baser sur

les normes et standards en vigueur

Exploitationdes donnéesModèles et cadres Structuration

des données

OAIS (ISO 14721)

Le document numérique : caractéristiques et enjeux

L’OAIS : un cadre normatif

Du signe à la connaissance : quelques définitions

En guise de conclusion

Moyens pour assurer la maîtrise de son information

L’OAIS : Penser le management de l’information numérique

Face à l’enjeu scientifique, stratégique et économique que représente le défi d’assurer l’accès à la documentation obtenue par les explorations spatiales, les agences spatiales du monde entier ont mis au point un modèle conceptuel pour gérer l’information numérique sur le très long terme :

Open Archival Information System, norme ISO 14721:2003

Mode d’emploi sous la forme d’une fusée à trois étages

L’OAIS : Penser le management de l’information numérique

Open Archival Information System, norme ISO 14721:2003

Mode d’emploi sous la forme d’une fusée à trois étages

Un modèle d’informations pour décrire la structure des

données

Face à l’enjeu scientifique, stratégique et économique que représente le défi d’assurer l’accès à la documentation obtenue par les explorations spatiales, les agences spatiales du monde entier ont mis au point un modèle conceptuel pour gérer l’information numérique sur le très long terme :

L’OAIS : Penser le management de l’information numérique

Open Archival Information System, norme ISO 14721:2003

Mode d’emploi sous la forme d’une fusée à trois étages

Un modèle d’informations pour décrire la structure des

données

Un modèle fonctionnel pour décrire les processus

subis par les données

Face à l’enjeu scientifique, stratégique et économique que représente le défi d’assurer l’accès à la documentation obtenue par les explorations spatiales, les agences spatiales du monde entier ont mis au point un modèle conceptuel pour gérer l’information numérique sur le très long terme :

L’OAIS : Penser le management de l’information numérique

Open Archival Information System, norme ISO 14721:2003

Mode d’emploi sous la forme d’une fusée à trois étages

Un modèle d’informations pour décrire la structure des

données

Un modèle fonctionnel pour décrire les processus

subis par les données

Pour mettre en place desstratégies de préservation

Face à l’enjeu scientifique, stratégique et économique que représente le défi d’assurer l’accès à la documentation obtenue par les explorations spatiales, les agences spatiales du monde entier ont mis au point un modèle conceptuel pour gérer l’information numérique sur le très long terme :

+ +

Objet physique

Le modèle d’informations : la notion de paquet

Dans la plaine rase, sous la nuit sans étoiles, d'une obscurité et d'une épaisseur d'encre, un homme suivait seul la grande route de Marchiennes à Montsou, dix kilomètres de pavé, coupant tout droit, à travers les champs de betteraves. Devant lui, il ne voyait même pas le sol noir, et il n'avait la sensation de l'immense horizon plat que par les souffles du vent de mars, des rafales larges comme sur une mer, glacées d'avoir balayé des lieues de marais et de terres nues.

Contenu Paratexte

Support

Connaissance

+ +

+ +

Objet physique

Objet numérique

Le modèle d’informations : la notion de paquet

Train de bits Information de représentation

Dans la plaine rase, sous la nuit sans étoiles, d'une obscurité et d'une épaisseur d'encre, un homme suivait seul la grande route de Marchiennes à Montsou, dix kilomètres de pavé, coupant tout droit, à travers les champs de betteraves. Devant lui, il ne voyait même pas le sol noir, et il n'avait la sensation de l'immense horizon plat que par les souffles du vent de mars, des rafales larges comme sur une mer, glacées d'avoir balayé des lieues de marais et de terres nues.

Contenu Paratexte

Information de pérennisation

Paquet

Support

Connaissance

+ +

+ +

Objet physique

Objet numérique

Le modèle d’informations : la notion de paquet

Train de bits Information de représentation

Dans la plaine rase, sous la nuit sans étoiles, d'une obscurité et d'une épaisseur d'encre, un homme suivait seul la grande route de Marchiennes à Montsou, dix kilomètres de pavé, coupant tout droit, à travers les champs de betteraves. Devant lui, il ne voyait même pas le sol noir, et il n'avait la sensation de l'immense horizon plat que par les souffles du vent de mars, des rafales larges comme sur une mer, glacées d'avoir balayé des lieues de marais et de terres nues.

Contenu Paratexte

Information de pérennisation

Paquet

Le paquet contient toutes les informations nécessaires pour appréhender et exploiter l’objet numérique

Support

Connaissance

Paquet d’archivage

Paquet de dissémination

Paquet de versement

Le modèle d’informations : le cycle de vie du paquet

La structure et le contenu du paquet évolue en fonction de l’étape dans son cycle de vie pour prendre la forme la plus appropriée à une gestion et une maîtrise optimales de l’information.

Le modèle d’information : Vue détaillée

PRODUCTEUR

UTILISATEUR

MANAGEMENT

entrées

données

stockage

SIPAIP accès

DIP

ADMINISTRATION

PLANIFICATION DE LA PRESERVATION

Le modèle fonctionnel : processus et organisation

Le modèle fonctionnel définit les processus d’une archive et les responsabilités afférentes

Objectif de l’OAIS : maîtriser sur le long terme

Pour assurer la continuité de l’accès à une information intelligible, il faut prendre soin des objets-données et des informations nécessaires à leur exploitation.

Développer des stratégies de préservation

MigrationRafraîchissement de support

Renouvellement de support

Transformation Émulation

Migration de format Simuler l’environnement matériel et logiciel

Le modèle OAIS : une synthèse

L’OAIS est un modèle conceptuel pour construire un SI, un cadre, un guide de bonnes pratiques pour gérer l’information sur le très long terme

Il ne définit pas

Formats Application techniqueou informatique

Il définitde nombreux termes sont trop génériques ou trop

ambigusIl constitue

Référentiel commun

Le modèle OAIS : une synthèse

L’OAIS est un modèle conceptuel pour construire un SI, un cadre, un guide de bonnes pratiques pour gérer l’information sur le très long terme

Il ne définit pas

Formats Application techniqueou informatique

Il définitde nombreux termes sont trop génériques ou trop

ambigusIl constitue

Référentiel commun

À établir la responsabilité de la conservation : notion de mission, de contrat

À surveiller les documents avant que les dégradations ne se produisent (en général, avec le numérique, « après »= trop tard)

À garantir l’intégrité des documents, vérifier qu’ils ne sont pas altérés, et s’ils le sont, expliquer pourquoi

À organiser l’activité de conservation autour d’un référentiel commun pour faciliter les évolutions

La vision du SI dans le cadre de l’OAIS

La pérennisation passe par une attention sur les données dans la conception

expriment leurs besoins

Les utilisateurs

Expert fonctionnel

décrivent leurs données

Prennent en compte lesaspects fonctionnels

Rédigent les spécifications fonctionnelles

L’infrastructure matériel et logicel

modélisent les données

Les architectes techniques, les concepteurs et les développeurs traduisent les

spécifications et le modèle de données pour déployer

L’architecte de données

La vision du SI dans le cadre de l’OAIS

La pérennisation passe par une attention sur les données dans la conception et l’architecture du SI

expriment leurs besoins

Les utilisateurs

Expert fonctionnel

décrivent leurs données

Prennent en compte lesaspects fonctionnels

Rédigent les spécifications fonctionnelles

L’infrastructure matériel et logicel

modélisent les données

Les architectes techniques, les concepteurs et les développeurs traduisent les

spécifications et le modèle de données pour déployer

L’architecte de données

En plaçant les données au cœur du SI, les problématiques de la pérennisation débouche sur une nouvelle vision du SI : « Data first » et une nouvelle compétence : l’architecte de données.

L’organisation se donne les moyens demaîtriser ses données.

Les utilisateurs créent l’information

Les applications l’exploitent

Le document numérique : caractéristiques et enjeux

L’OAIS : un cadre normatif

Du signe à la connaissance : quelques définitions

En guise de conclusion

Moyens pour assurer la maîtrise de son information

En guise de conclusion…

Données

constituent la richesse des organisations

En guise de conclusion…

Données

constituent la richesse des organisations

Mais, ils n’existentpas de politique globalede gestion des données du système d’information

http://www.flickr.com/photos/library_of_congress/2178285893/

En guise de conclusion…

Données

constituent la richesse des organisations

Mais, ils n’existentpas de politique globalede gestion des données du système d’information

et les donnéessont l’objet

d’obsolescences diverses http://www.flickr.com/photos/library_of_congress/2178285893/

En guise de conclusion…

Données

constituent la richesse des organisations

Mais, ils n’existentpas de politique globalede gestion des données du système d’information

et les donnéessont l’objet

d’obsolescences diverses

Pour en assurer l’accès et l’utilisabilité sur le long terme

Il faut les maîtriser

http://www.flickr.com/photos/library_of_congress/2178285893/

En guise de conclusion…

Moyensorganisationnels

Contratde service

Moyenstechniques

Systèmede gestion

Moyensréglementaires

NormesStandards

Moyenshumains

Organisationpluri-disciplinaire

Moyensstratégiques

Gestiondes risques

Données

constituent la richesse des organisations

Mais, ils n’existentpas de politique globalede gestion des données du système d’information

et les donnéessont l’objet

d’obsolescences diverses

Pour en assurer l’accès et l’utilisabilité sur le long terme

Il faut les maîtriser

Pour lesil faut déployer

maîtriser,une architecture de moyens

Moyensinformationnels

MétadonnéesRéférentiels

http://www.flickr.com/photos/library_of_congress/2178285893/