Upload
sebastien
View
12
Download
0
Embed Size (px)
DESCRIPTION
Présentation de l'UV IC05 de Franck Ghitalla à l'UTC (grande école d'ingénieur, Compiègne) : le Web en tant que objet d'étude scientifique.
Citation preview
IC 05 / semestre printemps 2008
Le Web, objet de science?
Département TSH / équipe de recherche COSTECHPrésident de l’association loi-1901 WebAtlas
IC 05 / semestre printemps 2008
Objectifs de l’U.V.
1/ Interroger les propriétés de cet « espace technique » qu’est le web
1-a) Nature des propriétés1-b) Types de propriétés1-c) Dimension expérimentale des propriétés
2/ Etre capable de représenter/cartographier ces propriétés
3/ concevoir/développer des outils, des méthodes, des stratégies de représentation et/ou d’intervention des territoires numériques
3-a) cartographie et « design idéologique » 3-b) observer/veiller ou transformer? 3-c) valoriser, diffuser, agréger
2-a) la théorie des graphes2-b) Isoler des patterns 2-c) construire des « cartes »
IC 05 / semestre printemps 2008
Objectifs de l’U.V.
1/ Interroger les propriétés de cet « espace technique » qu’est le web
1-a) Nature des propriétés1-b) Types de propriétés1-c) Dimension expérimentale des propriétés
Le réseau ARPA en 1969 La première page web (Tim Berners Lee)
Mapping des quelques 6 millions de router-Internet en 2001
IC 05 / semestre printemps 2008
1-a) Nature des propriétés
Objectifs de l’U.V.
Statistiques? Chiffres, tendances, mesures…
Techniques? Description de l’infrastructure, circulation des flux, distribution des routers et des serveurs…
Informationnelles? Analyse et indexation des fichiers, des documents…
Industrielles, économiques? Rôle des technologies propriétaires, logiciels libres, normes technologiques, langage de programmation….
Sociales? Le système comme mémoire des traces d’usage, usagers et communautés…
Crawler de fichiers Torrent avec génération dynamique de graphes
IC 05 / semestre printemps 2008
1-b) Types de propriétés
Objectifs de l’U.V.
Doit-on faire appel aux mathématiques? Aux computer sciences? À la sociologie? Aux marketing? A l’ingénierie des réseaux et de leurs modèles formels? À la biologie, la physique, l’épidémiologie? Au design ou l’architecture? A l’histoire des systèmes techniques?
Albert-László Barabási
University of Notre Dame
Department of Physics
Soumen ChakrabartiAssociate Professor
Computer Science and Engineering
Indian Institute of Technology Bombay
Mark GranovetterJoan Butler Ford
Professor in the School of Humanities and
Sciences.
DUNCAN J. WATTSProfessor
Department of Sociology
IC 05 / semestre printemps 2008
1-c) Dimension expérimentale des propriétés
Objectifs de l’U.V.
Dispositifs de mesures (capteurs), d’indexation des données, de traitement des données, de calcul des patterns statistiques, de visualisation des propriétés
méthodes de traitement des données, de corrélation entre types de données (ex.contenu des documents web / distribution des liens ou connectivité), de design des instruments technologiques dédiés à l’exploration du système
Projet R.T.G.I. et le dispositif TARENTe en 2003.
TARENTe était un Système d’Information Web dédié à l’exploration des petits corpus de documents web (pages/sites). Il comprenait un crawler, des modules de recherche et d’indexation de mots-clef et une interface dynamique de visualisation de graphes.
IC 05 / semestre printemps 2008
Objectifs de l’U.V.
2/ Etre capable de représenter/cartographier ces propriétés
2-a) la théorie des graphes2-b) Isoler des patterns 2-c) construire des « cartes »
IC 05 / semestre printemps 2008
2-a) la théorie des graphes
Objectifs de l’U.V.
Théorie des graphesOutils et méthodes statistiques pour réduire les phénomènes complexes (médecine, chimie, ingénierie industrielle, sociologie des organisations, épidémiologie, physique…)
Visualisation de graphesProjection de données (nœuds) sur un plan et de leurs liens réciproques (arcs).
Familles de graphesRéguliers, power-law, random, scale-free…
Types de graphes (sociaux, hypertextes, sémantiques…)Web mining / ex.connectivité hypertexte nœuds = pages/sitesarcs = liens hypertextes
IC 05 / semestre printemps 2008
2-b) isoler des patterns
Objectifs de l’U.V.
Propriétés statistiqueset visuelles
Question de la forme des objetsd’investigation
Agrégats de documents web
Densité, diamètreCœur et périphérieConnectivité entrante et sortante
Hiérarchisation, clusterisation
Spatialisation et géographieCouronne, filament, chemins, couches
IC 05 / semestre printemps 2008
2-c) construire des cartes
Objectifs de l’U.V.
Le référendum sur le Traité sur la Constitution Européenne, mai 2005.
Indexation de 2,5 millions de pages web francophones sur le sujet
Repérage des sites les plus connectés de l’agrégat (Hubs et Authorities)
Analyse du contenu (pour/contre/neutre)
Projection visuelle sur un graphe des sites
Schéma explicatif
IC 05 / semestre printemps 2008
3/ concevoir/développer des outils, des méthodes, des stratégies de représentation et/ou d’intervention des territoires numériques
3-a) cartographie et « design idéologique »3-b) observer/veiller ou transformer?3-c) valoriser, diffuser, agréger
Sébastien Heymann, septembre 2007
IC 05 / semestre printemps 2008
3-a) cartographie et « design idéologique »
Objectifs de l’U.V.
Etude CSTI – Mathieu Jacomy – cité des Sciences et de l’Industrie - 2005
Modèle d’organisation des ressources web consacrées à la « grippe aviaire » - 2005
Modèle cartographique pour la « Blogopole » politique française – Guilhem fouetillou, RTGI-SAS, 2006.
Rendre compte à des usagers
d’un univers construit par les usagers
IC 05 / semestre printemps 2008
3-b) observer/veiller ou transformer?
Objectifs de l’U.V.
La « Segoland » sur le web français en avril 2007.
Cartographie géo-référencée des blogs militants pour S. Royal au moment de la campagne présidentielle.
IC 05 / semestre printemps 2008
3-c) valoriser, diffuser, agréger
Objectifs de l’U.V.
radicaux libresprincipes actifscosmetiques naturelsproduits cosmetiquesproduits de soinspeaux sechesproduits de beauteproduits de soinsoins du visageproduits naturelsanti-ridessoin du visagehuiles vegetalescomplements alimentairesanti-ageinstitut de beautesoins du corpstype de peausoins beautecosmetiques bio
Le Cluster « COSMETIQUES » / Etude Exalead-Ministère de la Recherche-WebAtlas, novembre 2007.
Valoriser l’étude et les résultats pour des politiques stratégiques ou marketing?Diffuser les résultats, les soumettre à la communauté scientifique pour évaluation et dissémination?Agréger une ou des communautés d’utilisateurs pour modifier le paysage conceptuel associé aux cosmétiques?
IC 05 / semestre printemps 2008
Cadres conceptuelsA.-L. BARABASI linked - the new science of networks, new ed. 2005.S. JONHSON -emergence: the connected lives of ants, brains, cities, and software, 2002.
Théorie des graphesD. WATTS six degrees - the science of a connected age, 2004.S. STROGATZ - sync: the emerging science of spontaneous order, 2004.M. NEWMAN - the structure and dynamics of networks, 2003.
Web-MiningS. CHAKRABARTI mining the web, 2002.J. KLEINBERG - algorithm design, 2006.
InfoVizB. SHNEIDERMAN - readings in information visualization: using vision to think, 1999.
Ouvrages de référence en Network Sciences
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008
IC 05 / semestre printemps 2008