11
TC46/CN 357 - GE10 NP25964 - Thésaurus Point d’avancement des travaux portant sur le projet de norme NP 25964 Présenté par Sylvie Dalbin - [email protected] Document validé par le GE10 Support présenté à la réunion Afnor du TC46/CN357 du 07 Novembre 2008

NP 25964, Future norme sur les thésaurus

  • Upload
    dalb

  • View
    1.946

  • Download
    1

Embed Size (px)

DESCRIPTION

Point d'avancement au 7 novembre 2008 des travaux portant sur la future norme Thésaurus NP 2595, remplaçant les normes ISO 2788:1986 (monolingue) et 5964:1985 (multilingue). Projet de norme paru en novembre 2009 - http://www.slideshare.net/Dalb/presentation-du-projet-de-norme-iso-dis-259641-sur-les-thsaurus

Citation preview

Page 1: NP 25964, Future norme sur les thésaurus

TC46/CN 357 - GE10NP25964 - Thésaurus

Point d’avancement des travaux portant sur le projet de norme NP 25964

Présenté par Sylvie Dalbin - [email protected] validé par le GE10

Support présenté à la réunion Afnor du TC46/CN357 du 07 Novembre 2008

Page 2: NP 25964, Future norme sur les thésaurus

CONTEXTE

Page 3: NP 25964, Future norme sur les thésaurus

TC46/CN357/GE10 - Réunion du 07 Nov.2008 Support de réunion - Présentation par Sylvie Dalbin - p.3/11

Documents normatifs actuels sur les thésaurus

• ISO 2788:1986 (monolingue) ; ISO 5964:1985 (multilingue)– Principes directeurs pour l’établissement et du développement de

thésaurus monolingues (2788) / multilingues (5964)

• NF Z47-100:1981 (monolingue) ; NF Z47-101:1990 (multilingue)– Règles d’établissement des thésaurus monolingues / Principes directeurs

pour l’établissement des thésaurus multilinguesCes normes sont vraiment datées !

• ANSI/NISO Z39.19:2005– Guidelines for the Construction, Format, and Management of Monolingual

Controlled Vocabularies

• BS 8723, Structured vocabularies for information retrieval– Norme en 5 parties produites entre 2004 à 2008

• IFLA - Guidelines for multilingual thesauri, 2005 et 2008• SKOS Simple Knowledge Organization Systems Reference, W3C, 2008

Page 4: NP 25964, Future norme sur les thésaurus

PRODUCTION DU GE10 DU TC46/CN357

Entre Janvier et Novembre 2008

Page 5: NP 25964, Future norme sur les thésaurus

TC46/CN357/GE10 - Réunion du 07 Nov.2008 Support de réunion - Présentation par Sylvie Dalbin - p.5/11

Le projet de norme : ISO 25964

• Basée sur la norme anglaise BS 8723• WG8 (Working Groupe) ISO à Stockholm en Mai 2008 :

Redécoupage éditorial en 2 parties et nouveau titre

• ISO 25964

Thésaurus et interopérabilité avec d’autres vocabulaires Thesauri and interoperability with other vocabularies

Partie 1: Thésaurus pour la recherche d’information• Couvre les thésaurus mono- et multilingues

Partie 2: Interoperabilité avec d’autres vocabulaires• Couvre la mise en correspondance avec d’autres vocabulaires :

classifications (encyclopédique et d’affaires), taxonomies, vedettes-matières, ontologies, listes d’autorité et terminologies.

Page 6: NP 25964, Future norme sur les thésaurus

TC46/CN357/GE10 - Réunion du 07 Nov.2008 Support de réunion - Présentation par Sylvie Dalbin - p.6/11

Organisation du travail - ISO-WG8 et NF-GE10

• Excellent travail de groupe national et international !

– ISO WG8 - piloté par Stella Dextre Clarke (UK)– CA: Michèle Hudon (Multilingual sub-group), Sophie Lessard - DN: Marianne Lykke Nielsen

- FR: Sylvie Dalbin - DE: Traugott Koch Daniel Kless (DK) - UK: Stella Dextre Clarke ; Leonard Will (Data Modelling sub-group); Alan Gilchrist - US: Marcia Zeng ; SP: Francisco Javier García - Anna Martin (NISO)

– Auditeur hors WG : ZH: Zhu Lijun - New Zélande:? ; Nic Cochard– Réunions téléphoniques mensuelles + Echanges nombreux et denses par courriels et

commentaires traitement de texte

– NF GE10 - piloté par Sylvie Dalbin– Initié à partir du Groupe ADBS - depuis 2003

Actualité des langages documentaires - Vol. 44, N° 1, février 2007http://www.adbs.fr/revue-docsi-volume-44-n-1-fevrier-2007-15735.htm?RH=1202382041875

– Bosc Sonia; Chichereau Dominique ; Contat Odile ; Dalbin Sylvie; Dégez Danièle; Deniau Alina ; Dhérent Catherine ; Feyler Francois ; Guillotin Thierry ; Lénart Michèle; Ménillet Dominique ; Mingam Michel ; Hélène Rabault ; Bernard Vatant ; Triboulin Virginie; Zysman Hélène

– Réunions sur Paris : 17/12/2007; 04/2008 ; 11/04/2008; 30/06/2008; 15/09/2008. Prochaine réunion : 12/11/2008

Page 7: NP 25964, Future norme sur les thésaurus

TC46/CN357/GE10 - Réunion du 07 Nov.2008 Support de réunion - Présentation par Sylvie Dalbin - p.7/11

Partie 1: Thésaurus pour la recherche d’information

un Guide de bonnes pratiques• Comment organiser un projet « thésaurus »• Comment sélectionner les concepts et les organiser

– Désambiguïsation conceptuelle– Enrichissement et personnalisation des relations– S’inscrire dans un contexte multilingue : pas de norme distincte pour le

multilinguisme - prise en compte de systèmes d’écriture

• Comment représenter les concepts par des termes – Désambiguïsation lexicale

• Fonctionnalités des logiciels de gestion de thésaurus• Modèle de données

– Classes, attributs, relations et un schéma UML - Format d’échange XML

• Nombreux exemples– concepts, termes, formats de présentation, mono/multilingue

Page 8: NP 25964, Future norme sur les thésaurus

TC46/CN357/GE10 - Réunion du 07 Nov.2008 Support de réunion - Présentation par Sylvie Dalbin - p.8/11

Equilibres à trouver• Un outil sémantique de recherche / Un outil terminologique

– Une partie exclusivement dédiée aux concepts et aux relations entre concepts, indépendamment des termes

– Un (essai de) rééquilibrage du poids de tout type de termes utiles à la recherche par rapport à la logique du « terme préféré » pour l’indexation

– Se détacher des spécificités des langues française et surtout anglaise, support de développement des normes initiales

– Se positionner de normes similaires existantes : SKOS et TMF

• Usages humains / Usages informatiques– “ISO 25964 makes the transition needed for the world of electronic information

management”– Tout au long du document, formulation attentive à l’Ancien et au Nouveau; ne pas

bloquer les situations existantes

• Un Guide métier / Un modèle applicatif formel – Décalage entre certaines règles énoncées (travailler selon le principe de l’égalité de

la représentation des langues) et un modèle formel ne pouvant suivre toutes ces règles (le modèle repose sur une structure unique du thésaurus)

• Intégrer mieux d’autres normes– RFC 4646, Tags for identifying languages – Normes terminologiques : rapprochement initié - Contact : Laurent Romary TC37

Page 9: NP 25964, Future norme sur les thésaurus

Etapes du projet

Processus de normalisation

prévu entre 2008 et 2010

Page 10: NP 25964, Future norme sur les thésaurus

TC46/CN357/GE10 - Réunion du 07 Nov.2008 Support de réunion - Présentation par Sylvie Dalbin - p.10/11

Le projet aujourd’hui ?• Etape 20.00 / 20.20 du processus de normalisation ISO

http://www.iso.org/iso/fr/standards_development/processes_and_procedures/stages_description/stages_table.htm

• Production– Un important travail effectué sur 10 mois

– Une participation bien sûr inégale, mais constante, diversifiée et riche

– Un pilotage anglais « experts » et  « secrétaire technique » de très grande qualité

– Très réactif sur leur propre document initial– Sollicitant les correspondants pays, y compris de façon individuelle – À la recherche d’un consensus permanent

– Une plateforme technique NISO efficiente

Un WD attendu fin novembre pour la Partie 1 de la norme

Page 11: NP 25964, Future norme sur les thésaurus

TC46/CN357/GE10 - Réunion du 07 Nov.2008 Support de réunion - Présentation par Sylvie Dalbin - p.11/11

Quelles sont les étapes suivantes ?

• Part 1 - Thésaurus

Initier la période de commentaires - Décembre 2008 • Diffusion en France à prévoir (praticiens, formateurs)• 3 collègues Belges et un collègue Suisse déjà sollicités • Les participantes Canadiennes au projet s’occupent du Canada• Nécessité d’approcher de façon active les éditeurs de logiciels

(nouveau modèle de données normalisé)

• Part 2 - Interopérabilité avec d’autres vocabulaires Initier ce deuxième chantier - Janvier 2009 (?)

• Production prévue sur 2009• Organisation à définir fin 2008 avec ISO-WG8 et Afnor-GE10• Poursuite avec le même GE10

- composition à étendre en fonction des besoins formulés par le GE10