21
Julie Chabalier Post-doctorante Laboratoire d’Informatique Médicale Université Rennes 1

Julie Chabalier Post-doctorante Laboratoire d’Informatique Médicale Université Rennes 1

Embed Size (px)

DESCRIPTION

Julie Chabalier Post-doctorante Laboratoire d’Informatique Médicale Université Rennes 1. Parcours. Marseille. Maîtrise de Biologie Cellulaire (1999) DESS Compétences Complémentaires en Informatique (2000) Doctorat en Informatique (2004) Soutenu le 6 avril 2004 – mention très honorable - PowerPoint PPT Presentation

Citation preview

Julie Chabalier Post-doctorante Laboratoire d’Informatique Médicale Université Rennes 1

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Rennes

Marseille

Parcours

Maîtrise de Biologie Cellulaire (1999)

DESS Compétences Complémentaires en Informatique (2000)

Doctorat en Informatique (2004) Soutenu le 6 avril 2004 – mention très honorable « Acquisition incrémentale et représentation des systèmes

intégrés bactériens par une approche orientée objet »

1/2 ATER (2004 - 2005)

Qualifications sections 64, 65, 27 (2005)

Post-doctorante Université de Rennes 1 (2005 – 2008)

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Enseignements (278h eq. TD)

Initiation à la bioinformatique (licence) Grandes banques/bases de données Concepts majeurs de la bioinformatique

Représentation des connaissances biomédicales (master2) Ontologies biologiques et médicales Web Sémantique

Conception, implémentation, interrogation de bases de données (master)

Modélisation MERISE- UML Langage SQL – MySQL

Initiation à l’informatique (licence) Bureautique - Algorithmique

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

BesoinsStructuration et description, non ambigüe, des connaissances disponibles dans un domaine

Partage des connaissances

Exploitation automatique de ces connaissances pour interpréter les données

Thématique de recherche

Contexte Projets de séquençage / nouvelles technologies à haut debit (transcriptome) Explosion de la quantité de données biologiques Interprétation des données : apporter du sens à ces données (les annoter)

une tâche très difficile Terminologies différentes en fonction du domaine

même mot : significations différentes d'un domaine à un autre Rôle croissant des bases de données en biologie

Difficile d’avoir une vision globale des informations disponibles

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Les ontologies Définition des concepts d’un domaine et des relations entre ces concepts (conceptualisation)

Représentation dans un langage informatique rendant les connaissances compréhensibles par un ordinateur (formalisation)

Exemples

Génomique : Gene Ontology Annotation des produits de gènes

Médecine : SNOMED CT Description des maladies

Thématique de recherche

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

molecularfonction

binding

transcriptionregulator activity

transcription factor activity

DNA binding

nucleic acid binding

cellular component

organelle

Intracellular organelle

nucleus

intracellular membrane- bound organelle

membrane- bound organelle

intracellular

cell

part_of

is_a

biological process

developmental process

multicellular organismal development

nervous system development

system development

anatomical structure development

Transcription factor AP-2 beta (AP2B)

Produit de gène Annotation des produits de gènes

Gene Ontology

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Utilisation de Gene Ontology pour interpréter les résultats de puces à ADN

Puparial adhesionMolting cyclehemocyanin

Defense responseImmune responseResponse to stimulus

Toll regulated genesJAK-STAT regulated genes

Immune responseToll regulated genes

Amino acid catabolismLipid metobolism

Peptidase activityProtein catabloismImmune response

Selected Gene Tree: pearson lw n3d ...Branch color classification:Set_LW_n3d_5p_...

Colored by: Copy of Copy of C5_RMA (Defa...Gene List: all genes (14010)

infectée controle

temps

Selected Gene Tree: pearson lw n3d ...Branch color classification:Set_LW_n3d_5p_...

Colored by: Copy of Copy of C5_RMA (Defa...Gene List: all genes (14010)

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

organic mental disorder

Alzheimer's disease

dementia

disorder of brain

SNOMED CT Systematized Nomenclature of Medicine -- Clinical Terms

Echanger des informations cliniques entre les différents professionnels de la santé (médecin, pharmacien, chercheur…)

cerebral degeneration

Degenerative brain disorder

Description des maladies suivant des critères cliniques (étiologie, localisation, morphologie…)

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Trois axes complémentaires :

1. Représentation des connaissances biologiques

2. Interprétation des données d’expression

3. Intégration des connaissances biologiques et médicales

Travaux de recherche

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Projet « ISYMOD » (thèse octobre 2000 – avril 2004)

Représentation des systèmes intégrés biologiques

1. Représentation des connaissances biologiques

Un système intégré est un ensemble de protéines nécessaires à la réalisation d’une fonction biologique

SystemeIntegretypenbPartenaires

est_composé

TransporteurABC

OPUBA

Proteine

• Entités biologiques : classes/sous-classes

• Relations entre entités : associations/sous-associations

• Propriétés : variables de classes/d’associations

Systeme2composants

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

36 Classes – 21 associations100 génomes procaryotes 13641 partenaires protéiques5328 transporteurs ABCChabalier et al., 2005

Bioinformatics

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Projet « Analyse transversale » (postdoc 2004 – 2006)

Interprétation des données d’expression par l’exploitation des concepts de Gene Ontology

2. Interprétation des données d’expression

Analyse classique : associer un ou plusieurs termes à un cluster d’expression

Analyse transversale : regrouper les gènes en fonction de leur annotation et associer l’expression à chaque gène au sein des groupes

Limitation : au sein d’un même processus biologique, les gènes peuvent s’exprimer différentiellement (ex : régulation)

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

gène 1gène 2gène 3gène 4gène 5gène 6gène 7gène 8…

gène n

biological process

process D

process E

process C

process B

process G

process F

gène 1 gène 5

Comparaison des annotations (modèle espace vectoriel)

gène 1 (process B, process E, …)gène 5 (process E, process F, …)

gène 1 gène 20<sim<1

gène 1 gène 20<sim<1

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Activation d’une voie de biosynthèse du précurseur de la créatine

Répression de la biosynthèse de polyamine

Rôle potentiel de détoxification de l’entérocyte

Chabalier et al., 2007 BMC Bioinformatic

Application de l’analyse transversale

Analyse des gènes impliqués dans la differentiation enterocytaire

Métabolisme des amines

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Projet « Biomed » (postdoc 2006 – 2008)

3. Intégration des connaissances biomédicales

Description des maladies dans les ontologies médicales Caractéristiques cliniques (Etiologie, Localisation,

Morphologie…)

Exemple : SNOMED CT Besoin des connaissances biologiques

Gènes La mutation d’un gène peut conduire à une maladie

Voies métaboliques / Processus biologiques différents processus pourraient expliquer les différents grades d’une maladie

Intégrer des ontologies de maladies et de processus biologiques

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Ontologie des maladies

Gene OntologyProcessusbiologiques

Kegg OrthologyVoies métaboliques

Maladies

SNOMED CT Maladies

Méthodologie générale d’intégration

Chabalier et al., 2007 Stud Health Technol Inform.

Méthode de mise en correspondance des termes

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Cancers

Aspect invasif

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Projet enseignements

DUT Génie Biologique Informatique (cours – TD – TP)

Bureautique (Office/Open office : word, excel, access) Programmation (Perl, PHP, Java…) Bases de données (Oracle-SQL, mySQL)

Biologie (cours – TD)

Licence Pro Biologie Analytique et Expérimentale Bioinformatique (cours – TD – TP)

Base de données biologiques Méthodes bioinformatiques d’analyse des données Nouvelles technologies dans le domaine biomédical

Ontologies biomédicales

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Projet recherche – UMR 1231

Comparaison fonctionnelle des génomes des insectes

Contexte Étude comparative des génomes des lépidoptères

Spodoptera – Helicoverpa - Bombyx mori Impact du centromère sur l’expression des gènes proches

Méthodologie Etude du génome et génomique comparative (synténie) Etude du transcriptome

Besoin Interprétation des données

Structuration et description des connaissances disponibles chez les insectes (processus biologiques) Exploitation automatique de ces connaissances pour interpréter les données

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Méthode

Utilisation de Gene Ontology - Drosophile (Adams et al. Science. 2000 Mar 24;287(5461):2185-95)

Enrichissement de cette ontologie pour l’ensemble des insectes

Extraction et intégration des connaissances de différentes sources trans-espèces :

KEGG (voies métaboliques : drosophile, bombyx, moustique…) Reactome (processus biologiques et réactions : drosophile) Base de données spécialisées

Exploitation de l’ontologie des insectes

Analyse données d’expression : analyse transversale Comparaison trans-espèces

Intégration future de données écologiques ou comportementales

Représentation des processus biologiques chez les insectes

Etude comparée des différentes espèces

Approche proposée

Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008

Résultats attendus

Description non ambigüe du domaine

Réponses aux questions :

Quels sont les processus biologiques communs à toutes les espèces d’insectes ?

Quels sont les processus biologiques spécifiques à une espèce ?

(ex : puceron parthénogénèse)

Quels sont les réactions spécifiques aux génomes holocentriques ?

Annotation des nouveaux génomes, relations entre les gènes d’insectes sans fonction connue mais présentant des domaines fonctionnels

Prédiction de nouveaux processus biologiques par comparaison trans-espèce (relation avec la biologie de catégories d’insectes : vecteurs de virus, ravageurs, hématophages)