22
1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

Embed Size (px)

Citation preview

Page 1: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

1

Genopole Ile de France

Montagne Sainte Geneviève-

Plate forme Transcriptome

ENS. Claude Jacq

Institut Curie. Philippe La Rosa

Page 2: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

2

La bioinformatique connectée à la plate-forme puces à ADN

de l’École Normale Supérieure

La bioinformatique connectée à la plate-forme puces à ADN

de l’École Normale Supérieure

Bioinformatique des Génopoles, Lyon 22 oct 03

Claude JACQ: [email protected], http://www.biologie.ens.fr/lgmgml/

Page 3: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

3

1. Apports des outils informatiques à l’analyse des

données d’expression des génomes

Page 4: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

4

Fouille de données

Analyse des données

• Puces commerciales• Puces “maison”

Hybridation des puces

Étapes expérimentales

Analyse de l’image

Traitement des données

Mise au point expérimentale AvailableDatabase

Traitement des données brutes- Normalisation- Analyse statistique- Stockage

Représentationinformative des données

- Regroupement

Les différentes étapes d’une expérience de puces à ADNoù la bioinformatique est impliquée

Les différentes étapes d’une expérience de puces à ADNoù la bioinformatique est impliquée

Page 5: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

5

Mise au point des puces à ADNMise au point des puces à ADN

• Sélection d’oligonucléotides spécifiques (ESPCI)

SOL sélectionne des oligonucléotides spécifiques pour chaque séquence soumise. Les utilisateurs peuvent choisir pour les oligonucléotides des paramètres pour définir la taille, le rapport en GC et les conditions expérimentales comme la température d’hybridation, le pourcentage de formamide ou la concentration en sels.

http://www.bionet.espci.fr/soft.html

Hybridation T°Hybridation T°Formamide %Formamide %Salt concentrationSalt concentration

Hybridation T°Hybridation T°Salt concentrationSalt concentration

Melted-Blast

Oligonucléotides Spécifiques

MfoldMelting

DB OLIGOS

RefSeq

> RAT> SOURIS> HUMAIN> …

DB ARNm

> GLUR4tgcggatttgagattattaaaagggggc> VIPatggggccgatatatgtaccttagggttaat

[email protected]@espci.fr

Page 6: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

6

Recherche de données significatives: VaranRecherche de données significatives: Varan

http://www.bionet.espci.fr/varan/varan_info.htm

Varan utilise une approche statistique qui définit le domaine expérimental de variabilité et donne une analyse statistique de l’expression différentielle dépendante du niveau d’expression des gènes. Plusieurs méthodes de normalisation peuvent être utilisées.

• Varan pour l’analyse de la variabilité des expériences de puces à ADN (ESPCI)

l og 2(

I Cy 5

/ IC

y 3)

(log10(ICy3) + log10(ICy3))/2

Rinf0.99 Rsup0.99

log2 (ICy5/ICy3)-2 +2

N(,)

[email protected]@espci.fr

Page 7: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

7

• Arrayplot permet la normalisation rapide des données des puces (ENS)

Expression non significative

Cy3/Cy5 ratio > 0.5 et < 2

Gènes induits

Gènes réprimés

Intensités Cy3

Inte

nsit

és C

y5La normalisation des données: ArrayPlotLa normalisation des données: ArrayPlot

Marc P, Jacq C. Arrayplot for visualization and normalization of cDNA microarray data. (2002) Bioinformatics 18(6):888-9

- Arrayplot offre une interface utilisateur facilitant la visualisation de la distribution des données et des gènes dont la variation est la plus significative.

- Arrayplot permet de calculer le facteur de normalisation basé sur la moyenne des intensités.

http://www.biologie.ens.fr/fr/genetiqu/puces/publications/arrayplot/index.html

[email protected]

Page 8: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

8

Donnéesbrutes

Donnéesbrutes

Normalisation

Donnéesnormalisées

Base de Donnéeset Serveur WebLecture obtenue avec le scanner

Images

Analyse d’images

Base de donnéespour la publication

Donnéespubliées

Base de donnéespubliques

Internet

Intranet

Gestion des données obtenues avec les puces à ADNGestion des données obtenues avec les puces à ADN

Donnéesnormalisées

Interface Web

PostgreSQL & PHP

Levure / Souris

Toutes les étapes impliquées dans les expériences de puces à ADN sont stockées dans une base de données et accessibles pour tous les utilisateurs via une interface web graphique indépendante de la plate-forme logicielle utilisée pour interroger la base de données.

Page 9: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

9

Un élément central: le LIMSLaboratory Information Management System

Un élément central: le LIMSLaboratory Information Management System

• La base de données LIMS est modulaire

• Base de données locale pour le suivi des expériences (ENS)

- Lames de verre

- Puces à oligonucléotides

- Toutes les étapes du protocole expérimental sont stockées dans la base de données.

- Le LIMS permet le suivi des lames et des contrôles de qualité.

- Toutes les informations stockées sont en accord avec le standard MIAME.

- La structure flexible du LIMS permet l’analyse de différents types de lames.

- Un ensemble de tables de correspondance est disponible pour aider à la détermination du nom des gènes (levure, souris).

[email protected]@biologie.ens.fr

Page 10: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

10

Base de données locale: Accès rapide aux données organiséesBase de données locale: Accès rapide aux données organisées

Sélection des cibles en fonction de critères significatifs

Visualisation de plusieurs expériences à la fois

Affichage des rations Cy3/Cy5

Suivi du profil d’expression

[email protected]

Page 11: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

11

Outils de comparaison en ligne: MiCoVitoOutils de comparaison en ligne: MiCoVito

• MiCoViTo: Microarray Comparison Visualization Tools (ENS)

Comparaison des voisinages entre deux expériences pour un gène sélectionné (graine).

Les diagrammes en camembert affiche le voisinage entier en fonction de critères spécifiques (catégories fonctionnelles, phénotypes, complexes protéiques, …).

[email protected]@biologie.ens.fr

Page 12: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

12

yeast Microarray Global Viewer (yMGV)yeast Microarray Global Viewer (yMGV)

1 profil par publication 1 histogramme par condition (expérience)

Sélection :

• nom de gène• expression

• publications

• Permettre l’accès simple aux données d’expression publiées (ENS):

http://www.transcriptome.ens.fr/ymgv/

S. Le Crom et al. yMGV: helping biologists with yeast microarray data mining. (2002) Nucleic Acids Research 30(1): 76-79

P. Marc et al. yMGV: a database for visualisation and data mining of published genome-wide yeast expression data. (2001) Nucleic Acids Research 29(13): E63-3

Affichage des ratios le long des

chromosomes

Page 13: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

13

2. Apports des outils biochimiques à l’analyse informatique des données d’expression des génomes

Page 14: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

14

• Distribution des intensités pour le Cy3 et le Cy5

• Distribution du log2 (ratios)

1. QUALITE DES DONNEES

Page 15: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

15

Unique puce à ADNUnique puce à ADN

TempsTemps

Série de puces à Série de puces à ADN ADN

g2g3

g1

g5

g4

log2(Ratio)log2(Ratio)

TempsTemps

Vue statique du transcriptome:

Etats d’expression des gènes par rapport à un état de référence:

Addition d’un drogue, identité d’une tumeur, etc…

Vue dynamique du transcriptome

Page 16: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

16

Les cibles directes de chaque facteur de transcription: une vue statique des propriétés du génome

Page 17: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

17

MICROARRAYSANALYSES

3’’

180’

10’5’

45’

30’

RNA extraction, labelled cDNA synthesis

QuickTime™ et undécompresseur TIFF (non compressé)sont requis pour visionner cette image.

Dynamic response of genome expression to the external presence of drugs: exemple of fungicides

Benomyl (benzimidazole carbamate)

Page 18: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

18

Expérience Expérience de pucede puce

Profiles d’expression des gènesProfiles d’expression des gènes

g2g3

g1

g5

g4

log2(Ratio)log2(Ratio)

X

Y

Zg2

g3

g1

g5

g4

Espace à 3 dimensionsEspace à 3 dimensions

Cluster analysis of time-course expression data (6000 genes)

Page 19: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

19

1

23

45

Network cascade of genes activated by benomyl

1= TF1, 2= TF2, 3= TF3, 4= TF4, 5= ?

Page 20: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

20acement des pointsacement des points

Groupes d’expression et groupes d’orthologie

Gaelle Lelandais

Page 21: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

21

Quelques pistes …

. Description de réseaux de gènes à haute flexibilité

. Groupes de gènes orthologues co-régulés

. Génomique comparative et signaux de régulation

Page 22: 1 Genopole Ile de France Montagne Sainte Geneviève- Plate forme Transcriptome ENS. Claude Jacq Institut Curie. Philippe La Rosa

22 www.transcriptome.ens.fr/sgdb/

Microarrays production Corinne BlugeonVéronique Tanty

BioinformaticStephane Le Crom

Philippe MarcGaelle LelandaisPierre Vincens

Stéphane VialetteSophie Lemoine