11
Presentation 2 Amélie/Greg Juillet 2007

Presentation 2 Amélie/Greg Juillet 2007. Les 3 objectifs du projet 1.Comparaison de 3 sources d’annotations génomiques. 2.Comparaison de données d’expression

Embed Size (px)

Citation preview

Page 1: Presentation 2 Amélie/Greg Juillet 2007. Les 3 objectifs du projet 1.Comparaison de 3 sources d’annotations génomiques. 2.Comparaison de données d’expression

Presentation 2 Amélie/Greg

Juillet 2007

Page 2: Presentation 2 Amélie/Greg Juillet 2007. Les 3 objectifs du projet 1.Comparaison de 3 sources d’annotations génomiques. 2.Comparaison de données d’expression

Les 3 objectifs du projet

1. Comparaison de 3 sources d’annotations génomiques.

2. Comparaison de données d’expression de micro-array (humain versus humain)

3. Comparaison de données d’expression de micro-array ( humain versus rat)

Page 3: Presentation 2 Amélie/Greg Juillet 2007. Les 3 objectifs du projet 1.Comparaison de 3 sources d’annotations génomiques. 2.Comparaison de données d’expression

Pipeline

ANNOTATION

AFFY

BIOC

RESN

ANALYSE EXPERIENCE MICROARRAY

CUFI/NULI ZABNER WRIGHT

NULI DMNQ AT2 TNF

NORKINA KAUR

Page 4: Presentation 2 Amélie/Greg Juillet 2007. Les 3 objectifs du projet 1.Comparaison de 3 sources d’annotations génomiques. 2.Comparaison de données d’expression

Comparaison de données d’expression de micro-array

(humain versus humain)

• Problématique: CFTR -/- chez l’humain

• 2 expériences: Cufi/Nuli (Berthiaume) et CF/nonCF (Zabner).

UP REGULE

pVal bVal logFC rows

<= 0.01 - >=0 104

<= 0.01 - >=1 0

<= 0.01 >0 >=0 3

<= 0.01 >0 >=1 0

<= 0.05 - >=0 515

<= 0.05 - >=1 0

<= 0.05 >0 >=0 3

<= 0.05 >0 >=1 0

DOWN REGULE

pVal bVal logFC  

<= 0.01 - <=-1 9

<= 0.01 - <=0 446

<= 0.01 >0 <=-1 4

<= 0.01 >0 <=0 50

<= 0.05 - <=-1 10

<= 0.05 - <=0 1036

<= 0.05 >0 <=-1 4

<= 0.05 >0 <=0 50

Page 5: Presentation 2 Amélie/Greg Juillet 2007. Les 3 objectifs du projet 1.Comparaison de 3 sources d’annotations génomiques. 2.Comparaison de données d’expression

Quelques résultats de comparaisons

idProbeSet geneSymbol gene,name pV_cufi bV_cufi ratio pV_Zabner bV_Zabner ratio 201535_at UBL3 ubiquitin-like 3 3,60E-06 5,05 0,44 3,79E-04 0,14 0,49 203408_s_at SATB1 special AT-rich sequence binding protein 1 (binds to nuclear 2,40E-04 0,79 0,38 3,61E-04 0,18 0,44 205044_at GABRP gamma-aminobutyric acid (GABA) A receptor, pi 7,40E-05 1,99 0,38 4,04E-04 0,07 0,34 209230_s_at NUPR1 nuclear protein 1 3,10E-05 2,9 0,46 6,83E-05 1,76 0,45

208583_x_at HIST1H2AJ histone cluster 1, H2aj 0.000171489410190763 1,13 1,5 9,55E-05 1,44 1,48 212909_at LYPD1 LY6/PLAUR domain containing 1 0.000396614112466903 0,26 2,49 1,01E-04 1,38 1,63 219825_at CYP26B1 cytochrome P450, family 26, subfamily B, polypeptide 1 0.000283173086670878 0,61 2,65 2,56E-04 0,5 1,4

Page 6: Presentation 2 Amélie/Greg Juillet 2007. Les 3 objectifs du projet 1.Comparaison de 3 sources d’annotations génomiques. 2.Comparaison de données d’expression

Comparaison de données d’expression de micro-array

( humain versus rat)• Problématique:

analyse du stress oxidative dans des cellules pulmonaires ( 2 types differents) chez le rat et l’humain

• 2 experiences:

Humain = NULI+DMNQ

Rat = AT2 + TNF

UP REGULEpVal bVal logFoldChange rows_GS rows_ortho

<= 0.01 - >=0 340 47<= 0.01 - >=1 5 -<= 0.01 >0 >=0 35 6<= 0.01 >0 >=1 5 -<= 0.05 - >=0 754 184<= 0.05 - >=1 5 -<= 0.05 >0 >=0 35 6<= 0.05 >0 >=1 5 -

DOWN REGULEpVal bVal logFoldChange

<= 0.01 - <=-1 1 -<= 0.01 - <=0 197 25<= 0.01 >0 <=-1 1 -<= 0.01 >0 <=0 32 -<= 0.05 - <=-1 1 -<= 0.05 - <=0 598 332<= 0.05 >0 <=-1 1 -<= 0.05 >0 <=0 32 -

Page 7: Presentation 2 Amélie/Greg Juillet 2007. Les 3 objectifs du projet 1.Comparaison de 3 sources d’annotations génomiques. 2.Comparaison de données d’expression

Quelques résultats de comparaisons…selon les Gene

Symbol

TNFidProbSet DMNQidProbSet TNFpVal DMNQpVal TNFbVal DMNQbVal TNF-ratio DMNQ-ratio TNF_GS DMNQ_GS 1374070_at 202831_at 0,00E+00 0,00E+00 5,76 3,27 2,82 2,191623533 Gpx2 GPX2 1387835_at 212657_s_at 0,00E+00 0,00E+00 3,07 5,06 2,73 2,0907202 Il1rn IL1RN 1387835_at 212659_s_at 0,00E+00 0,00E+00 3,07 3,07 2,73 2,022304162 Il1rn IL1RN 1387835_at 216243_s_at 0,00E+00 0,00E+00 3,07 3,27 2,73 2,262628926 Il1rn IL1RN 1398287_at 211668_s_at 0,00E+00 0,00E+00 0,44 3,37 2,28 2,167451934 Plau PLAU

TNF 6h-DMNQ (Up regule) – Selon Gene Symbol

GeneSymbol_rat = Gene Symbol_humainIci , on suppose une orthologie probable

Page 8: Presentation 2 Amélie/Greg Juillet 2007. Les 3 objectifs du projet 1.Comparaison de 3 sources d’annotations génomiques. 2.Comparaison de données d’expression

TNFidProbSet DMNQidProbSet TNFpVal DMNQpVal TNFbVal DMNQbVal TNF-ratio DMNQ-ratio TNF_GS DMNQ_GS 1370260_at 201034_at 0,00E+00 0,00E+00 4,25 1,44 0,47 0,600401714 Add3 ADD3 1370260_at 201752_s_at 0,00E+00 0,00E+00 4,25 3,89 0,47 0,590087172 Add3 ADD3 1370260_at 201753_s_at 0,00E+00 0,00E+00 4,25 2,45 0,47 0,583174685 Add3 ADD3 1368565_at 202800_at 0,00E+00 0,00E+00 2,90 1,20 0,40 0,653835674 Slc1a3 SLC1A3 1368109_at 203217_s_at 0,00E+00 0,00E+00 4,19 2,10 0,65 0,590087172 St3gal5 ST3GAL5 1370260_at 205882_x_at 0,00E+00 0,00E+00 4,25 4,01 0,47 0,584388624 Add3 ADD3 1368746_a_at 207367_at 0,00E+00 0,00E+00 1,12 1,15 0,18 0,633756261 Atp12a ATP12A 1370026_at 209283_at 0,00E+00 0,00E+00 2,10 0,73 0,41 0,677832163 Cryab CRYAB 1371006_at 209784_s_at 0,00E+00 0,00E+00 0,99 1,99 0,63 0,692554734 Jag2 JAG2 1370254_at 213317_at 0,00E+00 0,00E+00 0,46 1,22 0,30 0,428390977 Clic5 CLIC5 1368080_at 218723_s_at 0,00E+00 0,00E+00 14,66 0,62 0,14 0,739181216 Rgc32 RGC32 1370254_at 219866_at 0,00E+00 0,00E+00 0,46 2,02 0,30 0,60583633 Clic5 CLIC5 1369902_at 226530_at 0,00E+00 0,00E+00 1,38 0,85 0,63 0,694477568 Bmf BMF 1368806_at 231669_at 0,00E+00 1,00E-03 3,38 0,02 0,51 0,623300597 Sepp1 SEPP1 1371006_at 32137_at 0,00E+00 0,00E+00 0,99 0,94 0,63 0,672683604 Jag2 JAG2 1383799_at 202545_at 0,00E+00 0,00E+00 1,08 1,14 0,53 0,652929894 Prkcd PRKCD 1374273_at 203917_at 0,00E+00 0,00E+00 3,32 2,91 0,69 0,670356296 Cxadr CXADR 1376755_at 205080_at 0,00E+00 0,00E+00 2,65 3,32 0,37 0,552865327 Rarb RARB 1376755_at 208530_s_at 0,00E+00 0,00E+00 2,65 3,28 0,37 0,53329289 Rarb RARB 1376489_at 217576_x_at 0,00E+00 0,00E+00 1,34 0,85 0,73 0,733058379 Sos2 SOS2 1375638_at 218711_s_at 0,00E+00 1,00E-03 6,66 0,11 0,12 0,644834125 Sdpr SDPR 1382452_at 218711_s_at 0,00E+00 1,00E-03 4,70 0,11 0,10 0,644834125 Sdpr SDPR 1375638_at 222717_at 0,00E+00 0,00E+00 6,66 0,42 0,12 0,588861395 Sdpr SDPR 1382452_at 222717_at 0,00E+00 0,00E+00 4,70 0,42 0,10 0,588861395 Sdpr SDPR 1382294_at 240655_at 0,00E+00 0,00E+00 0,46 0,66 0,63 0,689680461 Alcam ALCAM 1388064_a_at 202800_at 0,00E+00 0,00E+00 4,43 1,20 0,43 0,653835674 Slc1a3 SLC1A3 1387484_at 204731_at 0,00E+00 0,00E+00 0,04 1,78 0,77 0,498961359 Tgfbr3 TGFBR3 1385953_at 204918_s_at 0,00E+00 1,00E-03 2,19 0,02 0,64 0,65747138 Mllt3 MLLT3 1390032_at 205228_at 0,00E+00 0,00E+00 1,77 0,62 0,76 0,743806881 Rbms2 RBMS2 1387874_at 209782_s_at 0,00E+00 1,00E-03 0,03 0,03 0,72 0,698339266 Dbp DBP 1398304_at 210220_at 0,00E+00 0,00E+00 0,44 2,99 0,70 0,435275282 Fzd2 FZD2 1398807_at 213225_at 0,00E+00 0,00E+00 0,40 1,25 0,77 0,600401714 Ppm1b PPM1B

TNF 6h-DMNQ (Down regule)– Selon Gene Symbol

Page 9: Presentation 2 Amélie/Greg Juillet 2007. Les 3 objectifs du projet 1.Comparaison de 3 sources d’annotations génomiques. 2.Comparaison de données d’expression

TNFidProbSet DMNQidProbSet TNFpVal DMNQpVal TNFbVal DMNQbVal TNF-Ratio DMNQ-Ratio TNF_GS DMNQ_GS identity (%) overlap (%) 1367698_a_at 1554014_at 0,00E+00 0,00E+00 3,11 0,22 1,909242028 1,43296165 Sept9 CHD2 100 3 1369773_at 1555420_a_at 0,00E+00 0,00E+00 1,51 0,16 1,650610817 1,53368266 Bmp3 KLF7 92 3 1370064_at 1554014_at 0,00E+00 0,00E+00 4,00 0,22 1,566994374 1,43296165 Psen2 CHD2 100 2 1372028_at 1554014_at 0,00E+00 0,00E+00 2,50 0,22 1,390881972 1,43296165 RGD1305727_predicted CHD2 100 8

1386906_a_at 1554014_at 0,00E+00 0,00E+00 0,54 0,22 1,540074348 1,43296165 Sept9 CHD2 100 3 1388150_at 1554014_at 0,00E+00 0,00E+00 3,20 0,22 1,392811481 1,43296165 Xpo1 CHD2 100 2

TNF 6h-DMNQ (Up regule) – Selon fichier d'orthologie

Quelques résultats de comparaisons…selon le fichier

d’orthologie d’Affymetrix

Id_probeset_rat => Fichier orthologie AFFX Rat230.2/Humain HGU133 <=Id_probeset_humainIci , on suppose une orthologie probable à partir des séquences des probesets

Page 10: Presentation 2 Amélie/Greg Juillet 2007. Les 3 objectifs du projet 1.Comparaison de 3 sources d’annotations génomiques. 2.Comparaison de données d’expression

Problemes

• Methode statistique trop standardisée? Rejet de certaines experiences…tester d’autres methodes..

• Gestion de l’orthologie pas encore au point….verification par Blast

• Filtration des resultats (doublons suite a des interrogations croisées)…mot clé: DISTINCT, UNIQUE.

Page 11: Presentation 2 Amélie/Greg Juillet 2007. Les 3 objectifs du projet 1.Comparaison de 3 sources d’annotations génomiques. 2.Comparaison de données d’expression

Extension

• Insertion d’une dizaine d’experience en plus.• Usage d’autre approche statistique pour faire

l’analyse en amont (cybert T, AffyPLM, SAM). Standardiser le systeme

• Automatiser les scripts d’analyse SQL pour produire de l’analyse.

• 2007/2008: exploitation des resultats produits, reajustements des critéres statistiques utilisés.