10
Les bases de données biologiques au LBBE Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données QuickTime™ et un décompresseur TIFF (non compressé sont requis pour visionner cette i Simon Penel Journées du laboratoire 1-2 Juin 2005

Les bases de données biologiques au LBBE Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données

Embed Size (px)

Citation preview

Page 1: Les bases de données biologiques au LBBE Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données

Les bases de données biologiques au LBBE

Le système ACNUC Bases de données  généralistes  Bases de données développées

au labo Accès aux bases de données

QuickTime™ et undécompresseur TIFF (non compressé)

sont requis pour visionner cette image.

Simon Penel

Journées du laboratoire 1-2 Juin 2005

Page 2: Les bases de données biologiques au LBBE Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données

Le système ACNUCSystème de requête sur les séquences biologiques

Développé au laboratoire (M. Gouy) Génération d’index à partir des annotations de séquences Permet de retrouver les séquences à partir de mot clefs,

de la bibliographie, de la taxonomie, de la date, du type de séquence, du type de molécule

Séquences « mères » et « filles » Permet d’extraire les séquences sous différents formats,

de récupérer les annotations Accès ACNUC local : API en C Accès ACNUC à distance, mode client serveur (sockets) ,

API en C

Page 3: Les bases de données biologiques au LBBE Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données

Bases de données généralistes structurées sous ACNUC maintenues au laboratoire

Mise à jour automatique: GenBank Séquences nucléiques - 2 milions de CDS

(NCBI) EMBL Séquence nucléiques - 2 milions de CDS Uniprot (anciennement SwissProt + TrEMBL + PIR) - 2milions

de protéines

et aussi.... Ensembl Génomes complets métazoaires Genome Reviews Génomes complets bactériens

(EBI) Complete Protéomes (EBI) HAMAP Génomes microbiens(SIB)

QuickTime™ et undécompresseur TIFF (non compressé)

sont requis pour visionner cette image.

Page 4: Les bases de données biologiques au LBBE Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données

Bases de données de familles de gènes développées au labo et/ou en collaboration

Bases de données de familles de gènes protéines ET/OU séquences nucléiques Familles de gènes/protéines

Alignement Arbre phylogénétique (avec évènement de spéciation et

duplication) Applications:

Evolution moléculaire Prédiction de fonction de gène Phylogénie des espèces Cartographie comparée Génétique des populations

Utilisation des ressources du centre de calcul de l’IN2P3 (P. Calvat) parallèlisation des calculs (BLAST, CLUSTALW) : gain 20 x à 50 x

Page 5: Les bases de données biologiques au LBBE Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données

Bases de données de familles de gènes généralesFamilles de gènes homologues

Hobacgen Bactéries & levures (G. Perrière) Hogenom

Hovergen Vertébrés 250 000 séquences (L. Duret) HoGenom Génomes complets 650 000

séquences (L. Duret, S. Penel)

Projet Européen Temblor/Integr8 (EBI) Homolens Génomes complets de Ensembl 250

000 séquences

QuickTime™ et undécompresseur TIFF (non compressé)sont requis pour visionner cette image.

Page 6: Les bases de données biologiques au LBBE Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données

Hoppsigen A. Khelifi (LBBE) Familles de retroélements, retropseudogènes RTKdb J. Grassot (LBBE/ Centre de Génétique Moléculaire et Cellulaire) Familles de

Récepteurs Tyrosine Kinase Nurebase (LBBE/ENS-Lyon) Familles de Récepteurs Nucléaires

Polymorphix E. Bazin ( Laboratoire « Génome Populations Interactions Adaptation ») Familles de séquences polymorphes

TaxoBacGen G. Devulder (LBBE) Taxonomie des génomes bactériens EMGLib G.Perrière (LBBE) Génomes bactéries et levures, annotations corrigées GemCore V. Navratil, (LBBE, INRA) SNiPs, cartographie comparée

Futur : Familles de gènes homologues de plantes Fusion Hogenom + Homolens Hovergen: Vertébrés Métazoaires ( x 2) Tout Uniprot ( 2 millions de séquences, x10)

Bases de données plus spécialiséesCollaborations au sein du LBBE ou avec labos extérieurs

Page 7: Les bases de données biologiques au LBBE Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données

Accès au banques

query, query_win en local à partir de pbil, biomserv, pbil2 (M. Gouy) Requêtes sur les banques Visualisation, extraction de données

query_win en mode client-serveur sur Mac et PC (S. Delmotte, M. Gouy)

seqinR en mode client-serveur (D. Charif, S. Delmotte, J. Lobry)

Serveur Web du PBIL (S. Penel, G. Perrière) Requêtes sur les banques Recherche avec BLAST Visualisation, extraction de données

FamFetch (banques de familles): application Java (G. Perrière) Recherche et visualisation des familles Recherche de motifs dans les arbres (J.F. Dufayard)

QuickTime™ et undécompresseur TIFF (non compressé)sont requis pour visionner cette image.

Page 8: Les bases de données biologiques au LBBE Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données

Accès au banques query, query_win à partir de pbil, biomserv, pbil2

Page 9: Les bases de données biologiques au LBBE Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données

Accès au banques Serveur Web du PBIL

Page 10: Les bases de données biologiques au LBBE Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données

Conclusions

De nombreuses banques De nombreux outils Grosses capacités de calcul (IN2P3) Compétences en modélisation, conception,

mise en place et maintenance des banques

Favoriser l’utilisation des banques le développement de nouvelles banques associées à

différentes thématiques au sein du laboratoire

QuickTime™ et undécompresseur TIFF (non compressé)

sont requis pour visionner cette image.