8
Rappel des objectifs du WP10 Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué Mois 12 : cahier des charges pour un banc-test, sélection d’une application et document de planification Mois 24 : rapport sur la première version d’une application biologique sur le banc-test Mois 36 : rapport final incluant le compte-rendu de la deuxième version de l’application biologique sur le banc- test

Rappel des objectifs du WP10 Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué Mois 12

Embed Size (px)

Citation preview

Page 1: Rappel des objectifs du WP10 Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué Mois 12

Rappel des objectifs du WP10

Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué

Mois 12 : cahier des charges pour un banc-test, sélection d’une application et document de planification

Mois 24 : rapport sur la première version d’une application biologique sur le banc-test

Mois 36 : rapport final incluant le compte-rendu de la deuxième version de l’application biologique sur le banc-test

Page 2: Rappel des objectifs du WP10 Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué Mois 12

Biologistes/Médecins Physiciens

Architecture Plate Hiérarchisée (CERN)

Données Copies multiples

Formats variables

Découpage des bases de données

Read/Write

Peu de copies

Peu de formats (4)

Idem

Read OU Write

Calcul Mise à jour quotidienne

Interactif -> Temps réel

Parallélisé (BLAST)

Pas de mise a jour

Batch

Pas de parallélisme

Comparaison des besoins des biologistes et des physiciens

Page 3: Rappel des objectifs du WP10 Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué Mois 12

Evaluation des environnements existants

Calcul distribué : Tests de Globus (Exposé Y. Legré, R. Météry) Contacts avec le Laboratoire d’Informatique de

Lille : FOCALE

Plates-formes bioinfo : Tests d’Applab (EBI) Contacts avec INRIA Grenoble

Page 4: Rappel des objectifs du WP10 Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué Mois 12

Une alternative pour le calcul distribué : FOCALE (LIFL)

Fédération de serveurs distants Approche composants Echange de données entre composants sur un

bus CORBA Interface graphique pour assembler les

composants (pipelining)

Page 5: Rappel des objectifs du WP10 Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué Mois 12

Generic component description

Trader entry properties (name = value) “name”=“mycomp”

Binary file path command line

I/O streams spec. Type, location...

Trader entry

Properties

Binary

File

Input Output

Factory

Page 6: Rappel des objectifs du WP10 Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué Mois 12

ConnectorC

omp

onen

t p

rod

uci

ng

dat

a

Com

pon

ent

con

sum

ing

dat

a

File

Socket

Console

Method

File

Socket

Console

Method

Con

nec

torO

utp

ut

Con

nec

torI

np

ut

CORBA

Any stream to any stream connectors

Page 7: Rappel des objectifs du WP10 Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué Mois 12

Un besoin à terme: la partition des bases de données

Objectif : accélérer tous les algorithmes de comparaison de séquences Exemple : BLAST, recherche d’homologie entre une séquence et

celles déjà annotées (9GB) Limitation : accès disque

Moyen : découper les bases de données biologiques sur plusieurs nœuds en local et sur la grille et paralléliser le BLAST

Outils existants ? Apport de DataGRID ? Besoin commun de partition avec les physiciens Besoin spécifique de parallélisme

Page 8: Rappel des objectifs du WP10 Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué Mois 12

WP 10 : organisation

Réunions bimensuelles Lyon, 10/1/01 : état de l’art en bioinformatique Prochaine réunion à Amsterdam le 7 Mars

Collaborations envisagées Avec EBI Avec LIFL : FOCALE

Draft d’un cahier des charges (N. Jacq)