Passer au contenu

Décrypthon, le calcul distribué made in France

Débutant la semaine prochaine, le projet Décrypthon s’appuiera sur plus de 160 000 PC et 16 serveurs, pour dresser la carte des protéines du monde vivant. L’architecture doit supporter 100 000 connexions simultanées.

Depuis trois ans, le Téléthon, émission organisée chaque année par l’Association française contre les myopathies (AFM) pour récolter des fonds, propose aux internautes de participer en effectuant leurs dons en ligne.Mais, cette année, l’association a décidé de profiter encore davantage d’internet avec le Décrypthon.Sur une idée de l’acteur Thierry Lhermitte, qui l’a mise en relation avec IBM Global Services (IGS), l’AFM proposera, à partir de mars 2002, à chaque utilisateur de PC de mettre à disposition sa puissance disponible pour commencer une cartographie des protéomes ?” un classement réalisé par comparaison exhaustive de 500 000 protéines du monde vivant.Les internautes ont pu s’inscrire sur le site du Téléthon dès le mois de novembre 2001. A la mi-février dernier, ils étaient 165 000.

Une application de faible taille en tâche de fond

Pour réaliser en quelques semaines un tel calcul de manière classique, plusieurs supercalculateurs hors de prix auraient été nécessaires.La solution de la grille permettra de l’effectuer dans un délai à peu près équivalent avec seulement seize serveurs xSeries sous Linux et deux serveurs pSeries sous AIX, prêtés par IBM dans ses locaux.Le principe général consiste, pour chaque internaute, à télécharger une application de faible taille (environ une demi-heure de téléchargement en mode RTC), qui tournera en permanence en tâche de fond de basse priorité sur son poste et traitera un paquet de données.Lors du premier accès, le PC de l’internaute est connecté à l’un des deux pSeries. Celui-ci lui affecte alors un identifiant unique. Ensuite, le pSeries le dirige vers l’un des seize xSeries, qui sera son interlocuteur unique à chacune de ses connexions ?” sauf en cas de panne, où il basculera alors sur l’un des quinze autres.

Une exécution qui reste sous le contrôle de l’utilisateur

Les deux pSeries sont équipés du logiciel LSF Activecluster, de Platform Computing, spécialiste du grid computing. Cet outil planifie les tâches (job scheduler) et répartit la charge entre les seize xSeries en fonction de la disponibilité de leurs ressources.L’internaute récupère un morceau de code de calcul client encapsulé dans LSF Activecluster, ainsi qu’un paquet de 100 à 200 Ko de données à traiter.La portion de code client comme l’application centrale qui réalisera la cartographie du protéome ont été mises au point par Genomining, spécialiste du traitement de l’information biologique.L’encapsulation dans LSF Activecluster permet à l’application cliente, bien qu’écrite pour Unix, de tourner sur des machines Windows. Mais, surtout, c’est lui qui adapte l’exécution de la tâche de fond en fonction de la puissance inutilisée du PC.Via

une icône dans la barre des tâches, il fournit à l’utilisateur du PC toutes les informations nécessaires sur l’état du calcul, il lui permet de l’interrompre, etc. Une fois le calcul achevé, LSF Activecluster demande à l’internaute s’il veut se connecter pour renvoyer ses données et, éventuellement, en récupérer d’autres.

Une montée en charge progressive

La configuration serveur supporte aisément cent mille accès simultanés. Si un utilisateur se voit rejeté lors de la connexion, sa demande est, de toute façon, immédiatement relancée et rapidement acceptée.Par prudence, IGS va cependant procéder à une montée en charge progressive. Les entreprises inscrites seront les premières prévenues, dès la fin février. Elles permettront à ceux de leurs employés qui souhaitent participer à l’opération de télécharger les éléments idoines par intranet ?” un internaute ne peut légalement s’inscrire avec le PC de son entreprise sans l’accord de celle-ci.Puis, vers le 15 mars, les internautes individuels entreront dans la ronde en quatre vagues successives de vingt-cinq mille postes.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Emmanuelle Delsol