![]() |
Cartographier le protéome
Un défi scientifique qui nécessite une mobilisation
humaine et un exploit technologique, réalisé entre décembre 2001 et
mai 2002.Ces travaux ont pour objectif de réaliser la comparaison "tout contre tout" des protéines : chaque protéine a été comparée à toutes les autres. Ces comparaisons ont été réalisées au moyen de l'algorithme de Smith-Waterman dans une architecture distribuée représentant virtuellement une puissance de calcul de plus de 40 Téraflops. Genomining a développé à cette occasion un logiciel spécifique SWC. Pour ces travaux, les chercheurs se sont appuyés sur la puissance de 75 000 ordinateurs contribuant chacun à hauteur d'environ 200 heures de calcul. Si l'on n'utilisait qu'un seul ordinateur personnel standard, le calcul prendrait environ 625 000 jours, soit environ 1 710 années. 550.000 protéines comparées et classifiées
Ce projet a permis la comparaison de 550 000 protéines connues
provenant de diverses espèces, depuis des organismes unicellulaires
comme les bactéries jusqu'aux vertébrés (dont la souris et l'homme),
en passant par des organismes pluricellulaires tels que la drosophile
(la mouche du vinaigre), le nématode (un ver) ou une plante
(l'arabète). Ces travaux ont utilisé les séquences protéiques
répertoriées dans plusieurs bases de données parmi lesquelles
Swiss-prot, IPI, TrEMBL, Refseq, Ensembl. Les calculs ont comparé les
séquences de ces protéines pour les classer en familles de protéines
homologues à travers les différentes espèces. La base de données
obtenue permet la mise en relation de cette classification avec les
structures tridimensionnelles connues de certaines de ces
protéines. En bref, après la cartographie du génome, il s'agit d'une
véritable cartographie du protéome. La base de données établie, d'une
ampleur sans précédent, permet aux chercheurs de travailler plus
facilement et plus rapidement sur ces éléments complexes et essentiels
de notre organisme que sont les protéines. Jusqu'à présent, en effet,
faute de disposer de l'infrastructure technologique nécessaire pour
entreprendre une analyse exhaustive, les chercheurs se sont contentés
de comparer les protéines d'un nombre limité d'espèces ou de comparer
les protéines au sein d'une même espèce.
Une base de données au service de la lutte contre les maladies génétiques Grâce à ces travaux, les chercheurs disposent d'un outil -une base de données- qui leur permet de : - découvrir la fonction inconnue d'une protéine grâce à la comparaison de sa séquence avec celle des protéines dont les fonctions sont connues chez d'autres espèces du monde vivant. C'est l'annotation du protéome, c'est-à-dire la description de la fonction biologique de séquences protéiques. Les chercheurs pourront ainsi progresser plus vite dans la compréhension des mécanismes des maladies génétiques. - progresser dans la connaissance des structures des protéines, aujourd'hui très limitée. Les protéines sont des molécules complexes dont les repliements sculptent d'innombrables figures dans l'espace comme une pelote de laine dont les fils seraient enroulés de multiples façons. Aujourd'hui, seul un nombre limité de structures protéiques a été établi de façon expérimentale et on a bien du mal à prédire à partir du code linéaire des séquences de gènes comment les protéines se replient dans l'espace. Une connaissance essentielle car la structure des protéines détermine leur fonction. - reconstituer l'histoire des familles de protéines et mieux comprendre ainsi l'évolution du monde vivant. - croiser les données du génome avec celles du protéome. Le génome humain comporte un certain nombre de variations entre les individus (polymorphismes). L'étude de ces variations (ou snips) permet d'identifier les gènes impliqués dans les maladies. Aujourd'hui, on sait repérer sur le génome ces variations. En les comparant à la carte des protéines, on peut espérer repérer plus vite les variations de notre génome pouvant être associées à des maladies. Du génome au protéome : l'intérêt d'une telle démarche est illustrée par une animation à télécharger (pour plate-forme windows). Plus d'informations sur le Décrypthon : http://www.infobiogen.fr/services/decrypthon/index.html |
![]() |