The Helix research group
Research themes
Work in progress and results
Publications
Software and databases
News from Helix
What's new in bioinformatics?
Home page
Site map Mail to Helix
Bioinformatics: from genomic and post-genomic data to biological knowledge
Bioinformatique: des données génomiques et post-génomiques aux connaissances biologiques
 

Séminaire IN'Tech

La fresque de Gerland  - 17.6 ko
La fresque de Gerland
Source : université Claude Bernard

Jeudi 23 octobre 2003, 14h - 18h

Lyon-Gerland, amphithéâtre de l'université Claude Bernard, Lyon 1

Organisation : INRIA Rhône-Alpes et Rhône-Alpes Genopole

Présentation

La multiplication et les progrès spectaculaires récents des dispositifs expérimentaux ont modifié considérablement les démarches de recherche en biologie. Les séquenceurs automatiques permettent d'obtenir rapidement et à un coût modéré la séquence de génomes complets, y compris non-bactériens ; les dites "puces à ADN", et autres dispositifs semblables, permettent de déterminer quels sont les gènes qui s'expriment dans les cellules à un temps donné et dans des conditions données ; la spectrométrie de masse s'impose dans l'identification des protéines, complétant l'arsenal de la protéomique. Ainsi confronté à des volumes de données sans cesse croissants et à une diversification de leurs origines et de leurs natures, le chercheur en biologie ne peut que recourir aux méthodes et aux outils informatiques, tant pour la gestion que pour l'analyse de ces données génomiques et post-génomiques. La bioinformatique se constitue ainsi comme un domaine d'activités spécifiques, à l'interface de la biologie et de l'informatique, ce dernier terme étant pris au sens large, incluant les mathématiques appliquées et les statistiques. Partant de la problématique biologique, le bioinformaticien projette et conçoit des outils informatiques propres à résoudre les problèmes identifiés. Ces outils sont des algorithmes, mis en oeuvre dans des logiciels dotés d'interfaces propres à en faciliter l'usage par le biologiste, mais également des bases de données et de connaissances dotées de puissantes capacités d'exploration, d'interrogation et de visualisation.

Les quatre chapitres de ce séminaire IN'Tech ont pour objectif d'expliciter les démarches, les méthodes et les outils de la bioinformatique à travers des exemples concrets de mise en oeuvre de bases de données et de logiciels qui répondent à une problématique biologique qui est préalablement expliquée.

Bibliographie

Programme

14h - 14h10 : Présentation du séminaire (Marc Barret et François Rechenmann, INRIA Rhône-Alpes)

Présentation F. Rechenmann - 2.5 Mo
Présentation F. Rechenmann
(PDF, 2.5 Mo)

14h10 - 15h : Bases de données : interopérabilité et qualité des données

Intervenants : Guy Perrière (Lab. de Biométrie, Biologie Evolutive, Lyon) et Amos Bairoch (SIB, Genève)

Présentation G. Perrière - 830.5 ko
Présentation G. Perrière
(PowerPoint, 830.5 ko)

Présentation A. Bairoch - 1013 ko
Présentation A. Bairoch
(PowerPoint, 1013 ko)

Des centaines de bases de données génomiques sont accessibles sur Internet. Leur nombre et leur diversité posent un premier problème crucial, celui de leur interopérabilité : interopérabilité syntaxique (les formats et les modèles de données utilisés différent d'une base à l'autre) et interopérabilité sémantique (des dénominations similaires recouvrent souvent des concepts sensiblement différents, y compris pour des concepts aussi centraux que celui de "gène"). En l'absence de solutions systématiques, c'est au biologiste utilisateur de ces bases qu'il revient de mettre en correspondance et de recouper les données qu'elles renferment afin de répondre à ses requêtes complexes. Le second problème est lié à la qualité des données. Ainsi, l'utilité et l'intérêt de la base SwissProt, et par là même sa notoriété, reposent sur la qualité du processus de recueil d'informations et d'expertise des données qu'elle renferme. Plusieurs dizaines de spécialistes explorent la littérature spécialisée pour en extraire les connaissances à attacher aux plus de 130000 protéines répertoriées et caractérisées.

15h - 15h50 : Annotation des génomes complets

Intervenants : Yves Vandenbrouck (GENOME express, Grenoble) et Anne Morgat (Fondation Rhône-Alpes Futur et SIB)

Présentation Y. Vandenbrouck - 2.5 Mo
Présentation Y. Vandenbrouck
(PDF, 2.5 Mo)

Présentation A. Morgat - 2.5 Mo
Présentation A. Morgat
(PowerPoint, 2.5 Mo)

Alors que l'obtention de la séquence complète d'un génome ne constitue plus un obstacle technique, son annotation reste un processus délicat que les outils bioinformatiques n'automatisent que très partiellement. L'annotation dite "syntaxique" consiste à identifier les régions de la séquence qui portent des informations biologiquement significatives, telles que les gènes et les signaux qui interviennent dans la régulation de leur expression. Pour les génomes bactériens, des démarches d'annotation fiables et pertinentes ont été développées et mises en oeuvre dans des logiciels performants. L'annotation dite "fonctionnelle" vise à caractériser la fonction du produit des gènes identifiés sur la séquence. Il n'existe pas de démarche systématique menant à cette caractérisation et le biologiste est amené à recouper des indices de provenances différentes. GenoStar, résultat des travaux d'un consortium rassemblant les sociétés GENOME express et Hybrigenics, l'Institut Pasteur de Paris et l'INRIA, est un environnement bioinformatique dont l'objectif est précisément de faciliter ce travail d'analyse et de recoupement des données hétérogènes. Cependant, que ce soit au niveau syntaxique ou fonctionnel, il convient de souligner que les méthodes bioinformatiques ne font que proposer des hypothèses et que seules l'expertise du biologiste et les expériences qu'il choisit de mener sont susceptibles de confirmer ou d'infirmer ces hypothèses.

15h50 - 16h20 : Pause

16h20 - 17h10 :Protéomique : des protéines aux gènes

Intervenants : Jérôme Garin (LCP/CEA, Grenoble) et Alain Viari (INRIA Rhône-Alpes, projet HELIX, Grenoble)

Présentation J. Garin - 2.7 Mo
Présentation J. Garin
(PowerPoint, 2.7 Mo)

Présentation A. Viari - 6.5 Mo
Présentation A. Viari
(PowerPoint, 6.5 Mo)

Si la génomique vise l'étude systématique des gènes, la protéomique vise l'étude systématique des protéines. Pour autant, le terme "protéome" recouvre une réalité beaucoup plus difficile à saisir que le terme "génome", tant une protéine, codée par un gène donné, est susceptible de subir des modifications qui en modifient la structure et la fonction. La tâche principale de toute approche protéomique est l'identification des protéines présentes dans la cellule à un temps donné dans des conditions données. Les approches à haut débit utilisent majoritairement les spectromètres de masse. Ces dispositifs produisent des spectres qu'il convient d'analyser automatiquement compte tenu du débit de cette production. Le Laboratoire de Chimie des Protéines (LCP) du CEA Grenoble et l'INRIA Rhône-Alpes ont développé conjointement une démarche originale d'analyse de ces spectres : chaque spectre correspond à un fragment d'une des protéines présentes dans le mélange étudié ; son analyse automatique produit une "étiquette peptidique" constituée d'une courte séquence d'acides aminés et d'informations sur les masses des séquences flanquantes ; il s'agit alors de rechercher, sur le génome de l'organisme correspondant, les régions susceptibles de coder ce fragment de protéine représenté par l'étiquette. La démarche consiste ainsi à "remonter" des protéines présentes dans le mélange aux régions codantes correspondantes dans le génome : une démarche expérimentale qui vient compléter la démarche d'annotation in silico.

17h10 - 18h : Bioinformatique structurale

Intervenants : Gilbert Deléage (IBCP, Lyon) et François Delfaud (société MEDIT, Paris)

Présentation G. Deléage - 2.3 Mo
Présentation G. Deléage
(PDF, 2.3 Mo)

Présentation F. Delfaud - 9.3 Mo
Présentation F. Delfaud
(PowerPoint, 9.3 Mo)

La connaissance de la structure des protéines contribue grandement à la détermination de leurs fonctions, en particulier de leurs capacités à se lier sélectivement à des sites spécifiques de la macromolécule d'ADN ou à d'autres protéines. Si le problème de la prédiction de la structure d'une protéine à partir de la seule connaissance de sa séquence n'a toujours pas reçu de solution complète, les bioinformaticiens développent d'autres outils extrêmement utiles, en particulier dans la recherche et la mise au point de nouveaux médicaments. Il s'agit en effet de rechercher des "cibles" sur lesquelles des protéines données ou des ligands (de synthèse) sont susceptibles de se fixer et d'activer ou inhiber certains processus critiques. Le logiciel SUMO permet ainsi, par la recherche dans la base de données PDB (Protein Data Bank), d'identifier et de caractériser ces modes d'interaction à partir d'une structure donnée.

    Top of page   Home page  Prepare to print