Résumé :
Depuis le milieu des années 1990 et la publication des deux premiers génomes complètement séquencés (Haemophilus influenzae et Saccharomyces cerevisiae), la biologie a franchi une nouvelle étape. Après la révolution de la biologie moléculaire du début des années 1970 et la vision, que certains qualifient de réductionniste, qu'elle a amenée, l'ère de la génomique fait actuellement évoluer la biologie vers une vision plus intégrative. Ce nouvel engouement pour une biologie dite intégrative a permis de prendre conscience que l'idée selon laquelle l'inventaire complet des gènes d'un organismes permettrait d'appréhender son fonctionnement est une vision simpliste, bien qu'elle ait justifié en grande partie le développement de nombreux "projets génomes".
J'ai eu la chance de commencer mes travaux de recherche au début des projets génomes et j'ai, dans ce cadre, participé au projet de séquençage du génome de la levure Saccharomyces cerevisiae. Je ne pourrais dire si c'est en opposition à l'idée du génome vu comme un simple sac à gènes, mais dès ce moment, j'ai orienté mon travail de recherche vers l'étude de l'évolution de la structure des chromosomes de la manière la plus indépendante possible des gènes qu'ils portent. Il m'importe, au travers de mes travaux, d'essayer de mettre en évidence des contraintes évolutive qui sont liées à la nature même du support de l'information génétique et non à l'information portée.
La stratégie suivie m'a conduit à étudier les mécanismes de duplication à l'origine de nombreux remaniements chromosomiques. Il m'a été ainsi possible de proposer un modèle expliquant l'origine de nombreuses répétitions observables dans les génomes ainsi que leurs évolutions. Ce modèle semble être applicable, pour ses grandes lignes, aux trois super règnes (Eucaryotae, Eubacteriacae et Archae) ce qui montre le caractère ancestral des mécanismes sous-jacents.
Même si l'exercice présente un intérêt, il ne serait sans doute pas raisonnable de poursuivre ce type de travail sans tenter de croiser les résultats ainsi obtenus avec des données relatives à l'information présente sur les chromosomes, et donc à la fonction des gènes codés par ceux-ci. La mise en place du lien entre les données de répétitions dont je dispose et les données fonctionnelles disponibles relève de l'intégration et donc de la représentation des connaissances. MicrOBI peut être considéré comme ma réponse à ce problème. Aujourd'hui cette base de données permet de maintenir cohérents les liens existant entre plusieurs bases de données publiques décrivant différents types d'informations biologiques. L'ajout des données de répétition au schéma actuel permettra de poser au système des requêtes complexes intégrant les différents niveaux de données que sont le génome, le protéome et les classifications fonctionnelles.
Abstract:
Since the publication of the two first fully sequenced genomes (Haemophilus influenzae and Saccharomyces cerevisiae) in the second half of nineties, biology has entered a new phase. After the era of molecular biology, at times described as reductionist biology, the new genomic era has incited biologists to adopt a more integrative point of view. This new emphasis on what has been called "integrative biology", has fled to the awareness that the simplistic idea according to which the knowledge of the full list of genes of an organism is enough to understand its functioning is not realistic, even if it has justified many genome projects.
I was lucky to begin my research work at the same time the genome projects started. I participated in the yeast genome project leading to the full sequence of the first eukaryotic genome in 1997. I do not know if it is by opposition to the simplistic idea described above, but since that time I have been working on chromosome evolution as independently as possible of the genes they support. I have tried through my work to highlight evolutionary constraints associated to DNA structure and not to its information contents.
For this reason, I am mainly studying duplication mechanisms which explain many of the chromosomal rearrangements. A model issued from this work has been proposed. It explains the origin and fate of observable duplications in genomes. It seems to be applicable, to a large extend, to the three super-kingdoms (Eukaryota, Eubacteria and Archea), which is for me a good indication of the ancestral aspects of the underlying mechanism.
Even if this approach independently of gene function has its interest, it would undoubtedly not be reasonable to continue this type of work without trying to connect the results obtained so far with data on the information carried by the chromosomes and thus with the function of genes encoded by them. Establishing a link between data on repeats available to me and functional data available in public database is a challenge which involves data integration and knowledge representation. MicrOBI can be regarded as my response to this problem. Today, this database allows the maintenance of coherent existing links between several public databases describing different type of biological information. Adding data on chromosomal repeats to the present schema will allow the construction of complex requests integrating different levels of information such as genome, proteome and functional classification.
|