Le séquençage du génome

Le séquençage est une technique qui permet de résoudre beaucoup de problèmes. Il est en grande partie utilisé en biologie moléculaire.

Nous aborderons donc dans un premier temps le séquençage en général : en quoi consiste t-il, une présentation de la biologie moléculaire où il est largement utilisé et les autres domaines d'application du séquençage.

De toute évidence, l'informatique est devenue un apport fondamental à la biologie moléculaire : cet apport constitue la bio-informatique. Les moyens informatiques sont naturellement utilisés pour le stockage ou la gestion des données mais également pour l'interprétation de ces données.

En particulier, la programmation dynamique est beaucoup utilisée pour les problèmes de séquençage du génome ; elle permet de trouver la solution optimale d'un problème en exploitant le fait qu'on puisse le résoudre à partir de sous-problèmes.

La bio-informatique concerne globalement 3 aspects :

· Le 1er aspect, traité dans la partie 2 concerne les traitements que l'on peut effectuer sur les séquences afin de repérer ou de caractériser une fonctionnalité ou un élément biologique intéressant. Ces programmes représentent les traitements couramment utilisés dans l'analyse des séquences comme la recherche de similitudes d'une séquence avec l'ensemble d'une base de données. Nous verrons ici plus particulièrement l'algorithme de Smith et Waterman.

· Le 2ème aspect concerne l'ensemble des outils d'étude, les logiciels. Il est maintenant plus ou moins facile d'effectuer certains traitements plus ou moins complexes à l'aide de ces logiciels. Nous étudierons donc les différents principaux logiciels sur la biologie moléculaire dans la 3ème partie.

· Le 3ème aspect concerne les bases de données où se stockent les séquences. Incontestablement toutes ces banques de données constituent une source de connaissance d'une grande richesse que l'on peut exploiter dans le développement de méthodes d'analyse. Il existe différentes catégories de bases de données pour les séquences biologiques; elles seront étudiées dans la 4ème partie.

Les parties 3 et 4 constituent les études des principaux logiciels et des bases de données, elles ne décrivent pas l'intégralité des outils; il n'est pas possible de réaliser des études exhaustive dans un domaine aussi vaste et étendu que la bio-informatique.