Comparaison de logiciels

On peut noter une grande différence entre les différents algorithmes, les uns fournissant un résultat exact, les autres pas. L'utilisation de ces derniers s'explique par la très grande taille des données à traiter. Leur complexité temporelle étant meilleure, ils permettent de surmonter ce problème.

Comparaison de l'algorithme de Smith&Waterman avec les autres logiciels:

Tout d'abord il faut noter que l'algorithme de Smith&Waterman est un algorithme plus exact que Blast1.4. Par exemple, on estime qu'il donne 5% de résultats en plus.

pourcentage de hits pour une superfamille de 36 protéines

situation idéale

100%

Smith&Waterman

88.28%

Blast

83.69%

FastA

87.03%

Mais l'algorithme de Smith&Waterman a un temps d'exécution très grand. Il ne peut être utilisé que sur des machines massivement parallèles.

Comparaison de Blast 1.4 avec Blast 2:

Tout d'abord Blast 2 intègre la notion de 'gap' ce qui lui confère une bien meilleure sensibilité.
De plus il est 3 fois plus rapide que son prédécesseur.
On retrouve chacun des 5 programmes composants la famille de Blast, il faut y ajouter dans Blast 2 un nouveau logiciel: PSI-Blast (Position Specific Iterated Blast) réservé à la comparaison des protéines.

Compraison Blast 2 avec FastA:

Chacun des deux logiciels a des défauts et des qualité.

La première qualité de Blast est sa rapidité, une recherche classique effectuée sur la totalité des banques de données protéiniques ou d'ADN ne prend que quelques minutes. Cette caractéristique fait de Blast le premier choix.

De plus lorsqu'on fait une recherche avec les paramètres par défaut de Blast et de FastA, généralement Blast a une plus grande sensibilité dans la mesure où il ne nécessite pas de similitude parfaite à la première étape de l'algorithme.

De plus Blast a accès à des bases de données intéressante, qui regroupe plusieurs autres banques mais sans redondance.

Enfin Blast peut utiliser les banques de données de séquences de protéines directement, sans transformer la séquence nucléique en 6 phases. Pour la même recherche avec Fasta il aurait fallu utiliser un programme pour cette traduction en 6 phases.

D'un autre côté, Blast favorise la vitesse par rapport à la sensitivité. pour la recherche sur des chaînes d'ADN, FastA est alors la référence bien qu'il effectue les recherches en quelques heures contre 2 à 3 minutes pour Blast.

De plus l'utilisation de FastA permet de mettre le paramètre de pénalité de 'gap' à 0. Ceci permet de créer des alignements sans 'gap', ce qui a permet de résoudre certains problèmes de génétique spécifiques.

Blast reste le logiciel à utiliser pour une première recherche rapide, faisant apparaître les alignement possibles.