Logo du site

Sciences de la vie et de la Terre

Jouer avec les molécules pour déterminer une parenté sur le web

23 / 02 / 2005 | Martine Pernodet | Sacha Touille

Recommandation didactique (Bernard Gissot IA-IPR de SVT)

Comme
dans toute progression pédagogique et afin de respecter la « démarche de résolution de problèmes » indispensable à la formation scientifique de l’élève, ces fiches ne peuvent être utilisées que dans le cadre de cette méthode. Autrement dit, cette séance ne peut se situer dans la démarche que dans une phase de mise à l’épreuve expérimentale. Elle fait donc obligatoirement suite à l’énoncé d’une problématique et à la proposition d’hypothèses de résolutions formulées par les élèves. Ces dernières seront alors validées ou invalidées par la saisie de données scientifiques proposées par le site .

Ces fiches ne peuvent en aucun cas être distribuées de façon directive mais seulement comme une trame possible à un protocole d’activité de validation scientifique.

Point de départ

Le site de départ est celui du NCBI : http://www.ncbi.nlm.nih.gov/

Premier temps : Recherche d’une protéine d’une espèce donnée

Pour rechercher des informations sur un organisme particulier, utiliser

TaxBrowser

 :

On peut alors saisir dans la fenêtre le nom anglais de son être vivant favori et puis cliquer sur le bouton

Go

Par exemple, si on saisit

cat

 :

On obtient l’écran ci-dessous :

En bas de l’écran

Lineage (full)

donne la position du chat dans tous les groupes d’êtres vivants.

En cliquant sur

Lineage

, on obtient une version abrégée.

À droite de l’écran, un tableau donne accès à des
séquences protéiques
et nucléotidiques de votre être vivant préféré.

En
cliquant sur le nombre 1,167 (attention, 1,167 est le nombre
affiché le 23 février 2005 au moment où cette fiche est rédigée),
vous accédez à l’écran ci-dessous.

Dans
la fenêtre de recherche for, saisir par exemple :

AAR23921

et
cliquer sur le bouton

Go

.

On
obtient l’écran ci-dessous.

En
cliquant sur la référence de la protéine

AAR23921

, on a alors
accès aux informations sur elle et son propriétaire.

À
côté du bouton

Display

, choisir dans la liste déroulante, le
format

FASTA

.

En
cliquant sur le bouton

Display

, on obtient l’écran ci-dessous.

On
récupère par Copier/Coller dans une page de traitement de texte
les 2 lignes d’informations :

>gi|38565053|gb|AAR23921.1| progesterone receptor [Felis catus]

YPPYLNYLRPDSDASQSPQYSFESLPQKICLICGDEA

Deuxième temps : comparaison avec d’autres protéines proches

On retourne à la page d’accueil du site : http://www.ncbi.nlm.nih.gov/

On
va à la recherche sur la banque des protéines qui
lui ressemblent en cliquant sur

BLAST

.

On
obtient l’écran ci-dessous.

Comme
on souhaite faire des comparaisons de molécules, on clique sur

Protein-protein BLAST (blastp)

.

On
arrive à l’écran ci-dessous.

On
récupère les informations, précédemment stockées dans la page
de traitement de texte, par Copier/Coller dans la fenêtre

Search

.

Pour
accéder à la comparaison, on clique sur le bouton

BLAST !

On obtient l’écran ci-dessous.

On
clique alors sur le bouton

Format !

.

Après un petit temps d’attente, s’affiche, dans une nouvelle
fenêtre du navigateur, une longue page avec un premier tableau
montrant des "similitudes" en "barres".

Un survol de la souris sur les barres donne le nom du "propriétaire"
de la protéine présentant des similitudes.

Pour
rechercher rapidement un nom d’espèce dans la page, on fait [Ctrl+F]
([Pomme+F] sur Mac).

Le
nom doit être saisi en latin : Canis vulgaris, Homo sapiens, ...

Remarque : TaxBrowser peut aider à trouver les noms latins.

En
cliquant sur la référence de la protéine (

>gi

...), on se retrouve
dans un écran que l’on connaît.

Comme
précédemment, on choisit le format

FASTA

puis on clique sur le
bouton

Display

.

On
récupère ces informations par Copier/Coller dans le traitement
de texte.

On
répète la même opération de récupération avec Homo sapiens.

Remarque : une autre façon d’obtenir les diverses protéines à partir
de la page d’accueil du NCBI, c’est de sélectionner

Protein

dans la liste déroulante Entrez.

Puis
de saisir dans la fenêtre

for

, le nom latin de l’espèce suivi
du nom de la protéine cherchée, et de cliquer sur le bouton

Go

.

Troisième temps : alignement et arbre avec multalin de l’INRA de Toulouse

Quand
toutes les séquences voulues sont dans le traitement de texte,
on peut alors demander un alignement et un arbre avec MultAlin : http://prodes.toulouse.inra.fr/mult...

Dans
MultAlin, on colle toutes les séquences dans la grande fenêtre
blanche.

Puis
cliquer sur le bouton

Start MultAlin

pour obtenir l’écran
ci-dessous (extrait).

On
dispose de plusieurs options de sauvegarde et de visualisation
des résultats.

Par
exemple pour obtenir un arbre, il faut cliquer sur

Alignment and tree description (rfd)

.

On obtient l’écran ci-dessous.

Cliquer
sur le bouton pour demander l’arbre.

On
voit que les lettres et les chiffres ne sont pas très évocateurs.

On évite ce problème en changeant dans le traitement de texte
(ou dans la fenêtre de MultAlin) ce qui est écrit avant la
séquence, en ayant bien soin de conserver le > initial.

Ainsi :

>gi|38565053|gb|AAR23921.1| progesterone receptor [Felis catus]

YPPYLNYLRPDSDASQSPQYSFESLPQKICLICGDEA

peut
être remplacé par :

>chat

YPPYLNYLRPDSDASQSPQYSFESLPQKICLICGDEA

On
peut alors obtenir l’arbre suivant.