L’apprentissage sans erreurs

L’apprentissage sans erreurs par Cynthia Edelman

Article issu du blog Magic Clicker.

ou « errorless learning » :-D

Préambule 

L’apprentissage sans erreurs est une approche qui a été introduite Charles Ferster, psychologue, dans les années ’50 dans le cadre de recherches sur l’apprentissage.

B.F. Skinner a aussi énormément contribué au concept et a écrit : « … les erreurs ne sont pas une fonction de l’apprentissage et vice versa et elles ne doivent pas être imputées à l’apprenant. Les erreurs sont le résultat d’une piètre analyse du comportement, d’un piètre plan de shaping qui évolue trop vite d’une étape à une autre et ne se focalise pas sur les prérequis indispensables à une réussite spécifique ».

Plusieurs étudiants de Skinner ont continué sur cette lancée : en 1963, Herbert Terrace a publié une étude décrivant une expérience de discrimination de formes et couleurs avec des pigeons. Il travaillait à minimiser la réponse émotionnelle en cas d’erreur dans un apprentissage par conditionnement opérant.

… fin du préambule  :-D

Pyramid made of tick marks and yellow lamp.

Il y a très (très) longtemps, dans un cours d’agility, alors que mon jeune chien réussissait fort bien ce qu’on lui demandait, le coach du jour m’a fait monter le critère (le point de succès ou, plus simplement, notre exigence vis-à-vis de la performance du chien), à une allure telle que, rapidement, il ne pouvait que se confronter à l’échec… ce qui est évidemment arrivé et semblait réjouir le coach considérablement (contrairement à moi).

A la vue de ma mine dépitée face à cette approche, il m’a dit « comment veux-tu qu’il fasse la différence entre ce qui est juste et ce qui est faux s’il ne fait jamais faux ? Il ne peut pas faire toujours juste ».

Parce que mon coach était convaincu de travailler en « positif », il m’a suggéré de ne pas dire « non » au chien mais d’employer un autre mot comme « zut » « oups » ou « raté », selon lui moins « aversif » qu’un « non » tonitruant (ou qu’un coup de batte de baseball, on en convient aisément)  :lol:

Si on est tout à fait sincères toutefois, on veut faire tester au chien la différence entre un renforcement positif et une punition : en effet, en quelques répétions seulement, votre «oups» ou «raté» (ce qu’on appelle communément un « non reward marker » – un marqueur d’erreur) – devient une information parfaitement aversive.

Imaginez-vous acteur dans un jeu télévisé : quand vous répondez juste, on entend un «jingle » immédiatement suivi d’un billet de mille euros.

Quand, au contraire, vous répondez faux, on entend un « buzzer » et rien n’arrive.

En très peu de répétitions, le « buzzer » causera chez vous une émotion parfaitement désagréable (même si personne ne vous assène un coup de batte de baseball : dans l’absolu, si vous receviez en prime un coup de batte de baseball suite au buzzer, vous finiriez rapidement par ne plus répondre du tout).

Cette émotion précisément (frustration, irritation, dépit, tristesse, etc.) sera très vite associée au buzzer et, si elle se répète trop souvent, versus le jingle qui annonce la réussite (et le renforçateur), elle s’étendra à l’activité entière («ce jeu n’est pas drôle» ou «je suis nul»)  :-(

… et donc, mon chien, mis en situation de « essaie toujours » a, évidemment, fini par faire faux, puis encore faux et faux encore – suscitant en moi (puisque je ne vais pas parler des émotions de mon chien que je ne peux prétendre connaître), une certaine irritation envers l’activité elle-même, le coach et, admettons-le, vis-à-vis de mon chien également  :-|

Au niveau du comportement de mon chien (qui lui est observable et quantifiable) –il s’est mis à renifler le sol avec une grande attention, comme si une odeur sublime avait soudainement fait son apparition ☺ (un clair « je n’ai plus envie de jouer avec toi »).

A force « d’erreurs » induites, suivies de divers « ratés », on crée avec une touchante application une réponse conditionnée à un signal, à une activité précise (dans ce cas, l’agility), à un environnement, voir même à une personne (moi en l’occurrence).

Et, comme si ça ne suffisait pas, on crée la mémoire du comportement inapproprié.

En dessous, une intéressante vidéo du Dr. Tedd Judd, professeur de psychologie. Elle est en anglais et, si vous êtes anglophones, je vous conseille de la visionner en entier.

Je la résume pour ceux qui ne sont pas copains avec la langue de Shakespeare 

Il mentionne un de ses patients qui souffre d’une perte de mémoire suite à un accident.

Lors d’une séance, il demande au patient « vous souvenez-vous de mon nom ? » et le patient répond par la négative, il ne s’en souvient pas.

Le professeur incite donc le patient à se lancer « essayez quand même » et le patient lui répond « euh, Dr. Smith ? ».

Le praticien lui répond « non, je suis le Dr. Judd ». La séance suivante, il répète sa question «vous souvenez-vous de mon nom ? » et, encore une fois, le patient répond « non ».

Le praticien l’incite encore à « se lancer » et le patient répond « c’était pas Dr. Smith ? » et la réponse arrive « non, je suis le Dr. Judd ».

A leur troisième rencontre, le patient aperçoit le Dr. Judd et l’apostrophe allègrement «hey, bonjour Dr. Smith ».

Son cerveau a « appris » ce qu’il a le plus souvent répété, encore et encore, plutôt que la «bonne réponse ».

dommage

Je le dis souvent à mes clients : plus votre chien met en pratique un comportement et plus celui-ci devient son comportement « par défaut », celui qu’il retient (à considérer chez le chien qui déclenche et déclenche encore sur un quelconque élément de son environnement).

Quand on me répond « mais je ne peux pas l’empêcher de déclencher au jardin » (par exemple), je n’ai pas de baguette magique à vous fournir (il vous faudra limiter la visibilité du chien ou opter de ne plus le laisser seul au jardin en train d’aboyer cent millions de fois sur les passants car ce comportement spécifique, utilisé encore et encore, devient comme un muscle sur entraîné et surpassera tous les autres, moins fréquents).

barking

Prenons l’exemple de l’apprentissage d’une marche en laisse sans tirer, une des principales préoccupations de nombreux propriétaires : la plupart des procédures, méthodes et techniques (considérées comme « positives ») impliquent que le chien tire malgré tout d’abord : un comportement qu’on s’évertue ensuite à mettre sur extinction (c’est-à-dire qu’on veut faire disparaître le comportement de « tirer »), avec des résultats souvent peu probants.

dogpulling

La voie royale reste encore de rendre un comportement probable et de le renforcer(marcher à la hauteur de la cuisse de l’humain).

Dans une séance de shaping, une approche « sans erreurs » ne peut être construite sans un plan de shaping réfléchi, écrit, pensé et maintes et maintes fois revu (parfois).

think

Les gens travaillent souvent au clicker de cette manière « essayons toujours, on verra bien ce que ça donne » – ce qui est la porte (grande) ouverte à l’erreur, à la répétition de l’erreur (parfois encore et encore) et, au final, à l’irritation de l’humain qui conduit la séance…

… avec, en prime, un double effet Kiss-Cool : mémorisation de l’erreur ETréponse conditionnée frustrante à un exercice, un signal voir au travail de manière générale  :roll:

Un apprentissage sans erreurs est un but vers lequel on doit  travailler en réfléchissant à l’environnement, aux erreurs possibles (afin de les rendre improbables), pour – en définitive – réduire la difficulté et le temps d’apprentissage et, donc, construire un comportement qui, une fois rattaché à un signal, se comportera comme un renforçateur secondaire, fort de son historique de réussite et de confiance.

Happy Training ☺

Laisser un commentaire