LE CONDITIONNEMENT


I. Introduction

La psychologie est l'étude des comportements. Dans la mesure où l'on conçoit que le comportement résulte d'un apprentissage, on comprend l'intérêt qu'à pu avoir la notion de reflex conditionné pour les psychologues du début du siècle : Intérêt théorique mais aussi méthodologique car Pavlov a proposé une méthode permettant d'étudier l'apprentissage dans des situations controlées.

II. La notion de conditionnement : Pavlov et le reflex conditionné

Définition : Le conditionnement est une forme simple d'apprentissage que l'on appelle apprentissage associatif, association entre une stimulation et une réponse. Au départ, on a un stimulus qui ne suscite aucune situation puis il acquiert la capacité à la provoquer. Les psychologues proposent que toutes nos conduites seraient une somme de reflex conditionnels.

L'historique : Cette notion de reflex conditionnel, on la doit à Pavlov (1849-1936). Au départ, c'était un physiologiste et un médecin russe, ses premiers travaux concernaient l'étude des glandes digestives chez l'animal. Il étudiait les sécrétions salivaires chez le chien et il avait remarqué que les chiens commençaient à saliver lorsqu'ils entendaient les pas du garçon de laboratoire qui amenait la nourriture. Il a appelé cette sécrétion gastrique anticipée, la sécrétion psychique, véritable objet d'étude sur ses travaux sur le reflex conditionnel. Lorsqu'on parle de reflex ce n'est pas un automatisme, c'est ce que nous appelons une réaction, c'est-à-dire la réponse d'un organisme à une stimulation du milieu. Conditionnel signifie que la réaction n'est pas le fruit d'un montage inné mais c'est quelque chose de changeant simplement parce que le milieu change, l'individu s'adapte aux exigences du milieu. La réaction est quelque chose d'appris en fonction de certaines régularités provenant du milieu. L'adaptation correspond à l'évolution des espèces ; quand Darwin parle d'adaptation, il parle d'une espèce entière (adaptation phytogénétique). On insiste donc sur le caractère maléable de l'individu qui modifie son comportement en fonction du milieu dans lequel il vit, cela soulève la question de l'inné et de l'acquis. Pour les théories innéistes, nos comportements seraient déterminés de façon biologique ; pour les théories empiristes, elles insistent sur la plasticité des individus pour lesquels nos comportements résulteraient des expériences passées avec le monde.

III. Le conditionnement classique

I on présente de la nourriture à un chien affamé, à tous les coups il se produit une réaction de salivation qui n'intervient qu'avec certains stimuli. Cependant, on sait qu'il est possible de faire en sorte que la présentation du stimuli provoque la réaction de salivation. Il suffit de présenter au chien la sonnette juste avant de lui donner la nourriture, au bout d'un certain temps, après un nombre suffisant de présentation sonnette-nourriture, on va constater que le chien salive dès la présentation du premier stimulus. C'est ce phénomène que Pavlov a appelé le réflex conditionnel. On parle de conditionnement parce qu'un processus qui ne provoquait pas systématiquement de réaction acquiert la capacité à provoquer cette réaction, aspect de l'environnement qui devient un déterminant comportemental, il s'est établi une sorte de connection entre le stimulus et la réponse.

Les différentes composantes d'un conditionnement :

- La réaction inconditionnelle : C'est la réponse d'un organisme à une situation venant du milieu, cette réponse est déclanchée de façon absolue par le stimulus approprié (ex : La salivation en réponse à la nourriture).

- Le stimulus inconditionnel : C'est l'événement du milieu qui déclanche la réaction inconditionnelle (ex : La nourriture). C'est indispensable pour établir un conditionnement, on appelle cela un renforcement.

- Le stimulus neutre : C'est l'élément du milieu qui ne déclenche pas la réaction inconsciente à laquelle on s'intéresse (ex : La sonnette).

- Le stimulus conditionnel : C'est le stimulus neutre qui change de statut au cours de l'expéreince, après qu'il ait été présenté suffisamment de fois, la sonnette déclenche la salivation. C'est son rôle physiologique qui s'est transformé puisqu'il est maintenant capable de provoquer une réponse.

- Réponse conditionnelle : Réponse de l'organisme à la stimulation conditionnelle (salivation lors de la sonnette).

On parle de stimulus conditionnel car il va provoquer des réactions sous certaines conditions, il faut que le stimulus conditionnel précède le stimulus inconditionnel et que la présentation en conjonction de ces deux stimuli aient eu lieu suffisamment de fois. La différence entre la réaction inconditionnelle et la réaction conditionnelle, pour certains théoriciens ce principe serait une substitution c'est-à-dire que le stimulus inconditionnel est devenu inutil, mais si on supprime le stimulus inconditionnel l'extinction va se produire c'est-à-dire que la sonnette ne peut plus déclencher la salivation. Un certain nombre d'auteurs considèrent que le conditionnement ne se fait pas dans un stimulus de substitution mais de signalisation, le stimulus conditionnel devient un signal biologique.

Notion de renforcement secondaire ou conditionnement d'ordre supérieur : Le stimulus inconditionnel se déclenche naturellement sans apprentissage et c'est sur cette réaction naturelle au départ que va jouer le stimulus conditionnel. L'organisme a intégré un nouvel apprentissage dans son répertoire d'adaptation au milieu. Ce nouveau reflex conditionné va pouvoir servir de base à l'acquisition d'autres conditionnements. Prenons l'exemple d'un chien qui salive à l'apparition de la lumière, si on fait sonner une cloche avant ou en même temps que la lumière s'allume sans présenter de viande il apprendra à saliver au seul son de la cloche, tout se passe donc comme si la lumière était un stimulus inconditionnel et la cloche un nouveau stimulus conditionnel.

IV. Le conditionnement classique : Acquisition d'une réponse conditionnelle

Exemples classique de réactions conditionnelles : Réactions sanitaires, palpebrale (fermeture de paupière), électrodermale.

- Réaction palpebrale : Consiste à fermer les paupières lorsqu'un stimulus physique risque de rentrer dans l'oeil, jet d'air envoyé dans la paupière, après conditionnement on s'aperçoit qu'un simple bruit peut entrainer la fermeture de la paupière.

- Réaction électrodermale : La peau a la capacité de conduire le courant électrique, cette mesure est liée à l'état émotif du sujet, par exemple on sait que la résistance de la peau augmente si on fait entendre un bruit fort, qui fait peur (stimulus inconditionnel), avant ce bruit on peut présenter un flash lumineux qui devient un stimulus conditionnel.

Les relations entre stimulus conditionnel et stimulus inconditionnel : Pour produire une réponse conditionnelle la nature du stimulus est important. Garcia et Koelling, phénomène d'inversion conditionné. Expérience pour montrer que certains stimuli conditionnels sont mieux amènes que d'autres. Expérience avec des rats, on va les entraîner à boire de l'eau salée ou sucrée donc elle a un certain goût. En même temps que l'animal boit, on lui présente un stimulus extérieur qui représente une lumière ou un bruit. On utilise des stimuli composés de deux choses, un goût associé à une caractéristique audio-visuelle. Pendant l'acquisition on va chercher à rendre désagréable ces stimuli composés. Pour cela, deux solutions, on apparie le stimulus composé soit à un agent émétique (-> Trouble digestif) soit à un agent douloureux (-> Choc électrique). Pour vérifier l'apprentissage on va mesurer le taux de lapement d'un tube qui contient de l'eau, soit eau avec un goût particulier (stimulus gustatif) soit de l'eau sans goût associée à un stimulus extérieur, la lumière ou le bruit (stimulus audio-visuel). Lorsque le stimulus conditionnel est gustatif, l'apprentissage est plus efficace avec un agent émétique, avec une caractéristique audio-visuelle l'apprentissage est plus efficace avec un agent douloureux. Il y a une relation entre le renforcement et le stimulus conditionnel, l'apprentissage est d'autant plus efficace que la nature du stimulus conditonnel peut être associé à la nature du renforcement. La nature du stimulus conditionnel est important sur la production d'une réponse conditionnelle. Ceci est utilisé dans certaines thérapies comportementales lorsque l'on veut éliminer certaines conduites. Le principe est de présenter de façon systématique un stimulus aversif lors de l'apparition de la conduite que l'on cherche à faire disparaître (alcoolisme, tabagisme...).

Les conditions dans lesquelles il est possible d'établir une réponse conditionnelle : Il faut qu'il y ait préalablement une réponse inconditionnelle. Il faut que le stimulus neutre soit présenté suffisamment de fois associé au stimulus inconditionnel. La principale condition est celle d'une conjonction dans le temps entre le stimulus neutre et le stimulus inconditionnel. Il faut toujours que le début du stimulus neutre précède le début du stimulus inconditionnel. Il doit toujours avoir une continuité dans le temps qui va toujours dans le même sens. Pour établir une réaction conditionnelle la règle est qu'il y ait une conjonction dans le temps entre le stimulus neutre et le stimulus inconditionnel, cela pose un problème car cela veut dire que toutes les stimulations qui interviennent dans le stimulus inconditionnel sont susceptibles de devenir conditionnelles. Donc, un simple bruit provenant de la salle d'expérimentation peut ainsi supprimer une réponse conditionnelle ou en allonger la latence, phénomène d'inhibition externe qui va impliquer d'isoler le sujet pour mener à bien un apprentissage.

La force de réaction conditionnelle et extinction : Pour rendre compte de la force d'une réaction conditionnelle il importe de préciser les caractéristiques des réactions en fonction de trois paramètres : La fréquence, l'amplitude et la latence.

La fréquence : Après un certain nombre de présentations du stimulus neutre et du stimulus inconditionnel on voit apparaître le stimulus conditionnel, réaction stabilisée, elle va apparaître de façon constante avec une fréquence de 100%. A chaque fois que l'animal salive la fréquence s'accroît en fonction du nombre de renforcements.

L'amplitude : Paramètre qui rend compte de la quantité de réponses. L'amplitude s'accroît en fonction du nombre de renforcements jusqu'à devenir stable.

La latence : Délai entre la présentation du stimulus conditionnel et la réaction conditionnelle. La latence diminue en fonction du nombre de renforcements.

A partir de la première réaction conditionnelle les facteurs qui jouent sur la force de la réponse sont au nombre de deux, le nombre de répétitions de la conjonction entre le stimulus conditionnel et le stimulus inconditionnel, c'est-à-dire avant la première réponse conditionnelle, on va pas encore parler de renforcement, avant chaque présentation de la conjonction entre ces deux stimulations va augmenter un potentiel exitatif nul au départ. Mais il faut que ce potentiel exitatif atteigne un certain seuil pour traduire une exitation visible. Deuxième paramètre, l'intensité du stimulus conditionnel, lorsqu'on la diminue la force de la réponse diminue et lorsqu'on augmente l'intensité la force de réponse augmente.

L'extinction d'une réaction conditionnelle : Si on arrête de donner la nourriture au bout d'un moment la force de la réponse diminue jusqu'à ce qu'elle disparaisse. La résistance à l'extinction, la réaction est d'autant plus difficile à éteindre qu'elle a été beaucoup renforcée. Si après l'établissement de la réponse conditionnelle on laisse s'écouler un certain temps c'est plus difficile à éteindre. L'extinction est aussi plus difficile si on espace les essais renforcés et non renforcés. Phénomène de récupération spontanée, une réaction conditionnelle est éteinte, on laisse le sujet au repos. Si au bout de quelques jours on présente de nouveau le stimulus conditionnel il arrive qu'il redevienne actif et qu'il produise une réponse conditionnelle. Cette récupération spontanée est plus élevée lorsqu'on laisse s'écouler du temps entre la fin de l'extinction et la nouvelle présentation du stimulus conditionnel. Le conditionnement n'a pas totalement disparu, il est simplement inhibé.

V. Le conditionnement instrumental

= Le conditionnement opérant

A. Introduction

C'est un conditionnement qui consiste à faire en sorte qu'un comportement apparaisse chez l'animal pour ensuite le récompenser. Lorsque ce comportement aura été récompensé suffisamment de fois, le conditionnement sera établi. L'animal aura tendance à mettre en oeuvre ce comportement afin d'obtenir une récompense. On a vu que dans le conditionnement classique la récompense n'apparaît pas après un comportement émis par l'animal mais après un stimulus conditionnel.

Skinner, il s'agit d'une boîte qui comprend une mangeoire pour recevoir de la nourriture ainsi qu'un levier sur lequel il suffit d'appuyer sur le levir et faire apparaître une boulette de nourriture, il va encore le faire quelques fois par hasard. Lorsque l'on mesure l'intervelle de temps entre deux pressions successives du levier on constate que cette intervalle de temps diminue et au bout d'un moment l'animal occupe tout son temps à appuyer sur le levier et à manger.

B. Définition du conditionnement instrumental

Une certaine réponse que le sujet donne entraîne une conséquence particulière, on dit que le sujet a appris à associer la production d'un comportement avec l'apparition d'un certain renforcement. Le conditionnement instrumental correspond donc à une modification de la probabilité de la réapparition d'une réponse. Cette modification est entraînée par l'apparition d'un événement particulier, ça peut être aussi le retrait d'un événement particulier. Cet événement particulier eest qualifié de renforçateur. Le comportement du sujet est comme un instrument qui permet d'obtenir un effet quelconque. Ce sont les actions du sujet qui opèrent des changements dans l'environnement.

C. Expériences

Miller et Konorsky ont voulu voir si on pouvait mettre en place un conditionnement classique en prenant comme stimulus neutre une stimulation proprioceptive. Stimulus qui consistait à fléchir la patte du chien, cette flexion intervenait avant que la nourriture soit présentée, il s'agissait de voir dans quelle mesure cette flexion pouvait provoquer une réponse de salivation. Au bout d'un certain temps le conditionnement classique avait réussi c'est-à-dire dès qu'on pliait la patte le chien salivait mais les chercheurs se sont aperçus que le chien flechissait lui même de façon spontanée la patte. L'animal avait appris à associer une réponse à une conséquence particulière.

D. Différences avec le conditionnement classique

La contingence entre deux événements est une relation de nécessité entre ces deux événements. A cause de ses propriétés renforçantes la nourriture rend la réponse plus probable. Dans une situation de conditionnement classique, ce n'est pas le comportement de l'animal qui détermine l'apparition du renforcement, c'est l'expérimentateur lui-même qui fixe cette apparition. Ce qui importe donc dans une situation de conditionnement instrumental c'est la contingence entre le stimulus renforçateur et la réponse. On parle aussi  de conditionnement opérant car c'est une action de l'animal qui est à l'origine du conditionnement. Le comportement opérant se manifeste spontanément et non en réponse à une stimulation spécifique. On parle de conditionnement répondant car le sujet apprend à répondre de façon directe à un stimulus qui provient de l'environnement.

Le conditionnement opérant met plus en avant l'action spontanée de l'animal.

En conditionnement classique la réponse conditionnelle est analogue à la réponse inconditionnelle. Le renforçateur entretient avec la réponse une relation fonctionnelle, c'est-à-dire qu'il y a un lien fonctionnel entre la nourriture et le fait de saliver. En conditionnement instrumental il y a aucune relation fonctionnelle ou aucun lien de cause à effet entre la réponse et le renforcement.

Ex., répondre au téléphone est un conditionnement opérant, le stimulus discriminatif étant répondre au téléphone. En conditionnement opérant un stimulus discriminatif nous informe qu'à tel moment ou face à telle caractéristique de l'environnement telle réponse donnée sera suivie d'un renforcement, le stimulus discriminatif est à l'origine du conditionnement opérant. La sonnerie occasionne le comportement opérant de répondre au téléphone. Le stimulus discriminatif ne nous oblige pas à répondre, il contrôle la réponse. Alors qu'en conditionnement classique le stimulus conditionnel nous oblige à répondre.

E. Les différents types d'apprentissages instrumental

Il y a aussi des renforçateurs qui vont correspondre à des événements aversifs (désagréables). Catégorisation en fonction du caractère aversif ou appétitif, selon la présence ou l'absence de l'événement conséquent. Quand l'événement conséquent est présent, on va parler de contingence positive, c'est quand l'émission de la réponse provoque une conséquence particulière. Quand il y a une absence d'événement conséquent on parle de contigence négative, c'est-à-dire que l'émission de la réponse se traduit par une absence de conséquence (ex., enfant qui fait son intéressant, on fait mine d'avoir rien vu).

Conséquence appétitif, ex. enfant félicité pour avoir ramassé ses jouets. Quand cela reproduit le comportement on parle de renforcement positif. Conséquence aversif, ex. enfant punit pour avoir fouillé la pharmacie. On parle de punition positive car il le fait moins. Absence de l'événement conséquent, ex. enfant qui ne reçoit pas d'attention des adultes lorsqu'il utilise un langage grossier. Evénement conséquent appétitif, mais il y a absence de cette conséquence, cela va diminuer la réponse, on parle alors de punition négative. Absence d'événements conséquents, ex. le conducteur qui ralenti pour éviter une contravention, comportement aversif, renforcement négatif, désagréable.

Notion de contingence : C'est une relation de nécessité entre deux choses. Par ex., la récompense est un type particulier de contingence que l'on appelle renforcement positif. La punition est un autre type de contingence que l'on appelle punition positive.

F. Les différents types de renforcement, notion de renforcement et de punition

Le renforcement : Qu'il soit positif ou négatif, il se traduit toujours par une augmentation de la probabilité de réponse. Le renforcement positif est tout ce qui apparaît ou ce qui est introduit dans la situation et qui augmente la force de la réponse. Ex., la nourriture qui est introduit en tant que conséquence de l'appui sur le levier ou la récompense que l'on donne à l'enfant comme conséquence d'avoir rangé ses jouets.

Le renforcement négatif est quelque chose qui disparaît de la situation et qui augmente la force de la réaction. Augementation de la probabilité de réponse par le retrait de l'événement particulier. Ex, l'arrêt du choq électrique lorsque l'animal presse sur le levier ou l'arrêt du mal de tête quand on prend de l'aspirine. Le renforcemnt négatif donne lieu à deux types d'apprentissages, par échappement et par évitement. L'échappement est lorsque l'individu essaie de se soustraire à une situation aversive dès que le stimulus commence à apparaître (ex, aspirine). L'évitement est lorsque l'individu se soustrait à une situation aversive en l'évitant, c'est-à-dire avant que le stimulus aversif commence à apparaître.

La punition : Elle se caractérise par une diminution de la force d'apparition d'une réponse. Ex. quand l'animal appui sur le levier -> choc électrique ou contravention à l'automobiliste qui va trop vite.

G. Réflexion sur l'efficacité d'un apprentissage, nature d'un renforcement et des punition utilisées. Notion de programme de renforcement

Récompense / Punition : L'efficacité d'un apprentissage dépend de la nature des renforcements et des punitions utilisées. Ex, on considère actuellement que l'apprentissage par récompense est plus efficace qu'un renforcement par punition. Il a été montré que la punition est moins efficace car si elle supprime temporairement une réaction elle ne l'affaiblit pas. Quand la punition est efficace c'est qu'elle a aidé l'individu à changer son comportement. Pour que la nouvelle conduite se maintienne il est nécessaire de la renforcer par des récompenses.

Délai entre la réponse et le renforcement : Programme de renforcement : Il y a d'autres facteurs qui jouent sur l'apprentissage, par exemple la quantité de renforcement ou le délai entre chaque renforcement. On se pose la question pour savoir si pour mener à bien un apprentissage l'individu doit être récompensé à chaque fois ou de temps en temps. Le programme de renforcement spécifie les relations entre la réponse et les renforcements. Il existe différents types de programmes de renforcement. Les programmes de renforcement continus où chaque réponse est suivie d'un renforcement, on considère que ce type de progression est efficace surtout au début de l'apprentissage pour sa mise en place. Deuxième type, les programmes de renforcement partiels ou intermitant, les renforcements se produisent quelques fois et non pas à chaque fois. Ce renforcement partiel est plus efficace que le renforcement continu, l'apprentissage dans ces conditions est plus difficile à mettre en place mais il est plus résistant à l'extinction.

Plusieurs types de renforcements partiels : Premier, ils prennent en compte le nombre de réponses pour déterminer le délai entre deux renforcement, par ex. on peut décider de renforcer la réponse une fois sur 20. On peut aussi décider de tirer au hasard la réponse renforcée, ex. l'individu qui joue au tiercé. Deuxième type, ils prennent en compte le moment où la dernière réponse a été fournie pour déterminer quand il doit avoir un renforcement, c'est-à-dire que l'obtention du renforcement dépend d'un temps qui s'écoule. L'expérimentateur peut donner le renforcement à chaque minute, dans la mesure où la réponse est correcte.

Efficacité de ces programmes : Les programmes de renforcement continus favorisent la mise en place de l'apprentissage, par contre ils résistent assez mal à l'extinction. Dans les renforcements partiels ou intermitants ils donnent à des débits de réponses plus élevés basés sur le hasard.

VI. Conditionnement classique et instrumental, aspect théorique

On peut se demander en quoi ces deux formes de conditionnement renvoient à deux formes d'apprentissage. Certains théoriciens considèrent qu'il s'agit d'une seule et même forme d'apprentissage. Pour défendre leurs positions ils s'appuient sur les similarités qui existent entre ces deux types de conditionnement. Il y a besoin à chaque fois d'un renforcement, d'une contiguité temporelle entre le renforcement et le stimulus conditionnel dans un cas (renforcement classique) ou d'une contiguité temporelle entre le renforcement et la réponse pour ce qui est du renforcement instrumental. Pour ces deux types de conditionnement il faut répéter cette association. De façon générale, la force de la réponse augmente au fur et à mesure que l'on donne des renforcements. En l'absence de renforcements il y a une extinction progressive de la réponse.

D'autres théoriciens considèrent qu'il s'agit de deux types distincts d'apprentissage. Leur premier argument, dans un cas le renforcement déclenche la réponse alors que dans l'autre cas le renforcement apparaît comme conséquent de la réponse. Dans un cas la réponse est déclenchée automatiquement par le stimulus inconditionnel et dans l'autre cas la réponse est découverte par hasard. Association entre deux stimulus alors que dans l'autre cas, association entre une réponse et un renforcement.

A. Le conditionnement classique

Statut du stimulus conditionnel / stimulus inconditionnel : Premier type de modèle, stimulus substitution, par ex. Pavlov va expliquer le conditionnement par un mécanisme de substitution, c'est-à-dire que progressivement le stimulus conditionnel devient équivalent au stimulus inconditionnel. Ce stimulus conditionnel est donc capable de remplacer le stimulus inconditionnel. Deuxième type, stimulus réponse, le stimulus conditonnel ne s'associe pas au stimulus inconditionnel mais plutôt à la réponse inconditionnelle.

Dans l'expérience de la réaction salivaire, a priori la réponse conditionnelle et inconditionnelle est la même chose, c'est-à-dire que l'animal réagit à la lumière mais on va chercher les différences. Premier argument, la réaction salivaire va être une composante de l'ensemble du comportement alimentaire. La présentation de la nourriture (stimulus inconditionnel) déclenche la salivation mais aussi des mouvements de mastication, de déglutition de la part de l'animal. Ces mouvements de mastication et de déglutition n'interviennent pas lorsqu'on présente la sonnerie ou la lumière. La présentation prématurée serait désavantageuse pour l'animal. Autre ex., conditionnement pavlovien du rythme cardiaque, pour mettre en place ce conditionnement on va exposer l'animal à un son suivi d'un choc électrique. Dans un situation de ce type, la réaction inconditionnelle est due au choc électrique (qui est donc le stimulus inconditionnel), se traduit systématiquement par une augmentation du rythme cardiaque. Par contre, la réaction conditionnelle qui est due au son peut se traduire aussi bien par une augmentation ou une diminution du rythme cardiaque.

La représentation du stimulus inconditionnel : Selon certains auteurs, comme Sokolov, la stimulation donnerait lieu à la formation d'un modèle interne ou à une représentation, et lorsque deux stimulus sont présentés de façon contingente, il y a une association qui se créée entre ces deux modèles internes ou ces deux représentations et c'est ça qui reproduirait le conditionnement.

B. Aspects théoriques du conditionnement instrumental

Le renforcement correspond à une recherche de satisfaction, d'un soucis d'équilibre biologique ou d'un simple principe de contiguité temporelle ? Le rôle du renforcement est de faire acquérir ou de sélectionner une réponse qui existait déjà dans le répertoire du sujet ?

1. Ce à quoi correspond le renforcement ?

Les théories behavioristes ou comportementales considèrent l'apprentissage comme quelque chose qui résulte d'une association entre les stimulations sensorielles et les réponses motrices.

La théorie de Guthrie : Pour rendre compte de l'apprentissage il a formulé la théorie de la contiguité, c'est la contiguité temporelle entre un stimulus et une réponse qui est responsable de l'association stimulus - réponse.

Thorndike : Pour rendre compte de l'apprentissage il a formulé la loi théorique de l'effet, c'est-à-dire que le renforçateur serait efficace parce qu'il provoque une satisfaction chez le sujet. La loi de l'effet : Au plus est le plaisir provoqué par une réponse suite à une stimulation, au plus fort sera renforcée l'association stimulus-réponse, et à l'inverse, au plus fort est le déplaisir provoqué par une réponse suite à une stimulation, au plus fort sera l'affaiblissement de l'association stimulus-réponse.

Skinner propose la loi empirique de l'effet qui insiste plus sur la nécessité d'identifier les circonstances où apparaît le renforcement. La notion de clef est la notion de contingence de renforcement. 'C'est l'occurence simultanée d'une réponse et de certains événements conséquents (renforcement) qui accroîent la probabilité que des conséquences du même type se produisent à nouveau dans des circonstances analogues'. Dans la mesure où la conséquence d'une action est plus positive c'est-à-dire qu'elle provoque une satisfaction chez le sujet, l'organisme cherchera à faire réapparaître cette réponse dans des circonstances similaires.

Hull évoque un besoin d'équilibre biologique, il va parler d'homéostasie biologique pour rendre compte du fait que l'organisme cherche à maintenir ses fonctions biologiques dans un état d'équilibre. 'Chaque fois qu'une réponse arrive en contiguité avec une stimulation, cette conjonction permet de réduire un besoin au niveau de l'organisme, il y a une association entre ce stimulus et la réponse'. Le renforcement est donc défini comme quelque chose qui correspond à une réduction de l'intensité du besoin. Tout ce qui est renforcement permet de refaire l'équilibre biologique.

2. Le rôle du renforcement ?

Dans les conceptions classiques (Skinner, Thorndike), le renforcement agit sur les mécanismes qui déterminent l'émission d'une réponse. Son rôle est de rendre l'emission d'une réponse plus probable qu'elle ne l'était avant, l'individu apprend à donner une réponse appropriée à la stimulation. D'autres auteurs considèrent que le rôle du renfocement ne serait pas de faire acquérir une réponse mais plutôt de sélectionner une réponse qui existerait déjà dans le répertoire du sujet.

C. Généralisation conditionnelle et discrimination

1. La généralisation conditionnelle

Une fois que l'on a établi une stimulation à un stimulus conditionnel, un stimulus autre (stimulus connexe) peut provoquer une réaction. L'efficacité de ces stimuli connexes est d'autant plus grande qu'ils sont semblables au stimulus original. Phénomène essentiel dans la vie courante car chaque aspect du stimulus ne peut pas être conditionné.

Interprétation de Hull : Il commence à faire le lien entre un potentiel exitatif et inhibitif. Selon Hull, lors de l'apprentissage le stimulus conditionnel va provoquer un potentiel exitatif. Selon que ce potentiel dépasse ou non un certain seuil il donne lieu à une réponse plus ou moins forte. La présentation non renforcée d'un stimulus provoque au contraire un potentiel inhibitif. Les stimuli connexes donnent lieu à un potentiel exitatif généralisé dont la grandeur dépend de leurs ressemblances avec le stimulus original (de départ). De la même façon, le potentiel inhibitif se généralise en fonction aussi de la ressemblance avec le stimuli de départ.

VII. Conclusion sur les interprétations théoriques du conditionnement, examens de ce qui différencie les modèles behavioristes par rapport aux modèles neurophysiologiques ou cognitivistes

A. Interprétation behavioriste : Guthrie, Hull, Skinner

Dans chacune des théories on cherche à rendre compte des déterminants environnementaux de l'apprentissage, c'est-à-dire que l'on cherche à décrire la variation des comportements en fonction des conditions environnementales. Les interprétations se limitent toujours aux observables de la situation. ces observables sont les stimuli en tant qu'ils déterminent les réponses et les réponses en tant qu'elles sont déterminées par les stimuli. Skinner, les changements qui interviennent dans l'organisme résultent obligatoirement de la simultanéité entre une réponse et certains événements conséquents à cette réponse. C'est le fait que deux choses arrivent en même temps qui accroît la probabilité de donner une réponse analogue dans des circonstances similaires. L'apprentissage ne résulte pas des modifications des représentations internes élaborées par l'individu, il y a une liaison qui se créée entre des stimuli et des réponses.

B. Différences avec les autres types d'interprétation

1. Les interprétations neurophysiologiques

Les théories neurophysiologiques se centrent plutôt sur la façon dont ces facteurs environnementaux agissent au niveau des circuits neuronaux. Tout ce qui se passe pendant une conduite se passe à la fois au niveau du corps et du cerveau. Ces théories cherchent à décrire l'état du cerveau avant et après l'apprentissage. Ces interprétations sont modernes, Pavlov proposait d'interpréter la liaison conditionnelle entre stimulus et réponse. Le phénomène important était une liaison entre le stimulus conditionnel et le stimulus inconditionnel qu'il décrivait comme une sorte de connection physiologique qui s'établissait au niveau du cortex entre les centres récepteurs du stimulus conditionnel et du stimulus inconditionnel. Lorsqu'il s'est établi cette connection neuronale, il suffit de présenter le stimulus conditionnel, 'La présentation du stimulus conditionnel irradie le stimulus inconditionnel et provoque une réponse'.

2. Interprétation cognitiviste

Tolman : C'est à lui que l'on doit les premières explications théoriques type cognitiviste de l'apprentissage (1940). Il décrit l'apprentissage d'un labyrinthe, en se déplaçant dans le labyrinthe on élabore une image de l'environnement c'est-à-dire une carte des lieux, cette image interne va être utilisée pour se déplacer de nouveau dans le labyrinthe. Cette fois-ci on postule que l'apprentissage aboutit à une représentation interne de la structure du monde. Ces représentations internes intercallées entre les stimuli et les réponses vont conduire l'individu à agir d'une certaine façon. Il fait l'hypothèse que ces représentation sont stockées dans une mémoire représentationnelle. L'apprentissage ne se limite plus à un système d'actions et de perception mais en plus de représentations.

Définitions cognitivistes

Apprentissage associatif : Il consiste à former dans une mémoire représentationnelle par des processus cognitifs (ex., perception, attention...) une structure cognitive qui conserve et organise l'information concernant les différents éléments qui surviennent dans la situation.

La cognition : C'est l'ensemble des processus mentaux qui s'intercallent entre les stimuli et la réponse, et qui transforment l'apport sensoriel, le traduisent en code abstrait ou représentation, l'entreposent en mémore et le repêchent plus tard. Quand on parle de cognition on parle de différentes étapes dont l'attention, la perception, la représentation, la récupération des informations...

Les cognitivistes considèrent qu'il y a certains processus cognitifs qui représentent le monde et d'autres processus qui décident des actions à effectuer en fonction de ces représentations. On réintroduit l'esprit comme causal et la détermination du comportement se fait par la boîte noire. Dans les théorie béhavioristes la notion de renforcement est fondamentale mais pas dans les théories cognitivistes.

Conclusion

On a essayé de comprendre la différence entre les explications behavioristes, cognitivistes et neurophysiologiques à travers l'étude de l'apprentissage. La grande différence entre une explication behavioriste et cognitiviste est que l'explication behavioriste se limite aux données de la situation alros que l'explication cognitiviste évoque l'existence de processus internes. La mode est plutôt aux explications cognitivistes car elles sont plus humanistes.

Bibliographie

DE LA GARANDERIE A, Les profils pédagogiques, Centurion, 1980

DELANNOY C, L'intelligence peut-elle s'éduquer ?, Hachette, 1992

GAONAC'H D, Manuel de psychologie pour l'enseignement, Hachette, 1995

GIURGEA E, L'héritage de Pavlov, Mardaga, 1995

LE NY J-F, Le conditionnement et l'apprentissage,

LUSSIER F, Neuropsychologie de l'enfant : troubles développementaux et de l'apprentissage, Dunod, 2005

PARAVY G, Médiation éducative et éducabilité cognitive : autour du PEI, Chronique sociale, 1996

RAMOZZI-CHIAROTTINO Z, De la théorie de Piaget à ses applications, Centurion, 1989

RAQUIN B, La PNL au quotidien : découvrir ses comportements psychologiques, Jouvence, 2004

REUCHLIN M, Mémoire, conditionnement, évolution, Colloque Université René Descart, 5 décembre 1980

THOMAS R, Les attitudes, Que sais-je ?, PUF, 1993

WINNYKAMEN F, Apprendre en imitant ?, PUF, 1990

 

Flux RSS

 

14 votes. Moyenne 3.00 sur 5.

Commentaires

  • oloa angèle
    Pouvez vous me donner les simulitides entre le conditionnelement classique et le conditionnement opérant
  • Nina
    • 2. Nina Le 29/03/2011
    thank you ! ! !
  • Victor
    • 3. Victor Le 30/01/2011
    Très interressant ! merci beaucoup
  • FOMEKONG
    • 4. FOMEKONG Le 18/11/2010
    je suis étudiant en informatique et mon programme d'étude comporte un volet:le conditionnement. ces pages m'ont été très utiles pour mon exposé
  • mimoune
    • 5. mimoune Le 17/03/2010
    expliquez moi l'expérience de PAVLOV sur le conditionnement classique, je n'ai pas compris!!! =(
  • H hafi
    • 6. H hafi Le 08/03/2010
    Dans le conditionnement instrumental, le stimulus qui est à l0origine de la réponse du sujet est: a. inconditionnel
    b. neutre
    c.discriminatif
    d. conditionnel
  • arlette zgheib
    • 7. arlette zgheib Le 28/03/2009
    merci beaucoup,ces information m'ont aider ils sont tres claire et
  • Alex
    • 8. Alex Le 12/10/2008
    merci beaucoup, vos explications m'ont été d'un grand secours pour répondre à mes questions de TD sur les apprentissages et les conditionnements! merci encore!!
  • ETOUNGOU
    • 9. ETOUNGOU Le 26/11/2007
    je voudrais savoir le lien entre le conditionnement classique et la situation pédagogique d'apprentissage
  • Jonathan
    • 10. Jonathan Le 16/10/2007
    MERCI MERCI MERCI!
    Cette page web m'a beaucoup aidé dans ma recherche sur les Réflex Conditionnés par Ivan Pavlov. J'ai vraiment bien aimé l'organisation du site. Les aspets étaient vraiment bien séparés et cela m'a beaucoup aider à comprendre mon sujet.
  • meite
    • 11. meite Le 02/02/2007
    merci pour ces informations grace a vous j'ai pu retrouvé des élément que je ne trouvait pas dans mes cours.
  • josie
    • 12. josie Le 25/05/2006
    je suis étudiante en psycho et je trouve que vos explications sont plus clair que mes cours, merci!
  • Nessim
    • 13. Nessim Le 26/04/2006
    Je fais une étude sur le condionnement classique d'Ivan Pavlov et cette page, bien que technique, n'a aidé et j'ai réussi à à peu près tout comprendre.
    Merci bien !
  • dali nacera
    • 14. dali nacera Le 23/04/2005
    Je vous remerçe pour ses informations bien organisées.
  • F. Cissé
    • 15. F. Cissé Le 17/02/2005
    Je suis étudiante en communication et mon programme d'étude comporte un volet psychosociologie de la communication. Ces pages m'ont été très utile dans mes recherches.
    C'est avec plaisir et reconnaissance que les recommenderai à mes colleques.
    Merci!
  • antoineH
    • 16. antoineH Le 28/01/2005
    j'étudie actuellement le conditionnements multiseonsoriel appliqué à la neurocybernétique. Cette page m'a été fort utile pour synthétiser les informations recueillies. si vous avez des références à me communiquer, je me ferai un plaisir de les lire. Merci d'avance.

Ajouter un commentaire

Code incorrect ! Essayez à nouveau