Instrumentele conditionering

Een andere termijn voor conditionering door operators

Instrumentele conditionering is een andere term voor operante conditionering , een leerproces dat voor het eerst werd beschreven door BF Skinner . Bij instrumentele conditionering worden wapening of straf gebruikt om de kans te vergroten of te verkleinen dat een gedrag in de toekomst opnieuw zal voorkomen.

Voorbeelden van instrumentele conditionering

Bijvoorbeeld, als een student wordt beloond met complimenten elke keer dat ze haar hand in de klas heft, zal ze meer geneigd zijn om haar hand in de toekomst opnieuw op te steken.

Als ze ook wordt uitgescholden als ze voor de beurt spreekt, is de kans kleiner dat ze de klas onderbreekt. In deze voorbeelden gebruikt de leraar wapening om het handverheffingsgedrag en de straf te versterken om het uitdraaigedrag te verzwakken.

Instrumentele conditionering wordt ook vaak gebruikt in diertraining. Een hond trainen om bijvoorbeeld een hand te geven, zou betekenen dat elke keer dat het gewenste gedrag zich voordoet, een beloning wordt aangeboden.

Een korte geschiedenis van instrumentele conditionering

Psycholoog EL Thorndike was een van de eersten die de impact van wapening in puzzelbox-experimenten met katten observeerde. Tijdens deze experimenten observeerde Thorndike een leerproces dat hij 'proeflezen' noemde.

De experimenten betroffen het plaatsen van een hongerige kat in een puzzeldoos en om zichzelf te bevrijden, moest de kat uitvinden hoe hij kon ontsnappen. Thorndike merkte vervolgens op hoe lang het de katten kostte om zichzelf te bevrijden tijdens elke experimentele proef.

Aanvankelijk hielden de katten zich bezig met ineffectieve ontsnappingsmethoden, krabben en graven aan de zijkanten of de bovenkant van de doos. Uiteindelijk zouden trial-and-error de katten ertoe brengen om met succes de ontsnappingsroute te duwen of te trekken. Na elke opeenvolgende proef namen de katten steeds minder deel aan het ineffectieve ontsnappingsgedrag en reageerden ze sneller met de juiste vluchtacties.

Thorndike verwees naar zijn waarnemingen als de Wet van Effect . De sterkte van een reactie neemt toe wanneer deze onmiddellijk wordt gevolgd door een "satisfier" (reinforcer). Aan de andere kant zijn acties die worden gevolgd door onplezierige effecten waarschijnlijk eerder verzwakt.

In de puzzeldoosexperimenten van Thorndike was het ontsnappen aan de doos des te bevredigender. Telkens als de katten met succes uit de doos ontsnapten, werd het gedrag dat onmiddellijk aan de ontsnapping voorafging versterkt en versterkt.

Het werk van Thorndike had een enorm effect op het latere onderzoek van BF Skinner naar operante conditionering . Skinner creëerde zelfs zijn eigen versie van Thorndike's puzzeldozen, die hij een operante kamer noemde, ook bekend als een Skinner-box .

Hoe instrumentele conditionering werkt

Skinner identificeerde twee belangrijke soorten gedrag. Het eerste type is het gedrag van de respondent. Dit zijn eenvoudig acties die reflexief plaatsvinden zonder enige vorm van leren. Als je iets warms aanraakt, trek je onmiddellijk je hand terug. Klassieke conditionering concentreert zich op het gedrag van deze respondenten. In de klassieke experimenten van Pavlov met honden was het gedrag van de respondent om aan de presentatie van voedsel te kwijlen. Door een verband te vormen tussen het geluid van een bel en de presentatie van eten, kon Pavlov echter honden trainen om daadwerkelijk te kwijlen bij het geluid van die bel.

Skinner realiseerde zich dat hoewel klassieke conditionering zou kunnen verklaren hoe respondent gedrag tot leren zou kunnen leiden, het niet voor elk type van leren kon verklaren. In plaats daarvan suggereerde hij dat het de consequenties waren van vrijwillige acties die tot de grootste hoeveelheid leren leidden.

Het tweede type gedrag is wat Skinner operant gedrag noemde. Hij omschreef deze als elk en elk vrijwillig gedrag dat inwerkt op de omgeving om een ​​reactie te creëren. Dit zijn de vrijwillige gedragingen die onder onze bewuste controle staan. Dit zijn ook acties die kunnen worden geleerd. De gevolgen van onze acties spelen een belangrijke rol in het leerproces.

Versterking en straf

Skinner identificeerde twee belangrijke aspecten van het operante conditioneringsproces. Versterking dient om het gedrag te vergroten terwijl straf het gedrag vermindert.

Er zijn ook twee verschillende soorten versterking en twee verschillende soorten straf. Positieve bekrachtiging houdt het presenteren van een gunstig resultaat in, zoals het geven van een traktatie aan een kind nadat ze haar kamer heeft schoongemaakt. Negatieve versterking houdt het verwijderen van een onaangename stimulans in, zoals het vertellen aan een kind dat als ze al haar aardappelen eet, ze haar broccoli niet hoeft te eten. Aangezien het kind van mening is dat broccoli een onplezierig gevolg is en het eten van de aardappelen leidt tot het verwijderen van dit ongewenste gevolg, wordt het eten van de aardappelen vervolgens negatief versterkt.

Positieve straf betekent het toepassen van een onaangename gebeurtenis na een gedrag. Spanking is bijvoorbeeld een veel voorkomend voorbeeld van positieve straffen. Dit type straf wordt door de toepassing vaak straf genoemd. Een negatief gevolg wordt direct toegepast om het ongewenste gedrag te verminderen.

Negatieve straf houdt in dat iets aangenaams wordt weggenomen nadat zich een gedrag heeft voorgedaan. Als een kind bijvoorbeeld haar kamer niet schoonmaakt, vertellen haar ouders haar misschien dat ze niet met haar vrienden naar het winkelcentrum kan gaan. Het wegnemen van de gewenste activiteit fungeert als een negatieve punisher op het voorgaande gedrag.