Condicionamiento Instrumental. Fundamentos
Domjan 5
Condicionamiento Clásico
Estimulo
Conducta
EI
RI
Condicionamiento Operante
ED
NO causa la conducta.
Simplemente es una señal
que le indica al sujeto que
el reforzamiento está
disponible
Conducta Operante
La frecuencia de ocurrencia de una
operante está influenciada en gran
medida por las consecuencias
ambientales que produce.
Consecuencia
 Placenteras
 aversivas
ED
Presencia del
fiscal de transito
NO
causa
la
conducta,
sólo
indica la posibilidad
del reforzamiento
Conducta Operante
Consecuencia
Infracción
Cometer una
infracción
(castigo)
Afecta la
ocurrencia
futura de la
conducta
Primeras Investigaciones sobre el Condicionamiento
Instrumental
Inventó una serie de cajas problema, en las que
ubicaba a un perro, a un pollo o a un gato
hambriento. Fuera de la caja colocaba algo de
comida. La tarea del animal (generalmente un
gato), consistía en aprender cómo salir de la caja
Thorndike
(1874-1949)
Primeras Investigaciones sobre el Condicionamiento
Instrumental
Cuando un gato se situaba inicialmente en una caja, desplegaba una variedad
de respuestas típicas de un animal confinado. Alguna de esas respuestas
eventualmente daban como resultado la apertura de la puerta
Primeras Investigaciones sobre el
Condicionamiento Instrumental
Primeras Investigaciones sobre el
Condicionamiento Instrumental
Eso hizo hipotetizar a Thorndike que
el aprendizaje se compone de una
serie de conexiones entre un
E
R
que se fortalecen cada vez que
generan un estado de cosas
satisfactorio para el organismo.
Aproximaciones Modernas al Estudio del
Condicionamiento Instrumental
Procedimientos de ensayo discreto: cada ensayo de
entrenamiento termina con la retirada del animal del
aparato y la respuesta instrumental se realiza sólo una
vez durante cada ensayo.
Ejemplo:
método de
Thorndike
Procedimientos de operante libre: permiten que el
animal repita la respuesta instrumental una y otra vez
sin restricciones. Ejemplo: método de Skinner
Ensayo Discreto Vs. Operante Libre
Ensayo discreto:
Ej: cajas problemas, laberintos
Sólo se da una respuesta instrumental en cada ensayo
Ensayo Discreto Vs. Operante Libre
Ensayo discreto:
Ej: cajas problemas, laberintos
 El experimentador decide cuándo puede responder el animal
 Medimos la Latencia: tiempo que tarda en abandonar la caja
de salida (en el laberinto) o en dar la respuesta correcta
(caja-problema)
 Medimos la Velocidad de la carrera (en el laberinto)
Aproximaciones Modernas al Estudio del
Condicionamiento Instrumental
Respuesta operante: se produce a partir del efecto que produce en el
ambiente. Las actividades que producen el mismo efecto conductual se
consideran ejemplos de la misma respuesta operante
Entrenamiento y moldeamiento al comedero:
El entrenamiento se lleva a cabo por condicionamiento clásico: se aparea el
comedero con el sonido que hace el dispensador de comida al entregar el
alimento
El moldeamiento se hace a través de dos procedimientos:
 Reforzamiento de aproximaciones sucesivas
 No reforzamiento de formas de respuesta más tempranas
Operante Libre (Skinner)
Unidad de medida
La tasa de respuesta es la medida que
suele usarse en el condicionamiento
operante
Medimos la tasa de ocurrencia de la
respuesta operante. Ej: “8 pulsaciones
de la palanca por minuto”. Cuanto más
probable es la conducta, mayor tasa de
respuesta.
Según la ley del efecto, una conducta
seguida de una consecuencia positiva
aumenta su tasa de ocurrencia
Procedimientos de Condicionamiento
Instrumental
Reforzamiento
positivo
El reforzamiento siempre
produce un incremento de
la respuesta operante
Reforzamiento
negativo
La respuesta produce un estímulo apetitivo
Evitación: La respuesta previene la
ocurrencia de un estímulo aversivo
Escape: la respuesta elimina la presencia de
un estímulo aversivo
El
castigo
siempre
produce un decremento
de la respuesta operante
Castigo
Positivo: la respuesta produce un estimulo
aversivo
Negativo: la respuesta elimina la ocurrencia
de un estímulo apetitivo (también se le
conoce como entrenamiento de omisión)
Elementos Fundamentales del
Condicionamiento Instrumental
La respuesta instrumental
Normalmente el reforzamiento produce conductas estereotipadas, ya que
reduce la variabilidad de la conducta
Conductas variadas ------reforzamiento------conductas estereotipadas
Pero también es posible reforzar la variabilidad. Con lo que aumentamos la
variabilidad de la conducta mediante reforzamiento
Ej: sólo recompenso al animal cuando lleva a cabo un patrón de respuestas
novedoso
Elementos Fundamentales del Condicionamiento Instrumental
Elementos Fundamentales del Condicionamiento Instrumental
Por ejemplo:
Si un niño le da un abrazo a su
madre (conducta afectiva), será más
efectivo reforzar esa conducta
dándole un abrazo, que un helado.
Si un joven ha estado coqueteando
con una chica, seguramente será
más reforzante para el que ella le
sonría y acepte darle el número de
su teléfono a que ella le diga que le
encantan sus zapatos
Elementos Fundamentales del Condicionamiento Instrumental
Sistemas de conducta y La efectividad del condicionamiento instrumental para el
limitaciones
en
el incremento de la respuesta operante, dependerá de la
condicionamiento
compatibilidad de esa respuesta con la organización preinstrumental
existente en el sistema de conducta
Elementos Fundamentales del Condicionamiento Instrumenta
Elementos Fundamentales del Condicionamiento Instrumenta
Contraste
positivo
Contraste
negativo
Elementos Fundamentales del Condicionamiento Instrumenta
Elementos Fundamentales del Condicionamiento Instrumenta
Contigüidad y Contingencia
El reforzamiento inmediato es
más
efectivo
que
el
demorado.
Por qué el condicionamiento es
tan sensible a la demora?. Una
de las explicaciones es que en el
intervalo que existe entre la
respuesta (R1) y el reforzador,
están ocurriendo otras conductas
(R2, R3, R4…etc). Se hace difícil
que el animal establezca la
relación entre R1 y el reforzador,
cuando el reforzador se entregó
en R6.
Contigüidad y Contingencia
Existen dos procedimientos para evitar esto:
• Usar un reforzador condicionado secundario: se usa el reforzador
secundario (un click) en cuanto el animal realiza la conducta operante, aunque
posteriormente se entregue el reforzador primario (comida).
Ejemplo: el profesor hace una pregunta, un alumno responde de manera
acertada. El profesor responde: “eso es correcto!” (reforzador secundario),
hasta que posteriormente le coloca una buena calificación .
• Procedimiento de marcado: se hace distinguible la conducta operante
correcta de otras incorrectas. Por ejemplo, retirar al animal del ambiente
experimental y ubicarlo en un espacio distinto, mientras transcurre la espera del
reforzador
Ejemplo: En una institución donde se atiende a las personas por su número de
cédula, a aquellos que hayan asistido con el número que corresponde
(conducta), se les permite el acceso a la institución, donde deben esperar ser
atendidos (reforzador)
Contigüidad y Contingencia
Diferencias entre contingencia y contigüidad.
Contingencia: la entrega del reforzador depende de la ocurrencia de la conducta:
• te portaste bien (conducta), por lo que te compré un helado (reforzador)
• Reprobaste el examen (conducta), no podrás ir a la fiesta (castigo -)
Contigüidad: la cercanía temporal entre la emisión de la conducta y la entrega del
reforzador
Algunas investigaciones han llegado a concluir que es la contigüidad y no la
contingencia el elemento clave en el reforzamiento instrumental
Un experimento clave en esta discusión fue el experimento de superstición de
Skinner. Según el cual la entrega reforzamiento temporal originó conductas
supersticiosas. Skinner lo interpretó como que la contigüidad entre el reforzador y
la conducta operante “X” había dado lugar a conductas supersticiosas.
Contigüidad y Contingencia
Contigüidad y Contingencia
Contigüidad y Contingencia
Efecto de la controlabilidad de los reforzadores.
Una contingencia fuerte entre una respuesta y la entrega de reforzador significa que
la respuesta controla el reforzador
Cuando esto no ocurre se produce el fenómeno conocido como indefensión
aprendida:
Los experimentos de indefensión aprendida utilizan el modelo triádico
Efecto de la controlabilidad de los reforzadores.
Una contingencia fuerte entre una respuesta y la entrega de reforzador significa que
la respuesta controla el reforzador
Cuando esto no ocurre se produce el fenómeno conocido como indefensión
aprendida:
Los experimentos de indefensión aprendida utilizan el modelo triádico
Experimento de Indefensión Aprendida
Luz roja,
indica cuando
comenzarán las
descargas
LADO A
las rejillas del
piso
suministran
descargas
eléctricas
LADO B
las rejillas del
piso no
suministran
descargas
eléctricas
En la primera fase: cuando se enciende la luz roja, se comienzan a suministrar
descargar eléctricas en el lado A de la jaula, el perro logra escapar saltando hacia el
lado B que no está electrificado
En la segunda fase: vuelve a darse descargas eléctricas cuando se enciende la luz,
pero el perro no puede saltar hacia el lado B porque la barrera es muy alta. El perro
queda confinado al lado A
En la tercera fase: se vuelve a poner la barrera a la altura inicial, pero ya el perro no
intenta saltar. Se ha instaurado la indefensión aprendida
Diseño triadico en la Indefensión Aprendida
Grupo
Fase
de exposición
Grupo E Descarga escapable
Fase de
Condicionamiento
descarga escapable
Prueba
aprendizaje rápido del escape
Grupo A Descarga acoplada inescapable descarga escapable
aprendizaje lento del escape
Grupo C Confinado al aparato
aprendizaje rápido del escape
descarga escapable
por la exposición a descargas inescapables e incontrolables los sujetos aprenden
que las descargas son independientes de su conducta, que son incontrolables
Descargar

Diapositiva 1