25
Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Embed Size (px)

Citation preview

Page 1: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Programas de reforzamiento y conductas de elección

Ps. Rafael Cendales ReyesUniversidad El Bosque

Page 2: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Programas de reforzamiento

• Los programas de reforzamiento son "reglas", que determinan cuándo seguirá la entrega o presentación contingente de un reforzador a la presentación de una respuesta o conducta.

Page 3: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque
Page 4: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Reforzamiento continuo

• Se refuerza cada respuesta dada. Una operante que alcanza su tasa máxima es mantenida en toda su fuerza sólo si se la continúa reforzando. Las operantes obtenidas por este tipo de reforzamiento se extinguen rápidamente cuando se descontinúa el reforzamiento.

Page 5: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Reforzamiento intermitente

• La operante es reforzada ocasionalmente. Las operantes obtenidas mediante este tipo de Reforzamiento tardan mucho más en extinguirse.Reforzamiento de razónReforzamiento de intervalo

Page 6: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Reforzamiento de Razón

Sólo se refuerza la conducta después de un número de respuestas. Se utiliza un contador.

Programa de Razón Fija: El número de respuestas requeridas para el reforzamiento deben ser constante. Ej: que paguen por la venta de cada 5 celulares. Cuando se grafica su curva muestra frecuentes pausas.

Programa de Razón Variable: El número de respuestas requeridas para el reforzamiento deben ser Variable. Nos proporciona una alta tasa de respuestas sin pausas apreciables, su curva es más regular Ej: juegos de azar (por eso sontan adictivos)

Page 7: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Reforzamiento de Intervalo• La respuesta sólo es reforzada después de cierto tiempo .Se utiliza un

tomador de tiempo (cronometro). Generalmente produce menor tasa que en los de razón.

Programa de intervalo Fijo: Se refuerza después que haya pasado un intervalo fijo de tiempo a partir del último reforzamiento. Ocasiona que no haya respuestas inmediatamente después del reforzamiento, pero la tasa aumenta gradualmente y alcanza su máximo inmediatamente antes del próximo reforzamiento. Cuando se grafica no es constante.

Programa de intervalo Variable: Una respuesta es reforzada después de un intervalo de tiempo que puede variar, por ejemplo desde segundos, hasta horas, a partir del último reforzamiento. La tasa es relativamente constante

Page 8: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Conducta de elección

• Los experimentos en los que se mide una sola respuesta ignoran parte de la riqueza y complejidad de la conducta.

• Incluso en una situación simple, los organismos realizan diversas actividades y continuamente eligen entre alternativas posibles.

• La situación de elección más sencilla es una que contiene dos alternativas de respuesta, cada una de las cuales es seguida por un reforzador de acuerdo con su propio programa de reforzamiento.

Page 9: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Programa de reforzamiento múltiple

• Consiste en dos o más programas independientes, los cuales se presentan al organismo en forma sucesiva, cada uno de ellos en presencia de un estímulo característico. Los programas múltiples son programas combinados, en los que se agrega un estímulo discriminativo característico.

Page 10: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Programa concurrente

• Están formados, también, por dos o más programas. A diferencia del múltiple, los programas no son sucesivos, sino simultáneos; es decir, que el sujeto puede emitir dos respuestas distintas que se refuerzan simultáneamente por programas independientes, pero paralelos en el tiempo. Los reforzamientos previstos en cada programa son independientes entre sí. Este tipo de programa se utiliza cuando se desea reforzar más de una respuesta a la vez.

Page 11: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque
Page 12: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Medidas de la conducta de elección

• Tasa relativa de respuestas:

C1/(C1+C2)

C1: Conducta en la opción 1 C2: Conducta en la opción2

Page 13: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

• Tasa relativa de reforzamiento:

r1/(r1+r2)

r1: Conducta en la opción 1 r2: Conducta en la opción2

Page 14: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

La ley de igualación

• De acuerdo a las investigaciones de R. J. Herrnstein, la tasa relativa de respuestas en una alternativa igualaba a la tasa relativa de reforzamiento obtenida en esa alternativa.

C1/(C1+C2)= r1 / (r1+r2)

C1/C2 = r1/r2

Page 15: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Subigualación, sobreigualación y sesgo de respuesta

• Forma generalizada de la ley de igualación (Baum, 1974)

C1/C2 = p (r1/r2)s

S= sensibilidad de la conducta de elección a las tasas relativas de reforzamiento para las alternativas de

respuesta.

P= sesgo o preferencia de respuesta.

• Subigualación: menor sensibilidad de la conducta de elección a las tasas relativas de reforzamiento.

• Sobreigualación: mayor sensibilidad de la conducta de elección a las tasas relativas de reforzamiento.

Page 16: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Mecanismos de la ley de igualación

• Igualación y maximización de las tasas de reforzamiento– Maximización molecular: Se elige la alternativa de

respuesta que tenga mayor probabilidad de ser reforzada en el momento.

– Maximización molar: Se distribuyen las respuestas entre varias alternativas de modo que se maximice la cantidad de reforzamiento que obtienen a largo plazo.

– Mejoramiento: las respuestas se distribuyen de tal manera que se mejoren las tasas locales de reforzamiento .

Page 17: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Taller• Imagine que se divierte con un juego de video en el que puede

presionar botones para hacer que sucedan cosas en la pantalla. Hay dos botones que puede presionar y las consecuencias sobre la pantalla (los reforzadores) están programadas de acuerdo a dos programas de reforzamiento distintos. Con base en lo anterior: – Llene el valor faltante para satisfacer la ley de igualación en

los dos escenarios que se presentan abajo.Izquierda Derecha

Respuestas 25 20

Reforzadores 100 x

Izquierda DerechaRespuestas x 80

Reforzadores 12 96

Page 18: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

• Suponga ahora que la respuesta es reforzada con un programa IF5¨ en el lado izquierdo y con un programa IF20¨ en el lado derecho. Según la ley de igualación, ¿qué porcentaje de cantidad total de tiempo debería dedicarse al lado izquierdo y al lado derecho?

• Digamos que tenemos dos programas concurrentes y que los reforzadores se distribuyen de la siguiente manera r1=65% y r2=35%. Dado lo anterior, ¿Qué valores tendríamos para R1 y R2 si ocurriese un total de 200 respuestas?

Page 19: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Elección compleja• En la vida, las elecciones importantes implican

un beneficio pequeño a corto plazo contra un beneficio mayor pero más demorado. Éste es en esencia el problema del autocontrol.

• Para estudiarlo, se ha usado el programa de reforzamiento encadenado-concurrente. En éste, una vez el participante ha hecho su elección, se queda con ésta, lo que involucra una elección con compromiso

Page 20: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

A B

Programa de reforzamiento 1

Programa de reforzamiento 2

Eslabón de elección

Eslabón Terminal

Page 21: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Estudios sobre el autocontrol

• De acuerdo a las investigaciones de Rachlin y Green, las recompensas cambian a favor de la recompensa demorada grande a medida que se exige que los participantes esperen más tiempo para recibir cualquiera de las recompensas después de hacer su elección.

• Si las recompensas son entregadas poco después de una respuesta de elección, los sujetos prefieren la recompensa pequeña e inmediata.

Page 22: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Reducciones del valor y explicaciones del autocontrol

• El valor de un reforzador se reduce según el tiempo que tenga que esperarse para recibirlo.

• Función de descuento del valor:

V=M/(1+KD)V=valor de un reforzador

M= magnitud de la recompensaD= demora de la recompensa

K= parámetro de la tasa de descuento

Page 23: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Funciones de descuento del valor e impulsividad de la conducta humana

• Diversos estudios demuestran que la función de descuento de la recompensa (K) mide una característica importante de la conducta que es pertinente para el autocontrol en una amplia variedad de situaciones.

Page 24: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

Taller

• Describa una situación en la que a alguien le resultara difícil mostrar autocontrol .

• ¿Cuáles son los dos reforzadores en esa situación? ¿Cómo difieren su valor?

• ¿Qué reforzador ocurre con una demora más corta?

• ¿Qué tácticas podrían alentar el autocontrol en esa situación?

Page 25: Programas de reforzamiento y conductas de elección Ps. Rafael Cendales Reyes Universidad El Bosque

• Considere el valor percibido de obtener 100 dólares hoy. En la tabla de abajo, indique qué tan valiosos serían los 100 dólares para usted si recibe el dinero hoy, mañana en 30 días, en 150 días o en 300 días a partir de ahora. Grafique los resultados.

Demora de la entrega en días Valor percibido de $100

0

1

30

150

300