domingo, 25 de marzo de 2018

Condicionamiento clásico y condicionamiento operante

Se llama condicionamiento a la forma de aprendizaje que consiste en provocar la asociación de un estímulo (hecho o situación del ambiente capaz de provocar una determinada conducta de un organismo) y una respuesta (conducta observable de un organismo provocada por una estimulación) que no se encuentran relacionados de modo natural. Los psicólogos distinguen dos formas de condicionamiento: el condicionamiento clásico o pavloviano (llamado así por fundarse en el experimento realizado por el neurofisiólogo ruso Iván Pávlov) y el condicionamiento operante, instrumental, por ensayo y error o skinneriano (esta última denominación procede del psicólogo americano Burrhus Frederic Skinner). En pocas palabras, la diferencia entre ambos es que el primero es un aprendizaje reactivo (el organismo aprende a reaccionar ante un estímulo) y el segundo es un aprendizaje activo (el organismo aprende a hacer algo para obtener un resultado).

1. El experimento de Pavlov
Iván Pávlov es el principal representante de la reflexología rusa, movimiento que desde principios del siglo XX, e impulsado por el gobierno soviético después de la revolución de 1917, abordó el estudio de la conducta animal y humana desde un enfoque netamente fisiológico. Premio Nobel de Medicina en 1904 por sus estudios sobre los procesos digestivos, fue este tema de investigación el que le llevó a idear el experimento que le dio mayor fama.
El sujeto del experimento era un perro. Pávlov había observado que a veces salivaba sin tener delante la comida. Puesto que la salivación es un puro reflejo, intentó comprobar si era posible condicionarla, es decir, lograr su aparición ante estímulos que en situaciones normales no producían esa respuesta. 
Al mismo tiempo que ofrecía la comida al perro, Pávlov hacía sonar una campanilla, de tal manera que ambos estímulos (sonido y comida) se presentaban siempre de forma simultánea. Durante un tiempo, Pávlov repitió esa experiencia con el objeto de acostumbrar al perro. Un día probó a suprimir la comida; al oír la campanilla, el animal comenzó a salivar. Quedaba demostrado que el perro había adquirido una nueva conducta. Lo importante del experimento radicaba en que se había condicionado su respuesta a través de una técnica de aprendizaje.

2. Análisis del experimento
Partimos de que la salivación del perro al percibir la comida es una respuesta refleja, natural y no aprendida (probablemente adquirida por los antepasados del perro en el curso de la evolución: salivar antes de tener la comida en la boca es una forma de ganar tiempo al comer, reduciendo la probabilidad de perder el alimento ante la necesidad de huir). Pávlov llamó a la comida estímulo incondicionado (EI), mientras que designó al reflejo de la salivación como respuesta incondicionada (RI).

EI → RI

Se denomina estímulo neutro (EN) al estímulo que, en principio, no provoca la respuesta que estamos estudiando: en este caso la campanilla (puede provocar otras respuestas, por ejemplo que el perro levante las orejas o vuelva la cabeza hacia el lugar de donde procede el sonido). Durante el proceso de condicionamiento ambos estímulos, incondicionado y neutro, se presentan juntos, y el resultado de esta asociación sigue siendo la misma respuesta incondicionada.

EI + EN → RI (n veces)

El proceso concluye cuando, al presentar el estímulo neutro sin el estímulo condicionado, el perro emite la misma respuesta. En ese momento el estímulo neutro se convierte en estímulo condicionado (EC) y la respuesta que produce es ahora respuesta condicionada (RC).

EN/EC → RC

2. Extinción, generalización y discriminación del condicionamiento
Pávlov también estudió la manera de eliminar la conducta aprendida. Para ello intentó suprimir la relación entre estímulo y respuesta condicionados. Así, tras sucesivos sonidos de la campanilla sin que simultáneamente se le presentase la comida, el perro dejó de salivar ante el sonido. A este proceso lo llamó extinción del condicionamiento. 
El perro puede aprender a salivar no sólo ante el sonido de la campanilla, sino ante otros estímulos similares: un timbre, una música, etc. Se habla entonces de generalización del estímulo. También puede darse el proceso contrario: el perro reacciona cuando la campanilla suena tres veces, pero no cuando suena dos o cuatro. En este caso estamos ante una discriminación del estímulo. 

3. Condicionamiento clásico y publicidad
El mecanismo publicitario básico, unas veces burdo y otras más sutil, consiste en asociar dos estímulos, uno en principio neutro (el producto que se quiere vender) y otro que se encuentre relacionado con experiencias deseables para el sujeto. Un ejemplo (burdo) de este procedimiento es el anuncio de un automóvil en el que una modelo se va despojando de la ropa hasta quedar totalmente desnuda dentro del mencionado coche. ¿Qué relación tienen el coche y la modelo desnuda? La misma que tienen la campana y la comida, simplemente aparecen juntos. Eso basta para que la reacción provocada por uno de estos estímulos, o una reacción similar, empiece a aparecer también ante el otro.
¿De verdad alguien compra un coche por aparecer asociado a la modelo? Todo el mundo dirá que no, pero lo cierto es que los empresarios siguen financiando este tipo de anuncios porque son eficaces. Independientemente de que terminemos comprando o no el automóvil, nuestra valoración del mismo habrá mejorado simplemente por haberlo visto a la vez que una mujer sexualmente atractiva; y este cambio de opinión habrá ocurrido en nosotros de forma inconsciente e involuntaria y, por tanto, sin que hayamos tenido ninguna posibilidad de oponernos racionalmente a él.

No siempre es tan fácil identificar el estímulo incondicionado como en este ejemplo, pero siempre se trata de presentar situaciones, en uno u otro sentido, "deseables": diversión, amistad, amor, armonía familiar, juventud, belleza, éxito... Es importante conservar intacta nuestra capacidad crítica para no llenarnos de falsas necesidades cuya satisfacción probablemente no nos hará más felices, sólo más caprichosos.
 En 1920, Watson pasó a trabajar en el sector publicitario. En la imagen de la derecha vemos unos de los anuncios de su campaña para Camel, en que aparecen claramente asociados el paquete de cigarrillos (estímulo condicionado) con al menos tres estímulos incondicionados: el prestigio asociado a una figura de autoridad (el presidente Roosevelt), la expresión de satisfacción desbordante de éste y una escasamente disimulada alusión sexual en el tamaño, forma y orientación del cigarrillos. 

4. El aprendizaje por ensayo y error

 4.1. Experimentos de Thorndike y cajas de Skinner   
A diferencia del condicionamiento clásico, en esta otra clase de condicionamiento (llamado operante, instrumental o aprendizaje por ensayo y error) se trata de conductas activas: el sujeto no se limita a reaccionar, sino que, para aprender, debe actuar o utilizar su conducta instrumentalmente, es decir, como un medio para alcanzar los fines propuestos.
Aunque el representante más famoso y polémico de esta forma de aprendizaje fue Skinner, los experimentos sobre aprendizaje por ensayo y error se iniciaron con Edward Thorndike, a principios del siglo XX. La situación experimental era siempre muy parecida: un animal hambriento (por ejemplo, un gato) era colocado dentro de una jaula, con el alimento a la vista pero no a su alcance. En esa situación, el animal debía aprender a abrir la puerta de la jaula con acciones simples como empujar una palanca, tirar de un cordel, etc. El animal, excitado y hambriento, efectuaba una serie de movimientos al azar (ensayos) hasta que, por casualidad, daba con la conducta que le permitía salir. Si se repite la misma situación experimental con el mismo animal, éste tardará menos en dar con la respuesta adecuada, y así sucesivamente hasta que finalmente prescinda de ensayos: la conducta ya ha sido aprendida.

Skinner perfeccionó los experimentos de Thorndike inventando las conocidas como cajas de Skinner: cámaras diseñadas específicamente para la investigación con animales, que incluyen palancas, trampillas, mecanismos eléctricos, luces, etc. Se introduce a un animal (rata, paloma, gato...) para observar su comportamiento y condicionar algunas de sus respuestas. Al principio, el animal actúa al azar: toca indistintamente todos los mecanismos sin ninguna estrategia definida. Sin embargo, cuando presiona determinada palanca se abre una trampilla que contiene una porción de comida. Según aumentan los ensayos, el animal disminuye el número de tentativas al azar, hasta que finalmente aprende a presionar la palanca adecuada cada vez que tiene hambre, prescindiendo de todas las demás.

 4.2. Refuerzos y castigos  
Con el fin de modificar la conducta, Skinner y otros psicólogos experimentales utilizan premios (refuerzos) y castigos. Recordemos que un refuerzo es cualquier estímulo que aumente la probabilidad de que cierta conducta vuelva a ser ejecutada, mientras que un castigo es un estímulo que disminuye esa probabilidad.
En general, se distinguen dos grandes tipos de refuerzos:
  • Positivos. Se otorga una recompensa o gratificación cuando el sujeto ha llevado a cabo la conducta deseada (por ejemplo, la comida que se da a un animal por empujar la palanca deseada).
  • Negativos. Como resultado de la conducta se suprime algo desagradable o doloroso para el organismo (por ejemplo, en un laberinto con el suelo electrificado, se suprime la corriente cada vez que la rata recorre el camino correcto).
Igualmente, los castigos pueden ser de dos tipos:
  • Positivos (también llamados estímulos aversivos). Una conducta es acompañada de estímulos dolorosos para el sujeto (por ejemplo, administramos una pequeña corriente a la rata que empuja una palanca equivocada).
  • Negativos. Como resultado de la conducta, el organismo pierde una situación agradable (por ejemplo, un padre castiga a su hijo dejándolo sin salir el fin de semana).
Además del concepto de refuerzo es importante entender también en este tipo de aprendizaje la idea de señal o estímulo discriminativo (equivalente aproximado del estímulo condicionado del condicionamiento clásico, como el refuerzo viene a equivaler al EI). El estímulo discriminativo es aquel que el animal debe aprender a reconocer para saber cuándo debe emitir la respuesta operante: por ejemplo, se puede enseñar a presionar el botón con una figura dibujada, o sólo cuando haya una luz encendida, etc.

 4.3. Programas de refuerzo 
Una vez asumida la idea básica del condicionamiento operante, que no deja de ser una tautología (la conducta reforzada es más probable que se repita que otra conducta que no ha sido reforzada), se pueden diseñar las técnicas para que un organismo adquiera o abandone un tipo de conducta. A estas técnicas, cuya base es distribuir los refuerzos en el proceso de aprendizaje para conseguir los efectos deseados, se les da el nombre de programas de refuerzo.
Es fácil entender que se consiguen aprendizajes más duraderos si no se refuerzan todas las respuestas adecuadas, sino sólo parte de ellas (en el primer caso, la conducta se extinguirá tan pronto como dejemos de administrar refuerzos). Estos programas de refuerzo parcial pueden clasificarse, a su vez, en:
1.- Programas de razón fija: Se administra el refuerzo tras un cierto número, siempre el mismo, de respuestas adecuadas (por ejemplo, una de cada diez veces que la rata presione la palanca se le premia con la comida).
2.- Programas de razón variable: El número de respuestas que precede al refuerzo es variable, pero bien en torno a un valor promedio, bien con un valor progresivamente ascendente (por ejemplo, primero cada dos respuestas, luego cada tres, cada cuatro, etc.).
3.- Programas de intervalo fijo: El refuerzo se administra al aparecer la primera respuesta adecuada tras pasar un tiempo determinado (por ejemplo, media hora) desde el refuerzo anterior.
4.- Programas de intervalo variable: El refuerzo de administra tras un periodo cuya duración varía; como en los programas de razón variable, los intervalos pueden oscilar en torno a un promedio, o pueden aumentar progresivamente su duración.

 4.4. Generalización, discriminación e indefensión aprendida 
Igual que los aprendizajes por condicionamiento clásico, en los que se realizan por ensayo y error, también encontramos los fenómenos de generalización y discriminación, en este caso tanto de estímulos como de respuestas.
Planteemos una situación imaginaria: tengo un perro al que he enseñado a avisarme con un ladrido cada vez que alguien abre la puerta de mi habitación. Veamos ejemplos de los fenómenos señalados:
  • Generalización de estímulo: el perro también emite un ladrido cuando alguien abre la puerta principal de la casa.
  • Discriminación de estímulo: el perro no emite un ladrido si soy yo el que abre la puerta.
  • Generalización de respuesta: el perro emite un ladrido cada vez que busca llamar mi atención.
  • Discriminación de respuesta: el perro emite un ladrido si quien abre la puerta es uno de mis padres y dos si es uno de mis hermanos.
¿Qué ocurrirá si, haga lo que haga, el animal no recibe ningún refuerzo o no tiene forma de evitar un determinado castigo? En ese caso aparece el fenómeno bautizado como indefensión aprendida: simplemente se deja de aprender y se adopta una actitud pasiva. En 1967, el psicólogo Martin Seligman realizó una experiencia con dos perros encerrados en jaulas: a ambos les fueron administradas descargas eléctricas, pero a uno se le ofreció la posibilidad de suprimirlas empujando una palanca y al otro no, hiciera lo que hiciera las descargas continuaban. El segundo perro, como era de esperar, cayó en el estado de indefensión aprendida (lo más similar entre los animales a la depresión humana). Pero ahí no acabó su triste historia: al repetir la situación, pero ahora con los dos perros pudiendo empujar la palanca para suprimir las descargas, el primero lo hacía enseguida y el segundo seguía sin hacer nada, no luchaba contra las descargas a las que parecía tomar como inevitables. La indefensión aprendida le había incapacitado para nuevos aprendizajes.

5. Burrhus Frederic Skinner
Nacido en Pensilvania en 1904, su intención primera era dedicarse a la literatura (de hecho, uno de sus libros más conocido es una novela, Walden Dos), pero pronto comprendió que carecía de talento para ello. Impresionado por las críticas de Russell al conductismo de Watson, se dedicó a reivindicar a este último, recuperando su radicalismo y enriqueciéndolo con nuevas aportaciones (básicamente la ley del efecto de Thorndike, origen del condicionamiento operante). Conocido por sus famosas "cajas de Skinner", diseñó una de ellas (en realidad, una cuna) para su propia hija Deborah, hecho por el que sería después duramente criticado. Fueron también famosos sus experimentos con palomas que le sirvieron para explicar la formación de supersticiones, así como la polémica que mantuvo con Noam Chomsky sobre el origen del lenguaje. En su ensayo filosófico Más allá de la libertad y la dignidad (1971), propone una tecnología de la conducta partiendo del presupuesto de que el ser humano está absolutamente condicionado por sus aprendizajes. Skinner murió el 18 de agosto de 1990 en Cambridge, Massachusetts.

No hay comentarios:

Publicar un comentario