Upload
jusere
View
160
Download
19
Embed Size (px)
Citation preview
PETEB H. LINDSA..Y DONA..LD A... NOBMA..N
PR,OCES1\JllENTO DE
INFORM1\CION HlTMANA
Una introducción a la Psicología
�f PEBCJEPCJION
Y BECJONOCJIMIENTO DE FORMAS
EDITORIAL TECNOS·
SERIE DE FILOSOFIA Y ENSAYO
Dirigida por MANUEL GARRIDO
ABELLÁN, José Luis: Miguel de UnamU!lo a la luz de la psicologia. Una interpretación de Unamuno, desde Ja psicologia individual.
ABELLÁN. José Luis: Ortega y Gasset en la filosofia españolas. Ensayos de apreciación. CouTURAT, Louis: El álgebra de la lógica. DíAz, Elias: Revisión de Unamuno. Análisis crítico de su pensamiento político. DOPP, Joseph: Nociones de lógica formal. ENJUTO BERNAL. Jorge: La filosoffo de Alfred North Whitehead. FANN, K. T.: El concepto de Filoso.fia en Wittgenstein. FERNÁNDEZ DE CASTILLEJO, José Luis: Actualidad y participación. Una filosofia
contemporánea. FERRATER MORA, J. , y otros: Filosofia y ciencia en el pensamiento español contemporá-
neo ( 1960-1970). GARRIDO, M.: Lógica simbólica. GURMÉNDEZ, Carlos: Ser para no ser. Ensayo de una dialéctica subjetiva. HASENJ AGER, G., y otros: La .filoso.fia cientifica actual en Alemania. HIERRO, José S.-P. : Problemas de análisis del lengua;e moral HINTIKKA, J.: Lógica. Juegos de lenguaje e información. HuGHES, John B.: José Cadalso y las «Cartas Marruecas». LAKl\.TOS, Imre: Historia de la Ciencia y sus reconstrucciones racionales. LINDSAY, P. H., y NORMAN, D. A.: Procesamiento de Información Humana. Vol.
11: Memoria y lenguaje. LORENZEN, Paul: Metamatemática. LORENZO, J. de: La filosofia de la matemática de Ju/es Henri Poincaré. LORENZO, J. de: Introducción al estilo matemático. M.uriN SANTOS, Luis, y otros: Ensayos de filosofia de la ciencia. Simposio de
Burgos. En torno a la obra de Karl R Popper. MATES, Benson: Lógica matemática elemental. MouLOUD, Noel: Lenguaje y estructuras. NICOL, Eduardo: El problema de la filosofia hispánica. NICOL, Eduardo: Historicismo y existencialismo (2.ª ed.). PARls, Carlos: Hombre v naturaleza. PRIOR. A. N.: Historia de la Lógica. QuINE, W. V.: La relatividad ontológica-y otros ensayos. QUINTANILLA, Miguel A.: Idealismo y filosofia de la ciencia. Introducción a la
Epistemologia de Karl R. Popper. RAMA, Carlos M.: Teoría de la historia. Introducción a los estudios históricos
(3.ª ed.). RODIÚOUEZ PANIAGUA, José M.': Hacia U/la concepción amplia del Derecho natural. RomÚGUEZ PANIAOUA, José M.ª: Marx y el problema de la ideología, SÁNCHEZ DE LA TORRE, Angel: Los griegos y el Derecho natural. SoTELO, Ignacio: Sartre y la razón dialéctica. TIERNO GALVÁN, Enrique: Acotaciones a la historia de la cultura occidental en la
Edad Moderna. TIERNO GALVÁN, Enrique: Razón mecánica y razón dialéctica,
.� . . ; . . , .
.
.
!.' '
k 1 !'
PROCESAMIENTO DE INFORMACION HUMANA
PETER H. LINDSA Y DONALD A. NORMAN
PROCESAMIENTO DE
INFORMACION
HUMANA
U na introducción a la Psicología
*
PERCEPCION Y RECONOCIMIENTO
DEFORMAS
EDITORIAL TECNOS MADRID
Los derechos para la versión castellana de la obra
Human Information�rocessing
An lntroduction to Psychology
publicada por Academic Press, lnc., Nueva York
Copyright© 1972, by Academic Press, lnc. son propiedad de Editodal Tecnos, S. A.
Traducción por
JULIO SEOANE y
CARMEN GARCIA TREVIJANO
©EDITORIAL TECNOS , S. A., 1976 O'Donnell, 27. Madrid-9
ISBN 84-309-0563-4 (obra completa) _ISBN 84-309-0564-2 (tomo 1)
Depósito Legal: M-10.650 - 1975 - 1
Printed in Spain. Impreso en España por Gráficas Lormo - Isabel Méndez. 15 - Madrid-18
CONTENIDO.
PROLOGO ...................... ...................... .......... Pág . XI
RECONOCIMIENTOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . XIII
NOTAS AL LECTOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x1x
l. LA PERCEPCION HUMANA . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Interpretación de mensajes sensoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Patrones de comparación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Reconocimiento de formas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Organización de imágenes atenuadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Organizaciones en competencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Organización de percepciones auditivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Organización sin significado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Ajuste de los datos sensoriales a la interpretación. . . . . . . . . . . . . . . . . . . . . . 14
La importancia de las reglas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Percepción del espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Organizaciones imposibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
La importancia del contexto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Análisis de características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 Fijación de Ja imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Posefectos......................................................... 40·
Posefectos del movimiento ........ �............................... 40 Cómo buscar los posefectos del movimiento . . . . . . . . . . . . . . . . . . . . . . . 40 Posefectos del color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
La explicación de los. posefectos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Adaptación orientada hacia un color específico . . . . . . . . . . . . . . . . . . . . . . . . 44 Percepción sin características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 La visión con Ja piel . . . . . . . . . . . . . . . · . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Lecturas recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Percepción ............................. ............. , . . . . . . . . . . . . . 50 Arte.............................................................. 51
2. PROCESAMIENTO DE INFORMACION NEURAL. . . . . . . . . . . . . . . . . 53
El ojo de la rana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 La anatomía de los detectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Procedimientos fisiológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 La Neurona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Registro de respuestas neurales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Diseño de circuitos neurales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Circuitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Los bloques de éonstrucción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
El receptor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 La célula neural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Extracción de contornos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 Sensibilidad versus especificidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 Inhibición lateral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
VIII PROCESAMIENTO DE INFORMACION HUMANA
Circuitos de extracción de contornos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 Campos centrales-periféricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 Circuitos abiertos-cerrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 Respuestas temporales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 Circuitos para producir respuestas transitorias. . . . . . . . . . . . . . . . . . . . . . . . . 87 Respuestas al movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Circuitos para detectar el movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 La luz que se .mueve de izquierda a derecha . . . . . . . . . . . . . . . . . . . . . . . 93 La luz que se mueve de derecha a izquierda . . . . . . . . . . . . . . . . . . . . . . . 93
Procesamiento de señales en el núcleo geniculado lateral . . . . . . . . . . . . . . . . . 96 Extracción de características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 Células simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Características de la respuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 Cómo construir detectores de aberturas y de líneas . . . . . . . . . . . . . . . . . 102 Dipolos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
Células complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 Cómo construir células complejas ......................... . . . . . . . . . . . 108 Células hipercomplejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Cómo construir células hipercomplejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 Conclusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Lecturas recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Modelos del sistema nervioso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3. TEORIAS DEL RECONOCIMIENTO DE FORMAS ................. 119 Pandemónium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 C�racterísticas. para el recon
.oc.imiento de letras. . . . . . . . . . . . . . . . . . . . . . . . 122
Como constrmr un pandemomum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 La importancia de los errores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 Respuestas ante formas distorsionadas............................. 128
Características para el reconocimiento del habla . . . . . . . . . . . . . . . . . . . . . . . 130 El problema de la segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
Detectores de características del habla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 Fonemas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 Características defensivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
Resumen del análisis de características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 Análisis por síntesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 El problema del contexto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 Calcetines húmedos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 La importancia de la redundancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 La síntesis de un mensaje sensoria/ ....................... :·........... 141
La secuencia de operaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 7 Características versus expectativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 Lecturas recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
4. EL SISTEMA VISUAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 La luz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Decibelios...................................................... 157 La vía óptica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 La pupila . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 El cristalino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
Enfoque y Convergencia ......................................... 161 La retina . . . . . . . . . . . . . . . , . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 Respuestas químicas a la.fu• . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 La reacción fotoquímica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
CONTENIDO IX
Neuroanatomía de la visión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 La retícula retiniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 El camino hacia el cerebro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 Muestreo de la información visual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 Movimientos del ojo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 El canal de localización. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 Visión sin corteza visual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 Visión sin colículo superior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 Lecturas recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
5. LAS DIMENSIONES DE LA VISION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 La percepción del brillo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 Bandas de Mach................................................... 182 Contraste de brillo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
Brillo y profundidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 Adaptación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 Contornos de igual brillo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 Características temporales de la visión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 Integración del tiempo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 Cuando los destellos de luz se convierten en continuos . . . . . . . . . . . . . . . . . 201 Fluctuación crítica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 Color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 Combinación de colores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 El disco de colores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
Combinación de dos luces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 Combinación de tres luces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 Pinturas y luces. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 �o!11binación de pinturas y luces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
Pos1magenes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 Sensibilidad al color de los conos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 Teoría del proceso contrario sobre el color . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 Contraste inducido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 Lecturas recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 Visión del color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
6. EL SISTEMA AUDITIVO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227La flsica del sonido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 La frecuencia del sonido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 La intensidad del sonido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
Decibelios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 La mecánica del oído . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 El oído interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 Los movimientos de la membrana basilar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 Las células ciliares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 Respuestas eléctricas al sonido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240 Curvas de sintonización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240 Codificación temporal de las respuestas neurales. . . . . . . . . . . . . . . . . . . . . . . 242 Codificación de la información de intensidad. . . . . . . . . . . . . . . . . . . . . . . . . . 245 Procesamiento de la información acústica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
Detectores de frecuencia modulada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 Lecturas recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
7. LAS DIMENSIONES DEL SONIDO................................ 253 Sonido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
X PROCESAMIENTO DE INFORMACION HUMANA
Contornos equisonoros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254 Escuchando música . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
Compensadores de sonido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 Enmascaramiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
El experimento de enmascaramiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260 El mecanismo de enmascaramiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261 Enmascaramiento de música . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
La medida del sonido .. . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . 263 Fonos ......................................................... 263
Tono ............................................. :.. . .. . . . ....... 265 La escala musical.................................................. 265 La escala mel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266 La teoría del lugar: posición en la membrana basilar . . . . . . . . . . . . . . . . . . 267 Periodicidad del tono.. . . . . . . . . . . . . . . . . . .. .. . . . . . . . . . . . . .. .. . . .. . . . . 270
Sonido y tono . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 El caso de la equivocación fundamental . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 Evidencia contra la no linealidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274
Enmascaramiento de la equivocación fundamental . . . . . . . . . . . . . . . . . . . . . 274 La explicación de la teoría del lugar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 La explicación de la periodicidad del tono . . . . . . . . . . . . . . . . . . . . . . . . . 275 Discriminación de tono sin membrana basilar . . . . . . . . . . . . . . . . . . . . . . 276
Evidencia contra la teoría de la periodicidad del tono . . . . . . . . . . . . . . . . . . 278 La duplicidad de la teoría de la percepción del tono . . . . . . . . . . . . . . . . . . . 279
La banda crítica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
PerceJ?Ció'!. espacial auditiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
Locahzac1on. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284 Interacciones binaurales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288 Importan
.cía �e la audición binaural. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290
Locahzac1on. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 Enmascaramiento de la diferencia de nivel . . . . . . . . . . . . . . . . . . . . . . . . . 291 Enmascaramiento ............... . ......................... , . . . . . 291
Grabaciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292 El efecto de prioridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294 Lecturas recomendadas. . . . . . . . . . . . . . . . . . . • . . . . . . • . . . . . . . . . . . . . . . . . . . 295
REFERENCIAS. . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . 297
PROLOGO
Todo comenzó en el verano de 1966 cuando los dos nos encontramos en una conferencia en Driebernen. Holanda. Ambos fuimos por caminos distintos a La Jolla -PHL desde Toronto, DAN desde Harvard-. La Universidad de California acababa de comenzar un nuevo campus en San Diego y todavía no existía el programa de estudios de psicología. Decidimos enseñar conjuntamente un curso introductorio. Así comenzó Psicología 11.
Nuestra meta consistía en intentar transmitir el interés de la moderna psicología experimental a Jos estudiantes que comenzaban. Deseábamos explicar lo que nosotros, como investigadores, estábamos haciendo en nuestros laboratorios. Queríamos conseguir que los estudiantes se pusieran a trabajar activamente con los conceptos de psicología, en lugar de aprender de memoria largas listas de hechos y experimentos. Deseábamos comunicar nuestro pensamiento y cómo orientamos el estudio de Ja mente humana.
No conseguimos un éxito inmediato. Fue penoso descubrir que las cosas que nos parecían tan interesantes, no siempre eran de interés para los estudiantes: pero gradualmente aprendimos a enseñar una introducción a la psicología. A medida que se desarrollaba nuestra experiencia, lo mismo ocurría con nuestro panorama de sugerencias e ideas. El curso se afirmaba y el número de inscripciones ascendía. Pero nuestro problema ahora consistía en Ja carencia de un texto adecuado. Parecía que la única forma de conseguir uno era escribirlo nosotros mismos.
Y este es el resultado. Hemos aprendido en la enseñanza y escribimos sobre ese material. Nos ha forzado a cristalizar nuestras ideas y actualmente estamos aún más interesados en psicología que cuando comenzamos. Estamos esperando con impaciencia los avances que ocurrirán durante los próximos años. El esquema de trabajo que presentamos en este libro se ha convertido en nuestra guía para el estudio de Ja psicología.
RECONOCIMIENTOS
Muchas personas nos han ofrecido desinteresadamente su tiempo, sus esfuerzos y sus ideas. Tenemos una gran deuda con David Rumelhart por su estimulación intelectual, cuando colaboraba con nosotros tanto en investigación como en enseñanza. Tuvo un papel muy influyente en el desarrollo del modelo de memoria: el material que fundamentó los Capítulos 3 y 4 (volumen 2), y la orientac;iónpara los Capítulos 5 (volumen 2) y l (volumen 3). [Ver el trabajo de Rumelhart. Lindsay y Norman ( 1 972).]
De la misma manera, los años de participación en el «LNR research group» han influido mucho en el desarrollo de una gran parte de nuestro pensamiento, desde la percepción hasta el pensamiento. Muchos estudiantes graduados que participaban en la enseñanza, nos ayudaran (alrededor de unos cincuenta) a realizar el curso que tuvo como resultado este libro. Tanto individual como colectivamente merecen nuestro reconocimiento. En particular, sin embargo, deseamos agradecer la ayuda de Richard Meltzer, Jim Levin y Marc Eisenstadt por su dirección como «chief TA's».
Leanne Hinton colaboró con nosotros a lo largo de la redacción de todo el libro. En primer lugar, grabó en cinta, transcribió y reorganizó nuestras lecciones originales, comprobó nuestras referencias y participó en todas las fases del trabajo. Después, una vez que la tarea estuvo realizada, buscó y preparó los esquemas originales que constituyeron la composición final. Sus dibujos anatómicos, los encantadores demonios y los cuerpos deformados. ayudaron a conseguir el tono del libro y la claridad del texto. _
Cathy Cox nos ayudó a transcribir las clases que formaron los Capítulos 6 y 7 (volumen 1). Margaret Jackson nos ayudó en el trabajo editorial necesario para completar el libro. Julie Lustig inspeccionó el trabajo final. comprobando. supervisando y retocando cuando era necesario. Marlene Farnum. Julie Lustig y Martha Norman hicieron el Indice de Materias en una larga y prolongada carrera de fin de semana.
Una serie de personas leyó y nos comentó los distintos capítulos. Peter Dean ayudó en el tema de solución de problemas y en arte contemporáneo. Larry Squires leyó y comentó el Capítulo l (volumen 2), Allen Newell el Capítulo 2 (volumen 3). Georg Mandler
XIV. PROCESAMIENTO DE INFORMACION HUMANA
el Capítulo 1 7 y Ed Fantino el material sobre aprendizaje operante. Jack Nachmias y Charles Harris comentaron la versión primitiva de los Capítulos 1 -7 (volumen 1 ), y Ulric Neisser, junto con diversos críticos anónimos, ayudaron en la totalidad del libro. Deseamos agradecer especialmente a la persona que llegamos a conocer como «Crítico 3». Sus comentarios, aunque penosos, han sido esclarecedores e importantes.
Finalmente, nuestro agradecimiento a nuestros editores, que tanto han padecido, por su ayuda en la realización de esta obra. El panorama de Nueva York y San Francisco puede parecer difuso y caótico a veces, pero su ayuda nos ha hecho posible obtener el soporte editorial que permitió finalizar este trab�jo.
RECONOCIMIENTO DE FIGURAS Y TABLAS
Volumen 1
Figura 1 - 38 De M.Luckiesh, Visual illusions. Nueva York : Dover Publications, Inc., 1965. Reimpreso con el permiso del editor.
Figura 1 -45 De R. M. Pritchard, Stabilized images on the retina. Copyright, 1 96 1 por Scientific American, Inc. Reservados todos los derechos.
Figura 2-1 De Pomeranz y Chung ( 1970). Copyright, 1970 por la American Association for the Advancement of Science.
Figuras 2-6 y 4-7 De S.Polyak, The vertebrate visual system. Copyright, 1 957 por la University of Chicago Press y utilizado con su permiso.
Tabla 3-2 y Figu-ras 6-4 y 6-5 ·De Denes y Pinson (1963). Cortesía de Bel1 Tele-
phone Laboratories, Inc. Figura 5-8 De S.S.Stevens ( 196 lb). Copyright, 1961 por la
American Association for the Advancement of Science.
Figura 5- 1 8 De D.B. Judd, Basic correlates of the visual stimulus. En S.S.Stevens (Ed.), Handbook of experimental psychology. New York : Wiley, 1 951. Con el permiso de John Wiley and Sons, Inc.
Figura 5-28 De Wald ( 1964). Copyright 1 964 por la American Association for the Advancement of Science.
Figura 5-29
Figura 6- 1 1
Figura 6- 1 3
Figura 7- 1
Figura 7-2
Figuras 7-6 y 7-8
Figuras 7- 1 1 , 7-12, y 7-21
Figura 7- 1 8
Volumen 2
Figura 1 -5
Figura 2-8
RECONOCIMIENTOS XV
Basada en DeValois y Jat:obs ( 1968). Copyright 1968 por la American Association for the Advancement of Science. De G.L. Rasmussen y W.F.Windle (Eds.), Neuralmechanisms of the auditory and vestibular systems; 1960. Cortesía de Charles C. Thomas, Editor, Springfield, Illinois. La foto es de Bredberg et al. ( 1970). Copyright 1970 por la American Association for the Advancement of Science. De Robinson y Dadson ( 1956). Con el permiso del Institute of Physics and the Physical Society. Ilustración por cortesía de C.G. Conn, Ltd ., Oak Brook, Illinois. De E.Zwicker y B.Scharf, Model of loudness summation. Psychology Review, 1965, 72, 3-26. Copyright 1 965 por la American Association, y reproducida con su permiso.
De J.Zwislocki, Analysis of sorne auditory characteristics. En D. R. Luce, R. R. Bush y E.Galanter (Eds.), Handbook of mathematical psychology, Volumen 111. New York : Wiley, 1 965. Con el permiso de John Wiley and Sons, Inc. De R.R.Fay, Auditory frecuency stimulation in the goldfish (Carassius Auratus). Journal of Comparative and Physiological Psychology, 1 970, 7 3(2), 1 75- 180. Copyright 1970 por la American Psychological Association, y reproducida con su permiso.
Gráfico de E.H.Lenneberg, Biological foundationsoflanguage. NewYork: Wiley, 1967. Con el permiso de John Wiley and Sons, Inc. De B .B. Murdock,Jr., The retention of individual items. Journal of Experimental Psychology, 1 96 1 , 62, 61 8-625. Copyright 1 961 por la American Psychological Association, y reproducida con su permiso.
Figuras de la 2-11 a la 2-14 De B.B.Murdock,Jr., The serial effect of free re-
XVI PROCESAMIENTO DE INFORMACION HUMANA
Tabla 5- 1 2
Volumen 3
call. Journal of Experimen-Psychology, 1962, 64, 482-488. Copyright 1 962 por la American Psychological Association, y reproducida con su permiso. De R. Brown y C. Hanlon, Derivational comple· xity and order of adquisition in child speech. En J.R. Rayes (Ed.), Cognition and the development of language. New York: Wiley, 1 970. Con el permiso de John Wiley and Sons, Inc.
Figura 2-7 De Herbert A. Simon y Allen Newell, Human problem solving, 1971 . Con el permiso de PrenticeHall, Inc., Englewood Cliffs, New Jersey.
Figuras 4-4 y 4-5 De S.Siegal y L.E.Fouraker, Bargaining and group decision marking: Experiments in bilateral monopoly. Copyright 1 960 por McGraw-Hill, Inc. Utilizadas con el permiso de McGraw-Hill Book Company.
Figura 5- 1 4 De N . Kleitman, Sleep and wakefúlness (2.ª ed.). Copyright 1963 por la u niversity of Chicago Press, y utilizada con su permiso.
Figura 5- 1 5 Reimpresa de D.B. Lindsley, Psychophysiology and motivation. En M.R. Jones (Ed.), Nebraska symposium on motivation, con el permiso de la University of Nebraska Press. Copyright 1 957 por The University of Nebraska Press.
Figuras A-3 y A-6 y Tabla A-3 Reimpreso de S.S.Stevens, The psychophysics of
sensory function, en A.Rosenblith (Ed.), Sensory communication, con el permiso de The M .I.T. Press, Cambridge, Massachusetts. Copyright 1961 por the M.I.T. Press.
Figuras A-4 y A-5 De Stevens (l 966a). Copyright 1 966 por la Ameri
can Association for the Advancement of Science.
RECONOCIMIENTO DE TEXTOS CITADOS
B. Milner, S. Corking y H.L. Teuber, Further analysys of the hipocampal amnesic syndrome: 1 4 years follow-up study of H .M.
RECONOCIMIENTOS XVII
Neuropsychologica, 1 968, 6, 2 1 5-234. Reimpreso con el permiso de Pergamon Press.
Michael S. Gazzaniga, The bisected brain. Copyright 1 970, por Appleton-Century-Crofts, Educational Division, Meredith Corporation.
B. Spock, Baby and child care. New York : Pocket Books, Inc. Copyright 1 945, 1946, 1 957, 1 968 por Benjamín Spock, M.O. Reimpreso con el permiso de Pocket Books, una sección de Simon and Schuster, Inc.
A. A. Milne, Now we are six. Copyright 1 927 por E. P. Button, Inc. Renovación 1955 por A.A.Milne. Publicado por E.P. Dutton and Co. , Inc. and Methuen and Co. , Ltd., y utilizado con su permiso.
Khrushchev remembers, Mdth an introduction, commentary and notes by Edward Crankshaw. Traducido y editado por Strobe Talbot. Copyright 1 970 por Little, Brown and Co., Inc. y utilizado con su permiso y el de André Deutsch, Ltd.
S. Milgram, Behavioral study of obedience, Journal of Abnormal and Social Psychology, 1963, 67, 371 -378. Copyright 1963 por la American Psychological Association y reproducido con su permiso.
S. Milgram, Sorne conditions of obedience and disobedience to authority. Human Relations, 1 965, 18, 57-75. Reimpreso con el permiso de Plenum Publishing Corp.
NOTAS AL LECTOR
No conocemos todo sobre la mente humana. Pero hemos aprendido cómo buscar lo que no sabemos. Este libro introduce algunas de las técnicas que se han utilizado en esa búsqueda. En lugar de decir solamente lo que sabemos y lo que desconocemos, resaltamos la forma en que se aprenden las cosas. A lo largo del libro, intentamos desarrollar modelos específicos de fenómenos particulares. Utilizando estos modelos, podemos descubrir el razonamiento que fundamenta la explicaciones teóricas particulares, al igµal que señalan la fuerza y debilidad de las teorías.
Aunque los modelos de este libro no pueden reflejar con exactitud la complejidad y sutileza de los procesos de pensamiento humano, sin embargo, ayudan a clarificar los temas y resaltar los aspectos importantes e insignificantes de un problema. Pero se puede suponer la simplicidad de nuestros modelos. El hombre acaba de empezar a comprender su propia mente.
En el primer volumen de este libro, introducimos algunos problemas de percepción y nos preguntamos qué tipo de sistema se necesita para producir las propiedades de la percepción humana. Después de enfrentarnos con algunos de los problemas teóricos, se plantea con algún detalle los mecanismos fisiológicos reales. También se consideran las distintas maneras en que pueden construirse los circuitos neurológicos, para realizar muchos de los pasos necesarios del reconocimiento de formas. Después de examinar las propiedades básicas de los circuitos neurales de la visión y la audición, regresamos al problema general de la percepción para demostrar que lo que se conoce sobre los mecanismos fisiológicos no puede proporcionar una explicación completa del panorama: todavía están sin resolver algunos problemas psicológicos.
Nos trasladamos de la percepción y el reconocimiento de formas a la memoria, que ocupa los cuatro primeros capítulos del volumen 2. La memoria juega un papel esencial en toda la actividad intelectualhumana, y es necesario explorar detenidamente su naturaleza y funcionamiento. Comenzamos con un examen de los procesos intelectuales en los humanos, fundamentalmente de las propiedades del sistema de memoria. En el Capítulo 1 (volumen 2) se estudian fas bases neurales de la memoria, incluyendo lo que se sabe del
XX PROCESAMIENTO DE INFORMACION HUMANA
substracto fisiológico de la memoria y del deterioro de la memoria humana, provocado por distintos tipos de desórdenes fisiológicos. El Capítufo 2 introduce los trabajos sobre memoria a corto plazo
· v sobre atención. También se explora la naturaleza reconstructivade la memoria a corto plazo y su papel en ciertos aspectos de la realización humana.
En los Capítulos 3 y 4 (volumen 2), consideramos un posible modelo para representar el almacén de . información dentro de una memoria a largo plazo. Este es un área de investigación que está relativamente intacta en la moderna investigación fisiológica, aun cuando es fundamental para comprender una gran parte de los procesos mentales superiores en los humanos. Este modelo de memoria juega un papel central en los capítulos siguientes.
En la tácita división del texto, los Capítulos 5 (volumen 2)y 1-5 (volumen 3), examinan los procesos cognitivos. Sobre el fundamento del material de los Capítulos 3 y 4 (volumen 1 ), el Capítulo 5 presenta el estudio del lenguaje como un modelo de comunicación. Se resalta la comunicación porque es la razón central de la existencia del lenguaje. Se analiza el desarrollo del lenguaje en los ni�os desde este punto de vista. El Capítulo 1 (volumen 3) examma los mecanismos de aprendizaje, y las etapas de desarrollo intelectual que un niño recorre desde su nacimiento hasta la adolescencia.
En los Capítulos 2-4 (volumen 3), examinamos la conduota intelectual adulta, con un análisis de la conducta de solución de problemas, un examen de la toma de decisiones, y un análisis de las influencias sociales sobre las decisiones humanas. ' En el último capítulo, se discute la motivación y la emoción. Al hacerlo, regresamos a ciertos problemas que surgieron en los Capítulos 1 Y 3 (volumen 1). Comenzando con un modelo prototípico de sistema motivacional, exploramos la forma en que los estados químicos y biológicos del cuerpo interactúan con el conocimiento, para controlar emociones y conducta humana. Los tres volúmenes constituyen la totalidad del texto, pero quedan
todavía los apéndices que presentan cierto material más técnico. El Apéndice A discute brevemente el probleJTia de la medida en psicología y después, con mayor extensión, discute los procedir�ientos de estimación de magnitud, incluyendo algunas tareas que sirven de ejemplo. El Apéndice B presenta un problema de toma de decisión e introduce técnicas de características operantes (normalmente conocidas como curvas d' y ROC).
La literatura de una ciencia constituye su fundamentación. Nosotros introducimos esta literatura de dos maneras. Las referencias
NOTAS AL LECTOR XXI
de los puntos discutidos en el libro se citan en el texto del capítulo y en las «Lecturas Recomendadas» al final de tada capítulo. Esta sección especial sirve para distintos propósitos. En primer lugar, es una extensión, con un breve comentario, de las referencias utilizadas en el· material del capítulo. Aquí es donde tenemos más deudas hacia las fuentes de los materiales del texto. Siguiendo tanto las referencias dadas en el capítulo mismo como las que aparecen en las «Lecturas Recomendadas», es posible rastrear la historia y los detalles del material presentado dentro del capítulo.
En segundo lugar, existe una lista de lecturas que pueden utilizarse para orientar a aquellos que desean perseguir con mayor detalle cualquiera de los tópicos. Se citan artículos de revisión general y libros que cubren el material. Estas fuentes conducirán a su vez a unas lecturas aún más especializadas (y normalmente más avanzadas). Con frecuencia citamos trabajos que encontramos de interés en el curso de nuestros estudios, aun cuando es posible que no se hayan utilizado directamente en los materiales que componen el capítulo mismo. Información sobre cómo se debe buscar material de referencia adicional, se proporciona en la sección «Utilización Básica de Material de Referencia» al final del libro. La referencia completa de cualquier cita proporcionada en el texto o en las «Lecturas Recomendadas», se puede encontrar en las «Referencias» del final del libro.
1 LA PERCEPCION HUMANA
INTERPRETACIÓN DE LOS MENSAJES SENSORIALES: Patrones de comparación.-REcoNOCIMIENTO DE FORMAS: Organización de imágenes atenuadas.-Organizaciones en competencia.-Organización de percepciones auditivas.-Organización sin significado.-Ajuste de los datos sensoriales a la interpretación.-LA IMPORTANCIA DE LAS REGLAS: Percepción del espacio.-Organizaciones imposibles.-La importancia del contexto.-ANÁLISIS DE CARACTERisncAS: Fijación de la imagen.--Posefectos.-Posefectos del movimiento.-Cómo conseguir posefectos del movimiento.-Posefectos cromáticos.-La explicación de los posefectos.-Adaptación orientada hacia un color específico.--PERCEPCIÓN SIN CARACTERisTICAS: La visión con la pieL-LECTilRAS RECOMENDADAS: Percepción.-Arte.
Nuestro propósito es comprender los mecanismos de la percepción. La tarea que se nos presenta consiste en descubrir los procesos psicológicos que están actuando y todo lo que podamos del diagrama de distribución de las redes neurales implicadas. Los problemas son múltiples. Cuando leemos las letras impresas de la página de un texto, se realiza rápidamente y sin esfuerzo la conversión de los símbolos visuales de la página en frases significativas mentalmente. De la misma manera, el habla se oye como palabras significativas, no como una mezcla de sonidos que deban traducirse de algún modo para que alcancen sentido. Cuando paseamos por los alrededores, reconocemos los objetos que están ante nosotros de manera inmediata y sin ningún esfuerzo. Si se produce un sonido por la izquierda, lo escuchamos por la izquierda. Cuando subimos a una acera, aceleramos o reducimos el paso en el momento oportuno, y cuando recogemos un lápiz no se produce ningún proceso de pensamiento consciente, ni en el reconocimiento de ese objeto como un lápiz, ni en el control de los brazos y las manos para coger el objeto, ni tampoco en la forma en que tomamos el lápiz para usarlo.
INTERPRETACIÓN DE MENSAJES SENSORIALES
Comenzamos la historia de la percepción con el estudio de reconocimiento de formas: ¿cómo se convierten los signos externos,
2 PROCESAMIENTO DE INFORMACION HUMANA
que llegan a los órganos de los sentidos, en experiencias perceptivas llenas de significado? Normalmente, reconocemos los objetos y acontecimientos de nuestro alrededor con tal rapidez y facilidad aparente, que se acostumbra a suponer que las operaciones involucradas son simples y directas. Pero la experiencia de los técnicosha demostrado lo engañoso de la tarea. No existen máquinas que sean capaces de reconocer sonidos o símbolos que surgen normal-mente en el medio ambiente. Los numerosos intentos de construir sistemas de reconocimientos de formas han fracasado en la obtención de la flexibilidad y potencia de los sistemas perceptivos de losmás primitivos animales. Comenzaremos por analizar por qué es tan dificil la tarea.
Patrones de comparación
La comparación con un patrón o modelo es el más simple de todos los esquemas posibles para clasificar y reconocer formas.Según el patrón de comparación, debe existir alguna representación -un modelo o patrón- para cada una de las formas que tienen que reconocerse. El reconocimiento se consigue comparando el signo externo con el modelo interno. El que más se asemeje es el que identifica la forma que está presente.
Consideremos cómo puede trabajar un patrón o modelo para detectar las señales que se presentan visualmente. Supongamos que la tarea consiste en reconocer letras del alfabeto. De momento, vamos a pensar que cuando se presenta una letra, su imagen cae sobre la superficie posterior del ojo, el área llamada retina. La retina está compuesta de millares de células nerviosas sensibles a la luz, llamadas receptores. Los detalles de cómo actúan estos receptores se discutirán en capítulos posteriores; por ahora, veamos
Letra a reconocer
FIGURA 1-1
Receptores
LA PERCEPCION HUMANA 3 cómo pueden estar inter-relacionados para reconocer las letras delalfabeto.
Si se presenta la letra A ante los ojos, excita una configuraciónde receptores en la retina. Si tuviéramos que interconectar estosreceptores con una única célula detectora, tendríamos un modelode células receptoras diseñadas específicamente para detectar laaparición de la letra A. De esta forma, un posible modelo paraA se ofrece en la Figura l -21. Cuando la configuración de luz
Detectores retinianos
FIGURA 1-2
estimula el conjunto adecuado de receptores, el «detector A» responde con fuerza.
Una selección distinta de receptores produce un modelo para L. Otra organización produce un modelo para.N. Por este procedí-
Sí
FIGURA 1-3
1 En los diagramas que siguen, no se tiene en cuenta el hecho de que las lentes del ojo invierten la imagen. Esto facilita el dibujo de los esquemas y los
4 PROCESAMIENTO DE JNFORMACION HUMANA
Si
FIGURA 1-4
miento, es posible construir patrones para cada una de las formas o configuraciones que deben reconocerse (Figura 1-4).
El patrón de comparación es un esquema directo para el reconocimiento de formas. Obsérvese que tiene una característica interesante; compara simultáneamente la configuración de entrada con todos los patrones posibles. Es decir, no tiene que utilizar el laborioso procedimiento de recorrer los sucesivos modelos de uno en uno hasta encontrar el que se ajusta mejor. Busca todas las letras al mismo tiempo: el patrón que proporciona la comparación más adecuada para la configuración de entrada es el que se activa con más fuerza.
Sin embargo, es fácil descartar esta versión simple como modelo humano de reconocimiento de formas. Obsérvese lo que sucede si se imprime la letra ligeramente torcida, demasiado grande o demasiado pequeña, respectivamente:
comentários sobre los diversos esquemas de reconocimiento de formas. Es evidente que los principios de conexión de los receptores no varían por el hecho de que la imagen de la retina esté derecha o invertida.
LA PERCEPCION HUMANA 5 PATRON COMPARATIVO DE ORIENTACION
FIGURA l-5a
De esta manera, el sistema fracasa a menos que tenga un patrón exacto de la configuración de entrada.
Ante estos problemas, existen diversas estrategias para modificar el sistem� del patrón. Se pueden añadir más modelos -uno paracada posible tamaño y orientación de la letra que debe reconocerse:
PATRON DE COMPARACION DE TAMA�O
FIGURA l-5h
6 PROCESAMIENTO DE INFORMACION HUMANA
PATRON DE COMPARACION DE TAMAÑO
FIGURA 1-5c
Alternativamente, los símbolos pueden procesarse previamente para colocarlos en un formato típico, antes de intentar una comparación con el modelo.
Muchos programas de computador y máquinas que utilizan un sistema de modelo para reconocimiento de formas, realizan un procesamiento previo. Antes de intentar reconocer la forma,
PATRON COMPARATIVO DE TAMAÑOS DISTINTOS
FIGURA 1-6
LA PERCEPCION HUMANA 7
se hace girar la letra de forma que su eje central esté orientado verticalmente. Después, se regula su tamaño hasta conseguir la altura y el ancho predeterminado. Finalmente, este signo ya elaborado se compara con un conjunto típico de modelos o patrones.
Ajuste de
6:>o-A-e:)": "-,/1 Ajuste de
orientación
FIGURA 1-7
SI
.. El ejemplo mejor conocido de un sistema de patrón de compara
c1on pone de manifiesto algunas de sus limitaciones como método de reconocimiento de formas. En la parte de abajo de los cheques de banco, se imprimen con caracteres especiales el número de serie Y �I número de cuenta corriente, de forma que puedan leerse porsujetos humanos y por máquinas distribuidoras, conectadas a los computadores de la casa de liquidación del banco. Los caracteres del cheque se leen por un artefacto de registro y se identifican mediante un sistema de patrones de comparación. Observe los caracteres.
1- BDUTHERN CALIFORNIA Eim FIRBT NATIDNAL BANK
LA JOLLA SHORES OFFICE 2256 Aver11da Oe La Playa la Jolla"Cel1forri1a 92037
FIGURA 1-8
Se gasta una considerable cantidad de esfuerzo en diseñarlos de forma que se distingan todo lo posible entre sí. Han de imprimirse sobre los cheques con una máquina especial, para asegurar el tamaño y la posición exacta de los caracteres. Cuando el artefacto registrador lee los cheques, una mala colocación puede conducir a errores. El patrón de comparnción es el sistema construido más sim ple; también es el que más fácilmente conduce a equivocaciones.
8 PROCESAMIENTO DE INFORMACION HUMANA
Parece poco probable que los patrones puedan explicar el reconocimiento humano de formas. La gran variedad de formas con las que hay que enfrentarse, plantea considerables problemas a un esquema-patrón. Se pueden manipular, pero hay que tratar a cada uno como un caso especial, y el sistema pronto se convierte en algo muy complejo y poco manejable. Además, un sistema de patrones no puede reconocer nuevas versiones de formas, para las que no tiene patrón. Los humanos pueden conseguirlo. En consecuencia, se necesita un sistema más poderoso y flexible para explicar las aptitudes del reconocimiento humano de formas.
RECONOCIMIENTO DE FORMAS
El análisis mediante patrones de comparación fracasa. No necesitamos realizar experimento alguno para descubrir esto ; es suficiente la simple lógica. ¿Qué otras alternativas existen ? Es el momento de examinar el fenómeno de la percepción.
Las cosas no siempre aparecen como realmente son. Lo que vemos o escuchamos no es siempre lo que es. Con frecuencia, el sistema perceptivo comete errores ; a veces, vemos ilusiones ; otras, el sistema perceptivo necesita tiempo para recuperarse de una estimulación prolongada y, otras, necesita tiempo para interpretar la imagen que se le presenta. Todos estos fenómenos son valiosos porque los mecanismos de un sistema se nos manifiestan frecuentemente a través de sus errores y distorsiones. Cuando todo marcha suave y adecuadamente, es dificil saber por donde comenzar a buscar. Pero cuando se producen fracasos, el análisis de estos fracasos puede ser muy revelador. Por tanto, examinemos ahora algunos fenómenos perceptivos para ver qué principios básicos podemos extraer de ellos.
Comencemos por examinar cómo se puede interpretar la información sensorial.
Podemos resaltar el proceso de interpretación por medio de algunas tretas. En primer lugar, atenuamos la imagen, haciendo difícil la interpretación (cuando no imposible). En segundo, proporcionamos organizaciones en competencia, posibilitando diversas interpretaciones contradictorias de la misma imagen. En tercero, proporcionamos organizaciones sin significado para observar cómo afecta la experiencia pasada al proceso.
LA PERCEPCION HUMANA
Organización de imágenes atenuadas 9
No�almente, la interpretación de mensajes sensoriales ocurre tan ráp1d� . Y automáticamente que rara vez nos damos cuenta de la comple11dad de la tarea. Se tienen que retardar un poco los procesos para que llegue? a ser evidentes los mecanismos implicados.�na fon�a de conseguir esto, consiste en reducir la cantidad de mformac1ón visual utilizable. Como ejemplo, observe la Figura J -9.
•.
- . .. .
·� . ..... ... .
...
-
FIGURA l -9 R. C. James (fotógrafo) . Cortesía de/ fotógrafo
En �ste caso, vemo� algunos de los procesos de organizaciónque actuan durante la mterpretación de una imagen visual. Para ver que es
� la
_fo�ografia ?
,e un dálmata (visto por su izquierda),
hay que anad!f mformac1on que no existe en la fotografia. Unavez q�e
. puede verse el perro, resulta dificil dejar de verlo. El
conoc1m1ento _de que la fotografía es de un perro parece acelerar
el proceso de interpretación total ; cuando se sabe lo que se busca es más fácil verlo.
'
10 PROCESAMIENTO DE INFORMACION HUMANA
Organizaciones en competencia
Una imagen puede ser ambigua pm-que carece de información relevante o por un exceso de datos irrelevantes. También puede ser ambigua por la existencia de distintas formas de construir una interpretación significativa. Bajo estas condiciones, tenemos dificultad para interpretar la imagen de dos formas distintas al mismo tiempo. Una obra del artista Salvador Dalí ilustra este fenómeno.
F I G URA 1 - 1 0
Salvador Dalí, «El Mercado de Esclavos, con e l Busto que desaparece de Voltaire».
Colección : Sr. y Sra. A. Reynolds Morse. La fotograjia es una cortesía del Museo
Salvador Dalí, C/e veland, Ohio.
El título proporciona la pista para las interpretaciones alternativas del trabajo de Dalí : Mercado de esclavos con la desaparición del Busto de Voltaire. En el mismo centro de la pintura hay dos monjas de tamaño reducido, que están de pie una al lado de la otra. Pero con una organización perceptiva distinta, las caras de las monjas se convierten en los ojos de Voltaire, la unión de sus hombros se transforma en su nariz y las aberturas blancas de
LA PERCEPCION HUMANA 11
s�s cinturas forman la barbilla. Una manera de organizar la información pr?duce la percepción de figuras miniatura, la otra formaalternativa produce la escultura de una cabeza. Las dos percepciones son, en alguna medida, formas incompatibles de organizar la información visual : es dificil percibir ambas visiones simultáneamente.
Organización de percepciones auditivas
La t�ndencia a atender y a organizar selectivamente los datos proporcionados por los �1stemas sensoriales, e.s una característica muy general de todas las experiencias pe
_rceptivas. c::uando se selecc10na una conversación de nuestro alrededor, esa conversa
c1on se convierte :n figura. Todos los demás sonidos del ambiente se transforman en fondo. Este fenomeno se observa mucho mejor en una reunión numerosa, donde es posible desviar �� atención de una conversación a otra. En eada momento, la nueva conver�ac�on resalta clara y vivamente en la conciencia, mientras quelas otras se desdibujan en e1 trasfondo.
En música, se conoce muy bien la organización de nuestras percepciones en figura Y fondo. Los compositores presentan con frecuencia distintas líneas melódicas s1multaneamente, sabiendo que el que escucha atenderá fundamentalmente a una J?e hecho.
, e� posible utílizar un solo instrumento como sí estuviese tocando do�
lmeas melod1_cas al mismo tiempo. El intérprete alterna una serie de notas altas
con notas. bajas. �¡ auditorio se encueutra con que puede escuchar las notas altas
Y de�ubnr una !mea de la música, o escuchar las notas bajas y descubrir la otra lmea. Se perciben las notas alternativas como dos temas distintos.
FIGURA 1 - 1 1
Observe un ejemplo de esta técnica en un fragmento de música para una pieza de
< un
-�-oto de flauta. Hemos separado los dos temas difuminando la línea más
baja. hjese en que el compositor (Telemann) mantiene una clara diferenciación entre los temas, sepa'.an�o las notas y obligando al intérprete a alternar entre un temaY otro. El audttono puede seleccionar el tema alto o bien el bajo. Cualquiera
1 2 PROCESAMIENTO DE INFORMACION HUMANA
que sea la línea a la que se le preste atención, se convierte en figura. Las otras notas se escuchan como fondo de acompañamiento '(Figura 1-1 1).
La riqueza de la música depende en gran medida de las organizaciones perceptivas. Recogemos un tema y lo seguimos. Escuchamos el bajo, lo atendemos por un rato, después pasamos a otro instrumento. Aprendemos a seguir la configuración de instrumento a instrumento. Cuando se escucha la misma pieza musical una y otra vez, se pueden descubrir nuevos temas. El tema que se atiende en un momento determinado es la figura. Todo lo demás es el fondo. Retírese y escuche algo de música, algo complejo como Bach o Stravinsky o algo bueno de jazz o rock. Intente escuchar la música de distintas formas. La diversidad de organizaciones posibles no se convierte en evidente hasta que comience a observarlas. Se puede llegar a docenas de repeticiones de una pieza, antes de que una configuración determinada aparezca nítida y con claridad. Al igual que las percepciones visuales, el conocimiento de lo que se escucha parece servir de ayuda, pero una vez que se ha encontrado una forma determinada de organización de la música, i:s dificíl evitarla posteriormente.
Organización sin significado
¿Se pueden construir percepciones familiares a base de la capacidad de organizar y distinguir componentes determinados de la imagen visual? De ninguna manera. Durante la interpretación de un mensaje visual, parece que deslindamos y tratamos como unidad cualquier agrupación que tenga alguna característica distintiva. Las agrupaciones de formas o intervalos similares de una configuración repetitiva aparecen como figuras. Una máxima clásica para componer una forma gráfica atractiva consiste en proporcionar un punto focal de interés, incluyendo algún tipo de ruptura en una configuración repetitiv�. Muchos artistas contemporáneos son maestros en descubrir la diversidad de composiciones que pueden utilizarse para proporcionar agrupaciones atractivas de figura y fondo. Ofrecemos alguna muestra de sus trabajos (Figuras 1 - 1 2 y 1 - 1 3) .
¿Cómo se fragmentan estas imágenes? ¿Qué es lo que se mira? ¿Por qué se transforman continuamente las organizaciones de estas ptnturas? Estos cuadros ponen de manifiesto distintos aspectos. Por un lado, los objetos no necesitan ser ni significativos ni familiares para que actúen los principios de organización. Por otro lado, es dificil, cuando no imposible, predecir cómo se va a organizar la información. Observe estas figuras cuidadosamente. La organización fluctúa, tomando a veces una forma y a veces otra. Pero normalmente aparece una e�ttucturación de las pinturas, aun cuando los artistas hayan intentado evitar deliberadamente formas típicas de organización. El espectador las pone.
LA PERCEPCION HUMANA
• • • • • •• • • • • • • • • • • • • • • • • • • • • • •• ••• • • • • • • • • • • • • • • • • •• • • • • • • ••• • • • • • • • • • • • • • • ••• • • • • • • • • • • • •• • • • • • •• •• • • • • • ••• • • • • • • •• • •• •• · · · · · · · ·�· · · · ··· · · · · · · · · · ···· . . . . . .. .•• , • . . . . . . . . . . . . . . . . . . · · · · ·---· · · - · · · ····· · · · · · · · ·· · · · · ·---· ••11••· ····· · · · · --··· • • • • ·---•• illill ill• • • ••• .. ••• • • •I•• . . . .... . . . . ..... ....... . ...... ...... . .··· - - · · · · ·•••• •111• •••._,, • • ,. · ·-· · · · · · ····· ·, .. .. . . . .. . ,,, . . . .· ·-· · · · · · · · · ·-# . . . . . . . ,,, .. . . · · · · · · ··· · · ··---· · ·· · · · · · · · · ·· . .. . . .. . . . . . . ,--· · · ··· · · · · · · ·· • • • • • • • • • • •••• • • • • • • • • • • • •• • •• • • • • • • • • • • •••• • • • • • • • • • • •• • • •• • • • • • • • • •••• • • • • • • • • • •• • • •• • ••.... . . . . . .. . . . . . . . . . . . . .. . . ... • • • • • • • • • • • • • • • • •• • • • • • • • • • • ••
1 3
FIGURA 1 - 1 2 Victor Vasarely, «Tlinko». 1956. De Vasarely J , p. 120, Ediciones de Griffon, Neuchátel-Suiza.
FIGURA 1 - 1 3 Franrois MorelJet. «Screen Painting : Oº, 22º5', 45º, 6 7º5». Colección : Museum ol Modern Art, Paris. Corresia del artista.
1 4 PROCESAMIENTO D E lNFORMACION HUMANA
La Figura 1 - 1 4 es especialmente interesante, puesto que puede percibirse como un conjunto de tubos largos, horizontales, rectangulares o verticales, o simplemente como formas triangulares largas, mudables. Pero cualquiera que sea la configuración, casi siempre hay una presente. Ya sea la figura significativa o no, familiar o nueva, el proceso visual y perceptivo le impone una organización.
.. ,
,
--
,. --
l y -1 ! 1 ' . 1 -
._.., _ ,. _ .,... ,.. .. .. .. . .,,
.. -. .
-
T - . .. -
'"'
- -
- -.T 'T 'T
_,.. _ _,..,,.,..-- ,,,._ -_ ,.. -_,.
,.. ,, , -
-- --- . . .
- . . . . - · .
--.... - . y
'f' · - ·
''ti'.'.
. . F I G U RA l - 1 4 Bridget Ri/ey. « Treman>. 1962. 48 x 48 pulg.adas. Cortesía del Sr.
David M. Winton.
Ajuste de los datos sensoriales a la interpretación
Se pueden demostrar mediante ilusiones otros aspectos importantes de la organización de la información visual. El propósito de un·a ilusión consiste en diseñar un conjunto ambiguo de entradas sensoriales, para rastrear algunas características del sistema perceptivo a través de un análisis del tipo de errores que se ha cometido.
Ll\ PERCEPCION HUMANA 1 5
De esta forma, a menudo es posible examinar con más detalle determinadas operaciones del sistema que normalmente no pueden observarse. Consideremos la Figura 1 - 1 5. Podría representar un objeto acostado (Figura 1 - 1 6) o derecho (Figura ·1 - 1 7).
Para construir ese objeto 2, tome una hoja de papel bastante grueso, dóblela y colóquela como en la Figura 1 - 1 8 . Cuando la haya colocado, mírela con un ojo tapado desde un punto en línea
[l FIGU RA 1 - 1 5
FIGURA . 1 - 1 6
FIGU RA 1 - 18
2 Es conveniente que se intenten realizar todas estas ilusiones : poco se puede aprender con una simple lectura.
1 6 PROCESAMIENTO DE INFORMACION HUMANA
con el canto doblado y a poca distancia : al punto señalado con una O. Al principio, el papel se ve como en la Figura 1 - 1 6. Si continúa fijando la vista atentamente, el papel se pondrá derecho repentinamente y lo verá como en la Figura 1 - 1 7. Se necesita un poco de concentración y práctica, pero así ocurre. La ilusión es importante. Cuando vea la hoja como en la Figura 1 - 1 7, mueva su cabeza ligera y lentamente hacia atrás y hacia adelante (recuerde que debe usar un solo ojo). Observe lo que le sucede al objeto.
Existen dos formas distintas de organizar la imagen de la figura. Cuarido se percibe el objeto acostado, se coordina toda la información de profundidad. Cuando está derecho, las sombra:s y contornos no tienen la nitidez que deberían tener (lo que hace que el objeto aparezca un poco luminoso). Cuando se mueve la cabeza, parece que el objeto está hecho de una substancia elástica que se retuerce y transforma. Esto ocurre porque, cuando se mueve la cabeza, L1 imagen del punto más cercano a la línea doblada se mueve por la retina más rápidamente que la imagen del punto más lejano. Esta es la configuración normal de estimulación parcial de la escena en función de las distintas profundidades -un fenómeno conocido como movimiento paralaje. Cuando se ve el objeto en su orientación adecuada, esta señal de movimiento paralaje coincide con el movimiento. Sin embargo, cuando se ve el objeto derecho, todos los puntos a lo largo de la línea doblada parece que están a igual distancia. La única forma de que las señales de movimiento sean consistentes con la organización vertical es cuando el objeto mismo se mueve y gira. Aun cuando se sepa muy bien que el objeto no puede actuar de esa manera, la fuerza de los datos sensoriales le obligan a percibirlo como si así fuera. Todos los datos sensoriales se utilizan para construir una interpretación consistente del mundo visual.
Antes de que prescinda del papel, debe intentarlo de nuevo. Pero esta vez, coloque el papel de forma que esté fuertemente iluminado por un lado. Cuando cambie de la orientación horizontal a la vertical, preste particular atención a las variaciones en la aparente luminosidad del lado del objeto que está en la sombra. ¿Puede explicar estas diferencias de · luminosidad ?
LA IMPORTANCIA DE LAS REGLAS
Todos los últimos ejemplos han manifestado una teoría común : la evidencia sensorial debe ser interpretada. Pero, ¿cuáles son las reglas que gobiernan la interpretación ?
LA PERCEPCION HUMANA 1 7 Observemos la Figura 1 - 1 9. Percibimos inmediatamente un grupo
de bloques tri-dimensionales, algunos superpuestos entre sí. El problema consiste en saber qué información se utiliza, para determinar cómo se combinan las distintas áreas de los bloques para formar figuras. ¿Cómo se sabe que las áreas 20 y 1 8 son de la misma figura o, fijándonos en un ejemplo más dificil, cómo se sabe en las áreas 3 y 29? La realización de esta tarea requiere consideraciones sobre las líneas y ángulos que surgen de la imagen. Se sabe que existen diversos métodos para poder desenredar esta figura. Este diagrama particular pertenece al trabajo de Guzmán ( 1969), un científico de computador interesado en determinar reglas para que los computadores puedan realizar la tarea.
29 FIGURA 1 - 1 9
De Guzmán ( 1969).
Guzmán analizó cierto número de situaciones de este tipo yllegó a la conclusión de que la información más importante sobrela superposición, surge de una consideración de las intersecciones el lugar donde varios contornos interseccionan entre sí (ver Figur�1-20). Si la intersección forma una L por ejemplo, es probableque la superficie de la izquierda (a) pertenezca a un cuerpo distinto
18 PROCESAMIENTO DE INFORMACION HUMANA
del de la superficie de la derecha (b). Sin embargo, con una horquilla,
las tres superficies pertenecen al mismo cuerpo ; d, e, y f Una flecha
casi siempre significa la existencia de dos cuerpos, uno que contiene la superficie h e i, y el otro la superficie j.
L-Vértice donde se encuentran dos líneas
Flecha - Tres líneas que se encuentran en un punto. siendo uno de los ángulos superior a 1 80º
K - Dos vértices están en línea recta con el centro, y los otros dos caen en el mismo lado de tal línea.
Pico - Formado por cuatro lineas o más. cuando el vértice central es la parte más alta de la intersección.
FIGURA 1 -20
y Horquilla - Tres líneas, formando
ángulos menores a 1 80º
T - Tres líneas concurrentes, dos de ellas en línea recta
X - Dos de los vértices están en línea recta con el centro. y los otros dos caen en lados opuestos a tal línea.
Multi - Vértices formados por cuatro líneas o más y que no pertenecen a
ninguno de los tipos anteriores.
De Guzmán ( 1969) .
La intersección llamada T es la que con frecuencia proporciona los indicios más importantes para la construcción del panorama final. Una T acostumbra a indicar que un objeto está frente a
LA PERCEPCION HUMANA 19
otro, de forma que las superficies k y l pertenecen a un cuerpo que atraviesa el cuerpo m. Por tanto, cuando se encuentra una T, es importante mirar si existen otras alrededor, otras T que se ordenaran adecuadamente con la primera.
En la Figura 1-2 1 , son suficientes las dos T's señaladas para saber que las superficies o y p van juntas, al igual que las superficies r y s, y que o y r son la misma superficie, como lo son p y s. Añadiendo la información proporcionada por la horquilla de que r, s y z son parte del mismo cuerpo; se interpreta inequívocamente la figura completa : q es un cuerpo ; o, p, r, s, y z es otro ; u es el fondo.
Una horquilla
Un par de T
FIGURA 1 -2 1
Hemos visto una situación que hace un uso claro de dos fuentes distintas de información : primero, la información específica del dibujo, obtenida mediante un análisis de las líneas que interseccionan ; segundo, una interpretación del significado transmitido por esas intersecciones. En este caso, existe una combinación de la información comunicada por las características parciales del dibujo con una consideración de la interpretación global. Este doble proceso ---extracción de características e interpretación- aparecerá repetidamente cuando examinemos la experiencia perceptiva. Además, las implicaciones de este proceso dual de percepción aparecen no sólo en el análisis de algo como bloques, sino también en situaciones donde existe conflicto entre las implicaciones de las características globales y la interpretación total. Cuando surgen estas contradicciones, la percepción resultante muestra el conflicto de una manera bastante evidente.
20 PROCESAMIENTO DE INFORMACION HUMANA
Percepción del espacio
Normalmente percibimos el espacio en forma tridimensional. Los objetos distantes ocupan un ángulo más pequeño que cuando están cerca. Las estructuras cambian con la distancia y con el punto de vista del ángulo. Las líneas convergen en la distancia. Teniendo en cuenta que los humanos viven y se mueven normalmente en un mundo tridimensional, tiene sentido que el aparato visual humano se haya desarrollado de forma que realice una representación tridimensional de las imágenes que ve. Veamos ahora algunas reglas de posible utilización, para ver cómo actúan en la explicación de ciertos fenómenos.
Cuando se encuentra una configuración visual donde las líneas o bordes convergen, existen dos opciones para interpretarla. Podríaser un objeto de dos dimensiones visto de frente, en cuyo caso las líneas convergen realmente, o podría ser un objeto tridimensional visto desde un ángulo, en cuyo caso las líneas deben ser realmente paralelas y ser un resultado de la distancia la convergencia aparente. La elección de interpretación debe basarse en un análisis de toda la evidencia posible. Consideremos las dos formas cónicas de la pintura de Magritte (Figura 1 -22).
Están dibujadas de una manera casi idéntica, aun cuando representan objetos bastantes distintos. El cono de la izquierda tiene una orientación evidentemente vertical . No parece que los lados sean paralelos. El cono del mismo tamaño de la derecha es una calle que se pierde en la distancia. Los lados parecen paralelos. La misma información visual puede interpretarse de forma bastante distinta.
La capacidad de ver objetos en profundidad no depende de la familiaridad de los objetos. En la Figura 1 -23, un cuadro de Jeffrey Steele, se crea una fuerte ilusión de profundidad mediante el uso preciso de la perspectiva, en una configuración que se repite indefinidamente.
Los contornos horizontales que se espacian por igual en el ambiente, se proyectan en la retina con separaciones más y más pequeñas. Observe este tipo de diseño (Figura 1 -24).
Si nos centramos en el medio de la configuración y continuamos hacia la derecha, parece que nos alejamos en la distancia a causa de que el espacio entre líneas se reduce sistemáticamente. De hecho, si se examina cuidadosamente la geometría de la figura, se observará que el gradiente de espaciamiento de líneas ofrece un ángulo bastante preciso y una información suficiente de la distancia. Esto se represen-
LA PERCEPCION HUMANA 2 1
FIGURA 1-22 René Magritte, «Les Promenades d' Euclide». Cortesía de The Minneapolis lnstitute of Arts.
22 PROCESAMIENTO DE INFORMACION HUMANA
F I G URA 1 -23 Jeffrey Stee/e, «Baroque Experiment : Fred Maddo:rn. Colección : Hon. Anthony Samue/. Cortesía del artista.
}";( LA PERCEPCION HUM•�•"
FIGURA 1 -24 De Carraher y Thurston ( 1968) .
23
ta en la Figura 1 -25, donde el gradiente de distintas líneas visto por un observador, aparece como una superficie plana que tiene una serie de líneas horizontales espaciadas por igual que se van inclinando, alejándose de él. El espacio entre líneas manifiesta con exactitud el ángulo de la superficie. Sin embargo, no se conoce la distancia puesto que, en este diagrama, el mismo gradiente de espacios entre líneas puede ser el resultado de cualquier distancia del ojo (suponiendo que no existe forma de saber el espacio real de las líneas horizontales). Observe, sin embargo, que si se utiliza la información sobre los lados de la superficie, como ocurre en la figura, entonces se añaden otras determinantes a la situación.
En la Figura 1 -25, la superficie plana está inclinada, de forma que no sólo las líneas horizontales espaciadas por igual llegan a estar más apretadas en las partes más lejanas de la imagen retiniana, sino que también decrece la longitud proyectada de las líneas. Este fenómeno, el conocido gradiente de la distancia, es el responsable de muchas ilusiones ópticas.
Se puede ver la primera ilusión en la Figura 1 -24, donde el extremo del objeto que se percibe como más distante también se percibe como más grande, aun cuando (en realidad, a causa de que) las líneas verticales del dibujo son todas de la misma longitud. Este diagrama presenta información conflictiva para el observador, así que no es sorprendente que la resolución de la interpretación sea también conflictiva (ver también Figura 1 -37).
No es dificil suministrar información de profundidad. Muchos tipos distintos de gradientes de superficie consiguen la ilusión, como
24 PROCESAMIENTO DE INFORMACION HUMANA
Observador A Plano
�. LO QUE SE VE SITUACION REAL
Desde un lateral Desde arriba
A f!j •
f!J /J 1 l l 1
l
e � /D � C> [[]]]
FIGURA 1 -25
muestra la Figura 1 -26. Cuando se ve un objeto rectilíneo de frente, las lineas de intersección formadas por sus contornos están en ángulo recto. Cuando el objeto está inclinado y con un giro en el espacio, los ángulos se desvían en la imagen retiniana de los ángulos rectos. El grado de divergencia depende de la orientación del objeto en el espacio. Interpretando esa divergencia de los ángulos rectos como un resultado de profundidad, se puede extraer informa'Ción de distancia.
•
•
•
LA PERCEPCION HUMANA
. � . . . . . . . . . . .. . .. . . . . . . . . . . . . . .
• •
• •
FIGURA 1 -26 De Gibson ( 1950) .
25
Por ejemplo, en la Figura 1 -27 es fácil ver que las barras cruzadas interseccionan la línea vertical en ángulo recto. Sin embargo, el mismo conjunto de aspas se interpreta de una forma distinta cuando va acompañado de información de profundidad, como en la Figura 1 -28.
Organizaciones imposibles. Otra forma de manifestar la tendencia a colocar los objetos en tres dimensiones durante su interpretación,
FIGURA l -27 F I G U RA 1 -28
26 PROCESAMIENTO DE INFORMACION HUMANA
consiste en construir dibujos cuyas partes no puedan ajustarse entre sí para formar una estructura lógica. He aquí algunos fragmentos y trozos de un dibujo.
Tienen aspecto de esquinas y lados de algún objeto tridimensio· nal. Ahora vamos a juntarlos (Figura 1 -30).
FIGURA 1 -29
F I G U RA 1 -30
De Penrose y Penrose ( 1958).
¿Qué sucede ? Las piezas no se ajustan lo suficiente ; la figura es imposible. Sin embargo, no existe ninguna imposibilidad intrínse· ca en el conjunto de líneas y ángulos que forman el dibujo. Las características individuales entran en conflicto con la interpretación global. Aquí hay algunos ejemplos más para descifrar (Figuras 1 -3 1 , 1 -32 y 1 -33).
LA PERCEPCION HUMANA
FIGURA 1 -3 1 De Penrose y Penrose (1958).
27
F I G U R A 1 -32 M. C. Escher, «Cube wilh Magíc Ribbons». Colección : Haags Gemeentemuseum. La Haya.
28 PROCESAMIENTO DE INFORMACION HUMANA
F I G U RA 1 -33 lose/ Albers, «Structural Constellations». JY53-JY58. De DespitcStraight Unes, pp. 63, 79. Cortesía del artista.
LA PERCEPCION HUMANA 29
La importancia del contexto
Nada se elabora aisladamente. Toda la información debe integrarse en una interpretación consistente y total de la escena visual. Los tres barriles de la Figura 1 -34, evidentemente, tienen tamaños distintos. Ahora bien, es fácil cambiar sus aparentes tamaños relativos ; basta con añadir la información que proporciona un contexto adecuado.
FIGURA 1 -34
1 1
F I G U RA 1 -35
F I G U RA 1 -36
De nuevo, los efectos del contexto no dependen de enfrentarse a objetos familiares. Los sutiles efectos parecen estar presentes aún con la pobreza de líneas dibujadas (Figuras 1 -37, 1 -38).
Normalmente, toda la información contextual se ajusta entre sí. Cuando los objetos se mueven, el tamaño de sus imágenes cambia en la cantidad precisa. Sin embargo, ni el artista ni el psicólogo se limitan a estudiar situaciones de la vida real. El encanto surrealista consiste en descubrir y violar intencionadamente las reglas de construcción de las percepciones lógicas (Figura 1 -39).
30 PROCESAMIENTO DE INFORMACION HUMANA
FIGURE 1 -37
F I G U RA 1 -38a Las dos línea." horizontales de la Figura J.37 son de la misma longitud. La figura J-38a presenta un círculo perfecto. De Luckiesh ( 1965).
F I G U RA 1 -38b Las dos líneas herizonta!es de la Figura l-38b son paralelas. De Luckiesh (1965).
LA PERCEPCION HUMANA 3 1
F I G U RA 1 -39 Rene Mavilfe. « The Listening Room». Colección : Sr. William N. Copley.
Podríamos acomodar la manzana si supusiéramos que la habitación es muy pequeña. Magritte fue cuidadoso al retratar una habitación y una manzana corrientes, de forma que ninguna pueda ajustarse a su propio tp.maño. Se salta las reglas para proporcionar una imagen interesante.
Todos estos fenómenos sugieren que, cuando reunimos información sensorial, debe producirse una imagen consistente del mundo. En el láboratorio podemos construir situaciones donde la información visual sea ambigua e incompleta. Así, en la ilusión del papel doblado, se eliminó la información sobre la verdadera orientación de la figura, mirando el objeto con un ojo cerrado y uná posición de la cabeza relativamente estable. Sólo una vez que se alcanzó la ilusión perceptiva fue posible mover de nuevo la cabeza, añadiendo nuevos indicios de profundidad. En esta ocasión, sin embargo, los indicios de movimiento se interpretaron en términos de nueva percepción. En la medida en que la interpretación aún era posible (al margen de si era única o desconocida), se mantuvo la ilusión.
32 PROCESAMIENTO DE INFORMACION HUMANA
ANALISIS DE CARACTERÍSTICAS
La última sección se centró en la interpretación de características sensoriales, en las reglas de percepción. Pero ¿qué podemos decir sobre las características mismas? ¿Qué información recoge el sistema nervioso de las señales que llegan a los órganos de los sentidos? Una vez más, avanzaremos buscando anomalías en la percepción. Actualmente, al estudiar las operaciones de los sistemas sensoriales, es posible utilizar técnicas de registro fisiológico y medir las operaciones de los nervios mismos. El resultado de investigaciones áe este tipo se presentará en el Capítulo 2 y, de nuevo, en los Capítulos del 4 al 7. Pero antes de introducirnos en el sistema nervioso, será conveniente examinar algunas de las propiedades más generales del esquema de extracción de características, observando sus efectos sobre la percepción.
Examinemos las Figuras 1 -40 y 1 -4 1 . En la Figura 1 -40 existe un pequeño punto gris en cada intersección de líneas blancas, salvo en la intersección que se está mirando. En la Figura 1 -4 1 , los cuadrados internos se ven con distintos matices de gris : de hecho, todos ellos son iguales. Estas dos Figuras manifiestan un principio del análisis sensorial : las células neurales interactúan entre sí. Así, los receptores de una parte de la imagen visual se ven afectados por la actuación de los receptores vecinos. Ninguno de estos efectos ocurriría si los receptores fuesen independientes entre sí, de forma que se limitasen a enviar una señal pura e ininterrumpida al cerebro. Realmente, en el único punto del ojo donde los receptores no interactúan demasiado entre sí, no ocurre el fenómeno de obscurecimiento : la pequeña área a la derecha del punto donde se fija el ojo . (Esta área se llama fóvea -hablaremos más sobre ella en los' Capítulos 4 y 5). La Figura 1 -42 muestra un resultado similar. ¿Observa las tenues líneas diagonales que aparecen entre los cuadrados? Pues bien, no existen realmente. La interacción neural las añade a la imagen.
Estas demostraciones simples demuestran la existencia de fuertes influencias en el sistema de extracción de características, pero estas demostraciones no nos dicen cómo actúan. Es posible obtener más información sobre la operación del mecanismo de extracción de características a través de dos procedimientos psicológicos :
• En primer lugar, los ojos están en constante movimiento. Siese movimiento se paraliza, desaparecen las imágenes vistas porlos ojos. La manera en que la imagen visual se desvanece, cuando
LA PERCEPCION HUMANA 33
se paraliza el ojo, sugiere algunas de las propiedades del mecanismo de extracción de características.
• En segundo lugar, la visión prolongada de una imagen influyeen las percepciones futuras. Los efectos de estas post-imágenesproporcionan otro indicio sobre las operaciones del sistema visual .
1- 1 e; u RA 1 -40 La retícula di' Hering : aparffen puntos grises en i·uda inrersección , excepto en el 11111· s<' <'sf<Í mirando.
l I G LJ RA 1 -4 1 Conrra.11<' simultáneo : todos los cuadrados pequeños rienen la misma intensidad. De Cornsweer ( 1970) .
34 PROCESAMIENTO DE INFORMACION HUMANA
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • •
FIG U RA 1 -42 Esta ilusión. la aparición de líneas diagonales tenues (que en realidad no existen) fue descubier/a por Robert Spring_er.
Fijación de la imagen
La·imagen está en constante movimiento en el ojo, no simplemente por lo.s movimientos del ambiente sino también por un continuo temblor del ojo -pequeños movimientos bruscos, llamados nystagmo fisiológico. De hecho, existe cierto número de distintos tipos de movimientos del ojo, que ocurren sin que nos demos cuenta de ellos. Uno es muy pequeño y rápido : el ojo se mueve en un ángulo de cerca de 20 segundos de arco, entre 30 y 70 veces por segundo. ( Existen 60 segundos de arco en cada minuto, y 60 minutos de arco forman un grado -así, 20 segundos es 1 / 1 80 de un grado). Otro tipo es un movimiento largo, oscilatorio. Otro más es un movimiento lento, de unos pocos minutos visuales hacia uno y otro sitio. Y, finalmente, existen unas rápidas sacudidas, con una amplitud de unos 5 minutos de arco, corregidas frecuentemente por los movimientos lentos. Se puede ver el efecto de estos movimientos del ojo con la siguient� demostración.
Mire fijamente el punto negro de la Figura 1 -43 (el punto central de la figura), intentando mantener sus ojos tan fijos como
LA PERCEPCION HUMANA 35
le sea posible. Continúe mirando hasta que le parezca que tiemblan las partes negras y blancas del dibujo (alrededor de 30 segundos). Después mueva su vista al punto blanco. Se verá un conjunto de bloques blancos sobre un fondo negro, superpuesto al dibujo mismo. La post-imagen de la · retícula continuará desplazándose sobre la configuración, al margen del cuidado que se ponga en retener la imagen fuerte. Esfo es el nistagmo fisiológico.
F I G U RA 1 -43 De Verhe(íen ( 196 1) .
Sin embargo, lo que es interesante, no es tanto que el OJ O
esté continuamente en movimiento sino que, cuando se detienen los movimientos, desaparece la imagen visual. Este fenómeno nos proporciona alguna información básica sobre la forma en que trabajan los receptores y el sistema analizador de estímulos.
Los movimientos de la imagen visual que atraviesan la superficie de la retina, se pueden paralizar utilizando varias técnicas distintas (Riggs, Ratliff, Cornsweet y Cornswet, 1 9 52). Una de estas té1;nipas se muestra en la Figura 1 -44. Se pega un espejo pequeño a unas lentes de contacto sobre el ojo . La imagen que ve el sujeto se proyecta en este espejo, que la rechaza fuera de la superficie de visión. Con este sistema, cuando se mueven los ojos a la derecha, el espejo también lo hace, y de esta forma la imagen se desplaza
36 PROCESAMIENTO D E INFORMACION HUMANA
a la derecha. Mediante cuidadosas correcciones, es posible conseguir que la imagen se mueva exactamente con el mismo ángulo visual que el ojo , de forma que la imagen que se ve en la retina no cambie de posición, a pesar de los movimientos del ojo.
Rayos del proyector Espejo sobre lentes de contacto
F I G U RA 1 -44 De Riggs, Ratliff. Cornsweet , y Corns�eet (1953j.
Cuando se ve una imagen visual mediante tal aparato, las formas desaparecen al cabo de pocos segundos. Gradualmente, no queda nada salvo un campo visual en blanco, homogéneo. La imagen desaparece de una forma peculiar. No se desvanece simplemente. Se desvanece en trozos significativos. Comienzan primero los segmentos completos, permaneciendo visibles otras partes. Cuanto más significativa sea la imagen, más tiempo permanece. La parte de la imagen que se atiende conscientemente es la que subsiste durante más tiempo.
Puede observar por sí mismo este fenómeno de desaparición examinando la Figura 1 -46, Looking Glass Suite Núm. 9 del artista inglés Peter Sedgley, reproducida en color en la página 226a. Observe primero algunas de las características ·de la pintura. Los bordes de los círculos concéntricos están borrosos. Son así deliberadamente. De hecho, es uno de los secretos de la producción del fenómeno. Ahora mire de cerca el centro de la pintura sin mover sus ojos. Fije la vista durante un rato ; se tarda algún tiempo. Lo que primero sucede es que desaparece el círculo intermedio. Después se desvanecen determinadas partes de los círculos, no gradualmente sino en grandes segmentos. Finalmente, desaparecen todos los círculos, permaneciendo únicamente un campo amarillo constante, homogéneo. Si se mueven los ojos ligeramente, volverá a aparecer la imagen. (No desespere si la pintura tarda bastante tiempo en desaparecer. Puede emplear una práctica eficaz : cuantas más veces lo haga,
LA PERCEPCION HUMANA 37
más fáci l será conseguirlo. Algunas veces es muy dificil hacerlo en la primera vez. Pero la experiencia merece la pena).
H3 H B 3 Y. S E E R P E E R B E E P B E E B E
FIGVRA 1 -45 De Pritchard ( 1961 ) .
Observe que, cuando desaparecen los círculos, e l campo visual se rellena de amarillo. Cuando los circuitos neurales suspenden su actividad normal, no se nota su ausencia. En este caso, no aparecen los círculos sino la información del color : por tanto, sólo vemos lo último.
¿Cómo se pueden explicar estos efectos? La explicación mas generalizada consiste en suponer que la percepción de las formas depende de la actividad de detectores muy complejos de características, de circuitos neurales que detectan líneas, bordes, ángulos y, quizá, círculos. En la medida en que se proporciona suficiente información a los ojos mediante los receptores neurales, el detector complejo de características continúa respondiendo, y se puede ver la forma completa. Cuando los ojos paralizan sus movimientos, los receptores de los ojos suspenden sus respuestas. Cuando ya no existen suficientes respuestas que van desde los ojos hasta el detector complejo, éste suspende sus respuestas y la configuración
38 PROCESAMIENTO DE INFORMACION HUMANA
desaparece como un todo. De aquí se deduce la relativa larga duración de las imágenes complejas comparadas con otras más simples ; de aquí la forma brusca en que desaparecen segmentos de la imagen ; de aquí las distorsiones de las imágenes complejas, que ocurren cuando una señal sensorial debilitada obliga a los mecanismos ·sensoriales a equivocarse en la interpretación de los datos que aún se pueden utilizar.
Existen todavía dos problemas. En primer lugar, ¿se conducen los demás sentidos de la misma manera? ; ¿un tono auditivo constante llega a ser inaudible después de algún tiempo ? En segundo lugar, ¿por qué los círculos de Sedgley desaparecen aun sin emplear ningún artefacto especial para fijar los movimientos del ojo? La respuesta a la primera pregunta es fácil . No existe una señal auditiva constante. Incluso los sonidos que parecen tener un tono y sonoridad constantes tienen, en realidad, una configuración de la presión del aire en con'tinuo cambio. Las señales auditivas construyen su propio movimiento : el sistema visual tiene que añadirlo artificialmente. Sin embargo, otros sistemas, tales como el gusto o el tacto, se adaptan a estas condiciones. La correa de un reloj de pulsera no se siente después de cinco minutos. Se nota sólo cuando se mueve.· Una sensación constante de gusto u olorosa desaparece después de cierto tiempo. Todos los sistemas sensoriales parecen necesitar cambios de estimulación para que la percepción se mantenga. Se paraliza la imagen y se paraliza la percepción.
¿Qué ocurre con el segundo problema? La pintura desaparece porque fue construida deliberadamente con los bordes borrosos. Aun cuando se hubiesen movido ligeramente los ojos cuando se miraba el cuadro, la configuración vibratoria resultante en la retina del ojo sería un movimiento de trazo confuso a través de los receptores (ver Figura 1 -47). La transición de un color a otro se hacía tan suavemente que el movimiento del trazo borroso no era suficiente para provocar el que las células receptoras observasen el cambio de la estimulación.
Se debe ser muy precavido al realizar deducciones sobre los mecanismos neurales, a partir de datos de conducta de este tipo. Deben considerarse cuidadosamente las explicaciones alternativas. La desaparición y reaparición de las formas puede deberse a dificultades técnicas del aparato, tales como pérdida de rendimiento de las lentes. Puede ser que la imagen no esté perfectamente fijada. Quizá se puede pensar que la desaparición ocurre en los componentes significativos, porque éstos son los únicos cambios en las percepciones que pueden describirse fácilmente.
(•)
LA PERCEPCION HUMANA .
o Cambio !I : f�tensidad i: 1
1 11 1 ' 1 ¡......,...--: ! V' Posición
FIGURA 1 -47
39
Arriba : una explicación de por qué desaparece el disco borroso, pero no así el nítido. Los movimientos involuntarios del ojo (nistagmo) producenfuertes cambios de intensidad en la retina cuando se paraliza el disco nítido (a) , pero el mismo movimiento del ojo sólo produce un ligero cambio de intensidad con el disco borroso (b). ¿Es ésta la razón por la que desaparecen los aros del cuadro de Pe ter Sedgler (Figura 1-46 en la rueda del color) ? Abajo : una demostración . del papel de los cambios bruscos de intensidad. Si nos fijamos en el centro del cuaaro ( b) durante al1:ún tiempo (mejor si cerramos un ojo ) , desaparecerá e l círculo borroso. Reaparecerá s i parpaaeamos o si rombiamos la vista a la X. El círculo nítido (a) probablemente no desaparecerá. Estas _figuras son de Cornsweet ( 1969) .
En verdad estos problemas no deben tomarse como fundamento para rechazar el fenómeno, sino más bien como incentivo para investigaciones posteriores. El trabajo sobre imágenes fijas proporciona un puente potencialmente útil entre nuestras experiencias perceptivas y los mecanismos neurales subyacentes a la visión humana.
40 PROCESAMIENTO DE INFORMACION HUMANA
Posefectos
Una segunda fuente importante de información sobre la percepción humana viene de la consideración de los posefectos de estimulación fuerte . Si se fija la vista en una luz fuertemente coloreada por cierto tiempo, y después se mira una superficie blanca, suave, la imagen se ve pero en el color complementario. Si la luz original era roja, la posimagen es verde, si la original era azul, la posimagen es amarilla : si era negra, la posimagen es blanca.
De la misma manera, si se está frente a una puerta y se tira fuertemente de los bordes como si se intentara levantarla sobre la cabeza, cuando se aparta uno y deja los brazos normalmenterelajados, se siente que los brazos tienden a levantarse en el aire como si estuviesen de común acuerdo. De nuevo, los posefectos de una est imulación intensa se sienten de una forma que nos indica algo sobre el funcionamiento interno del sistema.
Posefectos del mo vimiento. Un posefecto particularmente preciso es el del movimiento. Observe el movimiento de un objeto durante un rato. El objeto clásico es una cascada, pero ocurre en otros muchos movimientos. Lo importante es que sea capaz de mirar fijamente un punto, cuidando de no mover sus ojos durante varios minutos, mientras ocurre el movimiento.
Después, si desvía su mirada hacia un objeto estructurado (un muro o, mejor. algún material de textura fina como una cortina o cobertores), verá la aparición de movimiento en la direcciónopuesta a la del objeto original. Si el objeto se movía hacia abajo, el movimiento posterior se mueve hacia arriba ; si se miraba la contracción de una espiral, el movimiento posterior es el de expansión. Si se examina la superficie estructurada con cuidado, se observará que no existe realmente el movimiento. Existe apariencia de movimiento en ausencia de una imagen en movimiento.
LOMO BUSCAR LOS POSEFECTOS DEL MOVIMIENTO
lJna fuente muy eficaz de movimiento consiste en mover un disco que gira unas tres o cuatro veces por segundo. El disco debe estar dibujado con líneas de fuerte contraste, dv 1orma que se observe fácilmente el movimiento. Los máximos efectos del movimiento se consiguen observando una espiral colocada sobre un disco giratori o : cuando gira la espiral, parecerá que se contrae o se dilata, en función de la dirección de la rotación.
Para facilitar la observación del fenómeno de los posefectos del movimiento (Figura 1 -48), proporcionamos una espiral que puede copiarse del dibujo del libro
LA PERCEPCION HUMANA 41
y después puede colocarse sobre e l plato d e un tocadiscos. Esta espiral está diseñada para girar a 33 1 /3 rpm. Si no se dispone de un tocadiscos, se puede introducirun lápiz en el punto central y hacer girar a su alrededor la espiral. Pero se debe girar lentamente la espiral : aproximadamente a unas 33 1/3 rpm.
FIG U RA 1 -48 Si esta espiral (o algo similar) se coloca sohre un plato giratorio v se mira fijamente
el centro dura111e 30 seg, se produce un posefecto de movimiento. De Gregory ( 1970).
Ahora mire fijamente el centro de la espiral rotatoria durante unos 30 segundos. No aparte los ojos del centro. Mire después los demás objetos de la habitación o el rostro de alguien.
Como ya mencionamos, la forma original del posefecto del movimiento proviene
de la observación prolongada de una cascada. Si no se consigue encontrar una cascada, y no se desea o no se puede construir el disco, existen todavía métodos alternativos para descubrir el movimiento. Un método consiste en utilizar el aparato de televisión, ajustando primero la imgen para conseguir un máximo de brillo y un máximo de contraste ; en segundo lugar, se manipulan cuidadosamente los contrastes del mando vertical para ajustar la imagen, de forma que se mueva continuamente hacia la parte de arriba o de abajo de la pantalla. Desgraciadamente, la imagen de televisión se desplazará a saltos, especialmente en los aparatos buenos, intentando nivelar el efec-
42 PROCESAMIENTO DE INFORMACION HUMANA
to, de forma que, a veces, todavía se puede ver la imagen (por favor, apague el sonido). Finalmente, se puede simular un torrente de agua, haciendo correr agua en la bañ�
ra o produciendo de algún modo una eorriente tan grande como sea posible. Mire fijamente al menos por un minuto. Este método no es particularmente recomendado; pero, a veces, funciona.
Posefectos del color. Examine la figura 1 -49 (la página en color 226a). Mantenga la vista fija en el punto negro del recuadro
1zqmeido, la que tiene corazones verdes. Mantenga la cabeza y los ojos firmes y la vista fija, hasta que la figura comience a palidecer. Después mire el punto negro en la figura de la derecha, el que está en el área blanca. Se verán una serie de corazones rojos (parpadee unas cuantas veces, puede ayudar a obtener la posimagen). La posimagen que resulta del examen intenso de un color consiste en la aparición del color complementario -el color opuesto, si se prefiere. Se puede observar este posefecto del color con cualquier superficie fuertemente coloreada, i ncluyendo la mayoría de las figuras incluidas en las láminas en color.
La explicación de los posefectos
Observe dos aspectos de los posefectos. En primer lugar, el posefecto siempre es el opuesto o complementario del movimiento o presión muscular o color original (cuando discutamos los mecanismos de la visión del color, veremos por qué el rojo es el color complementario del verde). Esto sugiere la existencia de dos sistemas antagónicos luchando entre sí. En segundo lugar, el posefecto necesita la estimulación prolongada de uno de los sistemas antagónicos : exposición prolongada a uno de los colores complementarios o al movimiento continuado en una dirección. Esto hace pensaren que el nivel de respuesta de los mecanismos neurales subyacentes pueden adaptarse o fatigarse, reduciendo la sensibilidad de entrada.
Consideremos el posefecto del movimiento. Se puede suponer que existen detectores neurales específicos del movimiento, estando los detectores del movimiento en una dirección igualados con la del movimiento en la dirección completamente opuesta. Supongamos, además, que estos dos detectores actúan en competición, originando la acción de uno el descenso en la acción del otro. También es necesario pensar que los detectores del movimiento están conectados entre sí para formar una nueva unidad detectora, que responde con respuestas neurales crecientes cuando ocurren movimientos en
LA PERCEPCION HUMANA 43
una dirección y con respuestas neurales decrecientes cuando el movimiento sucede en la otra dirección. Cuando no existe movimiento, los dos detectores están equilibrados entre sí y la salida de la unidad detectora es simplemente una respuesta de fondo, de nivel bajo -una respuesta que indica no movimiento.
Todo lo que se necesita suponer ahora es que ambas clases de detectores, que alimentan los circuitos, pueden fatigarse mediante estimulación prolongada. En consecuencia, después de una estimulación excesiva (y de fatiga) al movimiento, cuando se ve un objeto estacionario, los detectores fatigados no realizan su contribución normal para equilibrar la actividad en el par de detectores de movimiento opuesto.
La explicación de los posefectos del color sigue una línea similar de razonamiento. De nuevo, las células neurales están emparejadas, de forma que las células que responden de una forma están conectadas con células que responden de la otra manera, y así la salida de la parificación no es más que la diferencia entre los dos. Si un receptor rojo está emparejado con uno verde, ambos respondenpor igual ante la presencia de luz blanca, sin producirse ninguna salida de las células combinadas. La célula roja dispara con luzroja que conduce a una salida positiva ; la célula verde con luzverde, conduciendo a una salida negativa. Normalmente, cuandola luz blanca está presente1 tanto el rojo como el verde respondenpor igual, sin producir ninguna salida de las células combinadas. Ahora supongamos que el ojo se fija en un color rojo durantealgún tiempo. Por fatiga, la célula roja pierde su c�pacidad derespuesta. ·Pero sí ahora el ojo se fija en una luz blanca, el verde responde normalmente, mientras que la respuesta normal del rojo se inhibe. Como es lógico, el resuJtado es que la respuesta verde excede a la roja, y la luz blanca se ve como verde.
Aunque el posefecto indica que la fatiga ocurre en alguna parte de la cadena de acontecimientos que conducen a la percepción, la simple existencia del efecto no proporciona información alguna sobre las partes del sistema que están fatigadas. Se necesitan más datos para determinar dónde ocurre la fatiga. La principal técnica consiste en comprobar si el posefecto se transfiere entre los ojos : se estimula un ojo hasta que aparezca la fatiga y después se comprueba el posefecto en el otro ojo. Si no se observa posefecto, se supone que los responsables son los mecanismos periféricos. El posefecto del color que hemos descrito hasta aquí no se transfiere entre los ojos. Por tanto. son el resultado de la fatiga o la adaptación de los mecanismos periféricos, que se debe probablemente al agota-
44 PROCESAMIENTO DE INFORMACION HUMANA
miento de las reservas químicas de los receptores de color del ojo mismo.
Sin embargo, está menos claro cuál es el lugar exacto de la fatiga que subyace a los posefectos del movimiento. Algunos estudios han registrado transferencia entre los ojos, lo que sugiere un fenómeno de fatiga en los procesos centrales. Otros trabajos han fracasado en la búsqueda de esta transferencia.
La conclusión es que estos posefectos entrañan la operación de tipos específicos de circuitos neurales en el sistema analizador sensorial. Parecen insinuar la presencia de detectores específicos del movimiento y del color.
Adaptación orientada hacia un color específico
Se ha descubierto hace poco un conjunto de interesantes posefectos. El fenómeno fue registrado por primera vez por McCollough en 1 965, y fue bautizado con su nombre : el Efecto McCollough (McCollough, 1 965). U na vez más, el efecto surge de la consideración de los detectores humanos de características.
Ya hemos sugerido que puede haber detectores especiales para líneas : supongamos que no sólo existen detectores de líneas sino también detectores de líneas coloreadas en el sistema visual humano. ¿Cómo se podría demostrar su existencia ? Siguiendo el razonamiento de la sección anterior, una estrategia consiste en fatigar un conjunto de detectores de líneas, y presentar después un objeto neutral. Si existe el conjunto complementario de características, aparecerá por sí mismo.
Supongamos que existen detectores de líneas horizontales rojas y verdes. Después de una exposición prolongada a líneas horizontales verdes, las líneas horizontales blancas aparecerían de tono roj izo (el blanco tiene igual cantidad de rojo y verde). ¿Este efecto es específico de las líneas horizontales, o es una adaptación a todos los colores verdes ? Para determinar esto, fatigamos simultáneamente los detectores de líneas verticales rojas, de forma que las líneas verticales blancas deberán aparecer corno verdes.
Este es el Efecto McCollough. Durante cinco minutos, se les muestra a los sujetos alternativamente líneas verticales rojas (Figura l -50 a) y después líneas horizontales verdes (Figura 1 -50 b ), distanciando cada una de las formas en unos 5 segundos. A continuación se presenta al sujeto una configuración de prueba, que consiste en líneas negras y blancas en diversas orientaciones (Figura 1 -50
LA PERCEPCION HUMANA 45
c) : las líneas horizontales blancas se ven rojizas ; las líneas verticales blancas se ven verdosas ; las líneas oblicuas se ven blancas. Si se inclina la cabeza hacia un lado de forma que las líneas oblicuas se convierten en horizontales o verticales, entonces adoptan la coloración adecuada.
(a)
� Rojo
(b)
I Negro
I� o Verde
(<)
Negro Blanco
FIGU RA 1 -50 De Gíbso11 y llarris ( 1968) .
El efecto tiene varias cosas sorprendentes. Por un lado, es muy persistente. Algunas personas todavía ven coloreadas las líneas blancas durante 8 ó 1 O horas después de la estimulación. De hecho, algunos pretenden haber visto los posefectos durante una semana: un tiempo sorprendentemente largo par¡i un simple fenómeno perceptivo. El efecto no es una posimagen simple del tipo que produce que un cuadrado negro tenga una posirnagen blanca. Las posimágenes necesitan una prolongada estimulación sin ningún movimiento del ojo. Pero lo más sorprendente de todo, es que el efecto no está de acuerdo con dos intuiciones básicas sobre los detectores de líneas.
Si las adaptaciones a un color específico ocurriesen a causa de circuitos específicos para detectar líneas, entonces se podría sospechar que, difuminando los contornos entre las rayas negras y blancas de la configuración, se destruiría el efecto (las líneas no se ven con nitidez). Por otro lado, el cambio de contraste entre las líneas blancas y negras de la forma no tendría . ningún efecto, puesto que las líneas aún se verían con claridad. La inversa es verdadera : el cambio de distancia focal no tiene ningún efecto ; el incremento de diferencias de intensidad incrementa el posefecto.
El Efecto McCollough demuestra la actuación de dos sistemas complementarios sensibles a ciertas formas de estímulos visuales. Y, de hecho, se han encontrado recientemente un pequeño número de detectores de líneas coloreadas -unidades que son máximamente
46 PROCESAMIENTO DE INFORMACION HUMANA
sensibles a líneas de un cclor específico-- en el cerebro de los monos. Sin embargo, hay que ser cuidadosos al sacar conclusiones. Los detectores de líneas son bastante más complejos de lo que se necesita para explicar el fenómeno perceptivo. Cuando lleguemos a discutir los circuitos neurales para el rec0e.ocimiento de características, encontraremos que un tipo mucho más simple de detectores proporciona quizá una explicación más apropiada de los datos (ver página 1 06).
Antes de abandonar el Efecto McCollough, es interesan.te observar que también funciona en el movimiento de imágenes. Se construye una franja de rayas horizontales que pueden moverse hacia arriba o hacia abajo. Cuando las rayas se mueven hacia arriba, se colorean de verde; cuando se mueven hacia abajo, son rojas. Se mantiene cada una de las direcciones del movimiento durante 5 segundos : las direcciones se alternan mientras se observan durante un tiempo total de unos 5 minutos. Después, se presenta una imagen de prueba de líneas horizontales negras y blancas que se mueven hacia arriba o hacia abajo. Cuando la imagen de prueba se mueve hacia arriba, las líneas aparecen rojizas ; cuando se muev�n hacia abajo las líneas aparecen verdosas (Stromeyer, 1 969 ; Stromeyer v M ansfield, 1 970). • Este fenómeno es una analogía exacta del Efecto McCollough.El cambio consiste en sustituir las líneas estacionarias de distintas orientaciones por movimiento hacia arriba o hacia abajo. ¿Significa esto que existen detectores de movimiento sensibles al color?
PERCEPCIÓN SIN CARACTERÍSTICAS
Los trabajos sobre la fijación de imágenes y los posefectos representan algunas de las técnicas para estudiar los tipos de detectores de características que pueden .actuar en la visión humana. No se puede dudar de la existencia de detectores de características específicas en los seres humanos. Pero se duda sobre los tipos exactos de detectores que actúan y sobre su papel en la percepción humana. Al menos, un neurofisiólogo notable (Spinelli, 1 967) mantiene que los detectores específicos son importantes para los animales inferiores, pero su presencia en el hombre es simplemente un descuido evolutivo (es decir, son un exceso del bagaje evolutivo). Existen características en la percepción humana que no se pueden manipular fácilmente mediante una llamada a sistemas de detección de características.
LA PERCEPCION HUMANA 47
Retrocedamos a través de los ejemplos de este capítulo. Miremos al perro, o a alguna de las otras figuras. ¿Qué características están presentes ? ¿Cómo se construye un perro con esa mezcla de manchas, donde no existen líneas o bordes claros? ¿De qué manera se enfrentan las organizaciones de la pintura de Dalí, o las distintas interpretaciones de la misma forma cónica en el cuadro de Magritte, explicándolas mediante análisis de características ? Consideremos el problema de «ven> una sensación con la piel.
La visión con la piel
Sí alguien dibuja una letra mayúscula sobre su brazo o espalda, no hay ninguna dificultad en determinar qué letra es. Es poco probable que se tengan detectores de características en la piel adecuados para esta tarea. Para interpretar estas sensaciones táctiles se necesita un esfuerzo constructivo por su parte para recrear el camino señalado y decidir sobre la configuración adecuada. Si el reconocimiento de formas se puede realizar de esta nueva forma, sin detectores de características, ¿son auténticamente necesarios para la visión normal?
Consideremos una situación más controlada, donde se dibuja una imagen visual compleja en los receptores táctiles de la piel, en lugar de hacerlo sobre los receptores de luz del ojo . Los datos provienen de trabajos recientes sobre sistemas sustitutivos de la visión para ciegos.
El aparato para traducir una imagen visual en una táctil co�siste en una cámara de televisión que está conectada a un conjunto de vibradores táctiles para estimular los receptores del tacto. En tal aparato, la imagen visual se transforma en una impresión táctil, enviando la imagen a un banco de 400 v1bradores táctiles, ordenados en un cuadrado de 25,4 centímetros y colocado en una silla de peluquero. (Este aparato fue construido y comprobado por White, Saunders, Scadden, Bach-y-Rita y Collins, 1970). El observador se sienta en la sil la con su espalda contra los vibradores. Las regiones de alta intensidad de luz en la escena visual activan los vibradores de la región correspondiente en el conjunto de vibradores. Lo� vibradores permanecen inactivos para las reg iones de baja intensidad de la imagen visual. De esta forma, cuando el observador mueve la cámara de televisión recorriendo la escena, las configuraciones de intensidad de luz de las escenas visuales se reproduGen en sucesivas imágenes táct i les impresas en los receptores de tacto de su espalda (Figura 1 - 5 1 ) .
48 PROCESAMIENTO DE INFORMACION HUMANA
La imagen se transmite a la
espalda. por medio de una
banda de 400 vibradores
Cámara T.V.
FIGURA 1 -5 1 D e Whire, Saunders, Scadden, Bach-y-Rita y Collins ( 1970) .
Teniendo en cuenta la tosquedad de la imagen tácti l, los observadores videntes y los ciegos muestran una notable capacidad de reconocimiento utilizando este artefacto. En un primer intento pueden distinguir fácilmente barras horizontales de verticales. Aprenden rápidamente a identificar formas geométricas simples -drculos, triángulos y cuadrados-. Se necesita más experiencia para reconocer objetos más complicados, tales como tazas de café y teléfonos. Con práctica, sin embargo, los sujetos videntes y los ciegos pueden aprender a identificar hasta 25 objetos comunes mediante sus imágenes tactiles. Además, cuando los objetos están ordenados sobre una mesa y se miran desde cerca, los observadores también pueden registrar las posiciones y profundidades relativas de los objetos de la escena.
Este descubrimiento, hf capacidad para percibir profundidad en una imagen táctil de dos dimensiones, es de particular interés. Un indicio importante de profundidad parece ser la altura relativa de los objetos a diferentes distancias. Algunos observadores también descubrieron la relación entre el tamaño de la imagen y la distancia del objeto en el ambiente. En un ejemplo, un psicólogo ciego, que frecuentemente había enseñado a estudiantes sobre cambios entre el tamaño de la imagen y la distancia, registró un descubrimiento auténticamente clarividente (una experiencia ¡ajá !), cuando percibió los cambios en la imagen táctil al moverse un objeto desde cierta distancia hasta las lentes de la cámara.
En general, los observadores con ceguera congénita se desenvuelven igualmente tan bien como los observadores de visión normal.
LA PERCEPCION HUMANA 49
Si un observador ciego no ha experimentado el objeto mediante una sensación táctil anterior, entonces siente su forma antes de que pueda reconocer su imagen táctil. Finalmente, el permitir al observador controlar la cámara, parecía un heclto crucial para un reconocimiento exacto. Muchos objetos que Jos observadores no podían aprender a reconocer simplemente manteniendo la cámara en una posición fija, sin embargo, podían identificarlo fácilmente cuando se le permitía recorrer la imagen de nuevo a través de los receptores táctiles de su espalda.
El estudio de los sistemas de la sustitución visual plantea algunos problemas fundamentales sobre la estructura del análisis perceptivo. Hemos visto que una configuración discreta de puntos se imprime sobre nuestra piel -una tosca analogía de la configuración de luz que golpea los receptores retinianos. Y, aún así, todavía pueden reconocerse las formas complejas. Algunas de las ilusiones visuales que se atribuyen con frecuencia a los niveles superiores de análisis también se experimentan cuando se utilizan los estímulos equivalentes táctiles, de forma que las líneas que constituyen los dibujos se sienten en lugar de verse. Por tanto, el ciego también experimenta i lusiones «ópticas».
¿Significa esto que los canales neurales que conducen la información táctil están estructurados de la misma forma que la que transmiten datos visuales? ¿Existen detectores de líneas y detectores de ángulos para analizar la información táctil ? Si no es así, ¿cómo se pueden analizar estas complejas configuraciones táctiles ? Puede ocurrir que los detectores complejos no sean necesarios. Quizá son ·simplemente una construcción inútil en el sistema visual. Estosson problemas importantes, pero todavía no sabemos solucionarlos.
Hay que tener especialmente en cuenta el papel crítico del movimiento activo al reconocer imágenes táctiles. El movimiento es muy importante en el procesamiento de la información visual. Aparentemente, los sistemas perceptivos están diseñados en general para extraer más información de la sucesión de acontecimientos producidos por una forma en movimiento que de las respuestas de una señal estática del ambiente. Sin embargo, ese movimiento sólo ayuda si es el observador mismo el que realiza el movimiento. Cuando es otra persona la que realiza el movimiento del objeto (o de la cámara de televisión), e l movimiento no representa una ayuda. Un descubrimiento análogo ocurre con el movimiento activo y pasivo de los ojos. Si se mueven los ojos normalmente, mediante control activo de los músculos oculares, el mundo parece normal. Si los ojos se mueven pasivamente, presionándolos suavemente con
50 PROCESAMIENTO DE INFORMACION H U MANA
los dedos, parece que se mueve la escena visual. La compensación del movimiento del ojo no se produce a menos que se realiceactivamente. Lo mismo ·parece ocurrir en los movimientos táctiles.
Ya hemos comenzado el camino de exploración del reconocimiento de formas. En los siguientes dos capítulos, examinaremos algunos de estos problemas con más detalle : se discutirán tanto las operaciones neurológicas exactas de las células responsables del procesamiento inicial de las señales, como el estado de algunas teorías de reconocimiento de formas. Veremos que la extracción de características juega un papel importante tanto en el estudio de los mecanismos fisiológicos como en las estructuras teóricas. Sin embargo, como han sugerido las discusiones de este capítulo, el análisis de características no será suficiente para explicar todas las propiedades de la percepción humana.
LECTURAS RECOMENDADAS
Percepción
Una buena iniciación se realiza con los pequeños y atractivos libros de Gregory : Eye and Brain : The Psychology of Seeing ( 1 966) y The lntelligent Eye ( 1 970). Estos libros son interesantes y fáciles de ver. También son excelentes los libros Light and Vision (Mueller, Rudolph, y Editors of Time-Life Books, 1 969) y The Mind de Life Sciences Series.
Gibson ha hecho más que nadie por resaltar la importancia de los indicios físicos de los fenómenos perceptivos y sus dos libros (Gibson, 1 950, 1 966) están repletos de ejemplos sobre sus ideas. N osotros hemos utilizado algunas de sus ideas e ilustraciones, aunque no estamos de acuerdo con su punto de vista sobre el papel del conocimiento en la percepción. Con todo, nos hemos beneficiado mucho de sus escritos y de nuestras discusiones con él, y recomendamos sus libros.
Un buen libro sobre la percepción es la pequeña monografía de Hochberg ( 1 964, en rústica). Esta es una de las presentaciones más claras de los presupuestos y fenómenos de la percepción. Además, se puede ver el artículo de Hochberg, In de Mind's Eye ( 1 968), que está reimpreso en el libro de artículos seleccionados de Haber ( 1 968). Los mismos articulos son valiosos, puesto que son interesantes las reimpresiones que tienen. [Además, un segundo conjunto de artículos (Haber 1 969b) también es importante, pero no lo sufí-
LA PERCEPCION HUMANA 5 1
cientemente relevante para este capítulo de nuestro libro). Se puede encontrar otra buena selección de trabajos en Experiments in Visual Perception ( 1 966 : en rústica) de Vernon.
Se discutirán los trabajos sobre fijación de imágenes y posefectos en capítulos posteriores. Para una mayor información sobre reconocimiento de formas, se deben consultar las Lecturas Recomendadas del Capítulo 3. Sobre el· Efecto McCollough, ver las Lecturas Recomendadas del Capítulo 2.
Arte
Las discusiones clásicas de arte aparecen muy bien tratadas en los trabajos de Arnheim, y en sus diversos libros (Arnheim, l 969a,b ), al igual que en el libro de Gombrich, Art and Illusion ( 1 960). Nuestros ejemplos sobre ilusiones, arte óptico y otras obras de arte contemporáneo provienen de nuestros recorridos a museos y galerías. Se pueden utilizar excelentes catálogos de los museos, tales como el del Museo de Arte Moderno de New York [ver, por ejemplo, The Responsive Eye de Seitz ( 1 965)) y el Arts Council de Gran Bretaña (The Responsive Eye también se puede utilizar, sacándolo del Sandak Color Slides, Set núm. 6 1 7). Nuestra selección de pinturas de Magritte proviene de dos catálogos, uno del Museo de Arte Moderno (Soby, 1 965) y el otro de Arts Council de Gran Bretaña (Sylvester, 1 969). Un libro fascinante (aunque caro) es el de Vasarely ( 1 965), y las obras de Escher en el libro, The Graphic Work of M. C. Escher (Escher, 1 967) . Además, se deben examinar, si se está seriamente interesado en la percepción del arte, los trabajos de Bridget Riley (de Sausmarez, 1 970) y los libros de Albers ( 1 963) y Kepes ( 1 965) [Los dibujos de Albers, reproducidos en este capítulo, provienen de la agradable discusión sobre ilusiones geométricas del libro de Bucher ( 1 96 1 ) titulado Joseph A lbers. Des pite Straight Lines].
Una discusión interesante de la historia y desarrollo de la perspectiva en el arte. la proporciona Optics, Painting and Photography ( 1 970) de Pirenne. Este libro trata de las propiedades ópticas del ojo con bastante detalle.
Muchos magníficos ejemplos de arte óptico y otras ilusiones están reimpresas en Optical Illusions and the Visual Arts (Carraher y Thurston, 1 968). Este libro de Luckiesh ( 1 922), Visual lllusions, constituye una buena fuente para estos temas.
Pero, antes de nada, para disfrutar de las bases perceptivas
52 J;'ROCESAMIENTO DE INFORMACION HUMANA
del arte, se deben recorrer las galerías de arte, tanto privadas como públicas. Muchos artistas experimentan con fenómenos muy sofisticados, y la única m�nera de descubrir a los artistas consiste en buscarlos y verlos. Esto es especialmente válido para el arte sin objeto : las obras de los artistas sólo perduran en la medida de sus deseos, si es que llegan a tener presencia fisica completa. Nos hemos dado cuenta de que los temas discutidos en este capítulo son una magnífica base para mantener una conversación inteligente con los artistas, algo que no nos proporciona el aprendizaje formal del arte.
2 PROCESAMIENTO DE . INFORMACION NEU RAL
EL OJO DE LA RANA: La anatomía de los detectores.-PROCEDIMIENTOS FISIOLÓGICOS: La neurona. --Registro de respuestas neurales.-DISEÑO DE CIRCUITOS NEURA· LES : CIRCUITOS BÁSICOS.-·Los bloques de construcción.-EI receptor.-La célula nerviosa.-EXTRACCIÓN DE CONTORNOS : Sensibilidad versus especificidad.-Inhibición lateral.-Circuitos de extracción de contornos.--Campos centrales-periféricos.-Circuitos abiertos-cerrados.-RESPUESTAS TEMPORALES : Circuitos para producir respuestas transitorias.-RESPUESTAS AL MOVIMIENTO : Circuitos para detectar movimiento.-La luz que se mueve de izquierda a derecha.-La luz que se mueve de derecha a izquierda.-PROCESAMIENTO DE SEÑALES EN EL NÚCLEO GENICULADO LATERAL: EXTRACCIÓN DE CARACTERÍSTICAS.-Células simples.-Caract.:rístícas de respuesta.-Cómo construir detectores de líneas y de aberturas.-Dipolos.-Células complejas. -Cómo construir células complejas. -Células hiperéomplejas -Cómo construir células hipercomplejas.-CONCLUSIÓN.-LECTURAS RECOMENDADAS: Modelos del sistema nervioso.
EL OJO DE LA RANA
¿Cómo se puede comenzar a estudiar el procesamiento de información neural? ¿Qué intentamos buscar? Una manera de enfocar este problema es la de Lettvin, Maturana, McCulloch y Pitts ( 1959), autores del trabajo ya clásico sobre el sistema visual de la rana :
Entonces decidimos cómo deberíamos trabajar. En primer lugar, tendríamos que encontrar una forma para conseguir registros de fibras . . . aisladas del nervio óptico intacto. Segundo, pondríamos a la rana frente a una diversidad de estímulos visibles tan amplia como fuera posible, no sólo puntos luminosos sino también alimentos, objetos que provocasen su huida, diversas figuras geométricas, tanto fijas como en movimiento, etc. A partir de los distintos estímulos, intentaríamos descubrir cuáles eran las características comunes extraídas por cualquier grupo de fibras que hubiésemos encontrado en el nervio óptico. En tercer lugar, buscaríamos las bases anatómicas de agrupación. ¿Qué descubrieron estos investigadores en el interior del ojo de
la rana? Aparentemente, las ranas no viven un mundo animal muy r!co. En general, parecen ignorar la mayor parte de su ambiente vi-
54 PROCESAMIENTO DE INFORMACION HUMANA
sual y manifiestan una conducta exploratoria relativamente pequeña. A causa de su carencia de curiosidad y exploración activa, se pueden atrapar fácilmente acercándose por la espalda. Parece que se atienen principalmente a la presencia de sombras en movimiento, poniéndolas en guardia contra animales de rapiña y otros peligros. De hecho, la única característica que destaca en el uso de la visión de la rana es sli capacidad para cazar insectos que vuelen con movimientos rápidos. Esto lo consiguen esperando hasta que se acercan y, después, con un movimiento rápido y exacto de la lengua.
Lettvin y sus colaboradores encontraron un sistema nervioso visual que se corresponde con la conducta visual de la rana. Parece que el ojo de la rana sólo extrae cuatro formas de información del signo visual. Tres de los cuatro tipos de detectores están asociados a características bastante generales de la escena visual : detectores de contornos, que responden con fuerza a los límites entre las regiones claras y oscuras ; detectores de contraste de movimientos, que actúan cuando se mueve un contorno, y detectores de oscuridad que reaccionan cuando disminuye la iluminación.
Pero las respuestas del cuarto tipo de detectores son las más fascinantes de todas : detectores de contornos convexos, que sólo responden cuando un objeto pequeño y oscuro se mueve dentro del campo de la visión. Para que exista respuesta, el objeto debe ser oscuro, debe moverse y debe tener una forma aproximadamente circular. Cuando este tipo de objeto se introduce en el campo de la visión, un detector de contornos convexos comienza a responder lentamente. A medida que el objeto se mueve más cerca de la rana, el detector responde con más y más fuerza. La respuesta continúa aunque el objeto desaparezca súbitamente del campo visual (pero puede detenerse por un cambio brusco de iluminación, tal como el que origina un pestañeo). Naturalmente, este es un detector de insectos : proporciona con exactitud lJ información visual necesaria para conductas eficaces de cazade insectos.
Por tanto, esta investigación sugiere que el ojo de la rana tiene un patrón neural de insectos. La rana tiene un cerebro excesivamente primitivo. Al situar el detector de insectos en el ojo, se simplifican Jos procesos necesarios para la coordinación visomotora implicada en la caza de moscas. Pero pongamos a una rana en un ambiente nuevo, un ambiente en el que esté rodeada de cientos de moscas muertas, listas para ser comidas, pero sin ningún movimiento : el patrón fracasará y la rana se morirá de hambre. la especialización del ojo de la rana indica un alto grado de eficiencia y complicación neural, pero un bajo nivel de adaptación. Este sistema de reconocimiento de for-
PROCESAMIENTO DE INFORMACION NEURAL 55
mas visuales no es suficientemente flexible para adaptarse a nuevas condiciones.
LA ANATOMfA DE LOS DETECTORES
Las diferencias funcionales de las cuatro clases de detectores, encontradas en el ojo de una rana, parece que se reflejan en la organización neural de las células, al igual que en su apariencia visual. Las cuatro clases de receptores van a distintas áreas del cerebro ; además, los cuatro tipos de detectores tienen también un aspecto distinto .
La Figura 2-1 muestra tres cosas : (a) la clasificación de células prevista por Lettvin, Maturana, Pitts y McCulloch (196 1 ) ; (b) la clasificación real en renacuajos
CLASIFICACION PREVISTA
Fisíolo&ia Anatomía
Clase 1 Arool compacto
Detector de contornos T
Arbol E Clase 2 � Detector de contornos convexos
Clase 3 Arbol H Detector de contraste 'E de movimientos
Clase 4 Arbol extenso
Detector de oscuridad l:
FIGURA 2- l
CLASIFICACION REAL .
Fisiologla Anatomla
Claoe 1 Arbol compacto Detector de contornos
Clase 2 Arbol E Detector de contornos � convexos 4llll....
Clase 3 Arbol H Detector de contraste�� de movimientos / · · &._ --
Clase 4 Detector de oscuridad
Arbol extenso
Microfotografias (con el mismo aumento) de los tres tipos de células ganglionares , encontradas en la retina del renacuajo. De Pomeranz y Chung ( 1970).
56 PROCESAMIENTO DE INFORMACION HUMANA
aescubierta por Pomerariz y Chung ( 1970) ; y (c) fotografias de las céluias descubiertas por Pomeranz y Chung.
No es fácil determinar a cuál se parece cada tipo de receptor. Es posible realizar una disección del ojo de la rana y examinarlo bajo un microscopio. Entonces, se pueden ver realmente cuatro tipos distintos de células. Sin embargo, el problema continúa: ¿cuál es cada una?
Se necesitaron algunas estratagemas para determinar qué tipo de célula corresponde a cada uno de los tipos de detectores. El problema principal radica en que la disección mata las células : no es posible hacer registros eléctricos de una célula y, al mismo tiempo, examinarla con el microscopio, puesto que la actividad normal de una célula no se producirá a menos que las estructuras neuronales estén intactas. La disección quirúrgica necesaria para exponer las células a un estudio microscópico interfiere con su funcionamiento normal como detectores de formas. Por tanto, Pomeranz y Chung recurrieron a una deducción lógica. Estudiaron al renacuajo, no a la rana.
Parece que sólo existen tres tipos de células en los ojos del renacuajo, no cuatro. Al identificar la célula ausente, a partir de cuidadosos registros fisiológicos en renacuajos vivos, se pone de manifiesto que no aparece la respuesta a contornos. Evidentemente, el detector de contornos sólo se desarrolla en los animales más maduros.
Sólo existe un tipo de célula en la periferia del ojo del renacuajo. Registrando las respuestas de renacuajos vivos a las señales presentadas periféricamente, se identifica este detector como el detector de contornos convexos. Ahora quedan dos células por identificar : el detector de contraste de movimiento y el detector de oscuridad. Estos dos se determinan por deducción lógica. De las dos células que nos quedan, una tiene dos capas, mientras que la otra sólo una. Además, la célula de dos capas se propaga menos que la célula de una capa. Estos indicios descubren el rompecabezas. El detector de oscuridad tiene un campo receptivo mayor que el detector de constraste de movimiento. Además, claramente, es un circuito más simple, de forma que será la célula más simple, la de una capa, no la de dos.
El estudio del ojo de la rana representa el procedimiento y la filosofia de los investigadores fisiológicos. Los resultados demuestran que la rana ha desarrollado un análisis sensorial altamente complicado, diseñado para extraer información específica de la imágen visual. Naturalmente, no esperamos encontrar que todos los animales tengan detectores de insectÓs. De hecho, el procesamiento de la información sensorial realizado en especies superiores a la rana es, en cierto modo, mucho más simple pero también más elegante y flexible. Procede mediante pequeños pasos, empleando principios simples pero poderosos para combinar, reorganizar y analizar los datos que recorren los receptores del medio ambiente. Para llegar a entenderlo, debemos comprender el funcionamiento de la unidad básica del sistema nervioso -la neurona- y las técnicas para estudiar su conducta. Debemos explorar cómo sé
PROCESAMIENTO DE INFORMACION NEURAL 57 agrupan estas unidades para construir los circuitos neurales que analizan la información proporcionada por los sistemas sensoriales.
PROCEDIMIENTOS FISIOLÓGICOS
La Neurona
El bloque básico de construcción del sistema nervioso es la neurona, la célula que manipula la intercomunicación de información entre las distintas partes del cuerpo. De momento, es suficiente un conocimiento esquemático y simplificado de la neurona. Una unidad neuronal está compuesta de distintas partes (ver Figura 2-2) :un cuerpo celular (también llamado soma), una fibra nerviosa (también llamada axón) que transporta la información de una neurona a otra, y una unión terminal (una sinapsis) dondé la actividad de una neurona influye en las características eléctricas del cuerpo celular de otra.
Las uniones entre neuronas se producen o bien en el cuerpo celular mismo o en minúsculas extensiones del cuerpo celular llamadas dendritas. Además, un axón puede tener sólo unas pocas ramificaciones en su terminación, o puede tener un gran número de ramificaciones para realizar conexiones sinápticas con las células próximas. De la misma manera, el cuerpo celular puede tener sólo unas pocas conexiones de entrada que influyen sobre él, o puede recibir impulsos de miles de distintas neuronas.
Las fibras nerviosas se pueden concebir como conductores aislantes que transmiten las señales básicas del sistema nervioso, los impulsos eléctricos. Estos impulsos eléctricos (más exactamente, iónicos) se originan en el cuerpo celular en respuesta a la actividad de la sinapsis de entrada. En la misma sinapsis, la llegada de un impulso produce la liberación de una sustancia química transmisora, que atraviesa el pequeño espacio existente entre el axón de la neurona de llegada y la localización del receptor de la nueva neurona. La llegada de la sustancia transmisora al nuevo cuerpo celular, provoca un cambio en su potencial eléctrico normal. Si se recibe sustancia transmisora suficiente, el cambio en el potencial eléctrico del cuerpo celular será suficiente para iniciar un impulso, que después viaja por el axón hacia la unión sináptica siguiente, donde vuelve a repetirse el proceso completo.
Es un caso raro que la actividad de una conexión siná'ptica única sea suficiente para generar un impulso en la célula receptora.
58
(e)
PROCESAMIENTO DE INFORMACION HUMANA
(b) F I G U RA 2-2 (a) Esquema de dos neuronas, que repr.esentan los distintos tipos de uniones sinápticas. (b) Diagrama de una neurona, que muestra la irradiación de las dendritas y del axón a partir del cuerpo celular. De Jung ( 1953) . ( c) Esquema global que representa la interconexión de neuronas en el cerebro de la rata y el ratón. De Ecc/es ( 1953) .
Normalmente, es necesario que llegue una gran cantidad de impulsos a una célula, antes de que responda con su propio impulso. Las uniones sinápticas pueden ser de dos formas : excitadoras, donde el efecto del impulso de llegada consiste en incrementar la probabilidad de que la célula responda, o inhibidoras, donde el impulso de llegada reduce la probabilidad de que responda la célula receptora.
PROCESAMIENTO DE INFORMACION NEURAL 59
La respuesta de una célula a la configuración de actividad de la sinapsis de entrada es el resultado de cierto tipo de equilibrio químico, donde el balance de influencias excitadoras e inhibidoras determina el nivel de actividad final de la célula. La tasa de respuesta de una célula receptora depende generalmente de la tasa y configuración de los impulsos de llegada en la sinapsis de entrada, pero existen ciertas limitaciones. Después de emitir un impulso, una célula necesita alrededor de 1 / 1 000 seg. para recuperarse. Por tanto, y en teoría, la frecuencia máxima de impulsos con que puede responder una célula es aproximadamente de 1 000 impulsos por segundo, aunque en la práctica las tasas máximas de respuestas observadas son mucho menores, del orden de 300 a 800 impulsos por segundo.
Existen muchos tipos distintos de células neurales, cada una de las cuales realiza determinadas funciones especializadas. Para nuestros propósitos actuales, la célula especializada más importante es la .célula receptora o transductora. Estas unidades son las responsables de la conversión de la energía de un signo externo fisico en impulsos eléctricos. Los bastones y conos del ojo son ejemplos de transductores, que convierten la energía electromagnética de la estructura de luz en respuestas neurales. De la misma manera, las células ciliares del oido interno son transductores que convierten la energía mecánica de las señales acústicas en un código .neural.
Registro de respuestas neurales
Puesto que una respuesta neural es una breve descarga eléctrica, para poder registrar la actividad neural es necesario poder conectar conductores eléctricos a las neuronas. El artefacto que se utiliza con este propósito se llama electrodo. Normalmente, el electrodo está conectado a un amplificador electrónico que amplifica los pequeños impulsos eléctricos. La salida del amplificador pone en funcionamiento monitores electrónicos, que permiten al experimentador escuchar y ver las respuestas neurales producidas por un signo externo.
El osciloscopio se utiliza para trazar un dibujo de los cambios de voltaje de la neurona en función del tiempo. Los impulsos neurales producen ondas en forma de espiga en la pantalla cuando el impulso atraviesa el electrodo de registro. Si se envía la señal a un altavoz, es posible escuchar un chasquido cada vez que se origina un impulso en la neurona. Además, las respuestas nenrales se registran con frecuencia en cintas magnetofónicas para realizar
60 PROCESAMIENTO DE INFORMACION HUMANA
análisis posteriores, o se puede fotografiar la pantalla del osciloscopio, y también es posible realizar el análisis mediante un computador digital a medida que ocurren los impulsos.
0 0 0 º º º º º º
Computador
r-------------------1 0 ° 0 ooo o o o º º º o 0 o 000 Conexión. eléctrica
Amplificado------< Pre-amplificador ______ O_s_ci_lo_sc_o_,_pi_o __ so�bre el cráneo
Altavoz
FIGURA 2-3
Las fibras nerviosas son pequeñas en la mayoría de los sistemas sensoriales -normalmente- de 3 a 5 micras (µ) de diámetro (una micra es una milésima de milímetro). Por tanto, para aislar la actividad de una neurona se necesita un electrodo muy pequeño, un microelectrodo. El extremo de un microelectrodo varía de O, l a l µ de diámetro, en función del tipo de electrodo. Por el contrario, se puede utilizar un electrodo ligeramente más grande, un macroelectrodo, para registrar la actividad combinada de un grupo de fibras cercanas. El extremo de un microelectrodo es con frecuencia tan pequeño que no puede verse con un microscopio de luz, teniendo que utilizar un microscopio electrónico.
Ambos tipos de electrodos son útiles. A menudo, parece que un gran número de neuronas vecinas extraen tipos similares de información a partir de la señal de entrada, sin que ninguna fibra aislada sea la responsable de proporcionar los datos pertinentes al cerebro. En este caso, es interesante estudiar las características de la actividad conjunta de respuesta de las fibras agrupadas, me-
PROCESAMIENTO DE INFORMACION NEURAL 61
<liante macroelectrodos. En otras situaciones, se necesitan microelectrodos. Las neuronas interactúan frecuentemente entre sí, de una forma compleja, durante el análisis y la codificación de las señales sensoriales. Para descubrir la naturaleza de las interacciones, tiene que examinarse la configuración detallada de la respuesta de cada unidad individual.
¿Dónde debe colocarse el electrodo? En los sistemas sensoriales, las sinapsis de las fibras que transportan mensajes sensoriales tienden a agruparse en una región llamada estación sináptica o estaciónde relevo. Puesto que la mayoría de los cálculos desarrollados por el sistema nervioso se realizan en las uniones entre neuronas, estas estaciones de relevo son lugares aprovechables para comenzar las investigaciones. Estudiando tanto la entrada como la salida, intentamos determinar cómo se elabora la información sensorial cuando atraviesa una estación sináptica.
La elección de un animal experimental depende de muchos factores. Un cierto número de estudios básicos se han realizado en el ojo del Limulus o cangrejo, principalmente porque sus células retinianas son relativamente grandes y fáciles de registrar. Se necesitan animales más evolucionados, si es que deseamos investigar sistemas más directamente aplicables al hombre. Se acostumbra a utilizar gatos y monos con este propósito. Otros animales, tales como el pez y, menos frecuentemente, los pájaros, se estudian cuando sus sistemas sensoriales ofrecen alguna ventaja determinada para investigar cierto tipo de codificación neural. Los humanos sólo se utilizan ocasionalmente, casi siempre cuando es necesario realizar alguna operación quirúrgica del cerebro, y el registro de las respuestas neurales sólo significa apartarse un poco del proceso operativo, o bien cuando es uno de los procedimientos necesarios para la operación misma.
DISEÑO DE CIRCUITOS NEURALES
Ahora ya tenemos los instrumentos necesarios para comprender los circuitos neurales. Consideremos el problema de detectar un objeto en movimiento. ¿Cómo explicar el paso de las respuestas simples de los receptores sensibles a la luz hasta una neurona que sólo responde si un objeto se mueve a través del campo visual de derecha a izquierda? ¿En qué consiste la teoría del circuito del sistema nervioso?
En las siguientes páginas, construiremos circuitos neurales que
62 PROCESAMIENTO DE INFORMACION HUMANA
detectan el contorno de una figura, el movimiento, el color y otras configuraciones. Comenzaremos con las interacciones más simples del sistema y continuaremos hasta el punto en que, si continuásemos avanzando, podríamos producir en teoría un conjunto de neuronas que sólo responden cuando un objeto muy complejo, como podría ser un familiar, se pone ante nuestra vista. Sin embargo, nos detendremos justo en ese momento, puesto que tendríamos que enfrentarnos a los problemas con que se enfrenta el resto del libro. ¿Es posible realmente construir un detector de un familiar ? ¿Existe en verdad una célula específica en el cerebro que sólo responde en ese caso determinado ? El análisis y reconocimiento de configuraciones complejas será el tema del siguiente capítulo. Mientras tanto, antes de discutir el problema en su totalidad, necesitamos obtener experiencia con grupos de neuronas que tengan actividades determinadas o específicas.
Comenzaremos con los circuitos más simples y continuaremos hasta los más complejos. Esto significa que empezamos con los sistemas sensoriales y después éonti'nuamos por el camino neural hacia el cerebro. El análisis se fundamenta en el sistema visual, porque es útil como fuente adecuada de material y porque se conoce más sobre las conexiones de neuronas en el ojo y centros visuales que sobre los otros sistemas. Pero los bloques básicos de construcción son similares para todas las ' modalidades sensoriales. U na vez que sean conocidos los principios para construir los circuitos que analizan las señales· visuales, no es difícil organizar circuitos para otros sistemas.
Antes de comenzar, unas palabras de precaución. Cuando se estudian los tipos de análisis realizados por los sistemas sensoriales, es inteligente recordar la complejidad con la que se enfrenta quien rastrea el diagrama del cerebro. En el sistema visual del hombre existen unos 1 25 millones de elementos receptores básicos en cada ojo. En el cerebro, existen aproximadamenti; 40 millones de sinapsis por centímetro cúbico. Cada neurona cortical (y existen cientos de millones) tiene de 6.000 a 60. 000 sinapsis sobre ella, en función de la sección del cereb.ro en que esté localizada. Frente a estos números, y considerando lo delicado del electrodo necesario para registrar una célula aislada y los múltiples detalles biológicos, electrónicos y mecánicos que son necesarios para que un experimento tenga éxito, resulta admirable todo lo que se ha conseguido.
�arte de lo que presentamos en este capítulo son hechos bien experimentados. Otros aspectos pertenecen al plano de la teoría. Al leer estas secciones, es conveniente recordar que la exploración
PROCESAMIENTO DE INFORMACION NEURAL 63 de funciones específicas de células aisladas en el cerebro hace muy poco que acaba de empezar. Los resultados hasta este momento son excitantes y sugestivos. Pero están muy lejos de estar completos.
CIRCUITOS BÁSICOS
Los bloques de construcción
Cuando estudiamos la construcción de los circuitos sensoriales, deben considerarse dos niveles del sistema : el conjunto de células que transforman la señal física externa en disparo neural -los receptores o transductores- y las células que combinan las señales neurales en diversas formas, -llamadas simplemente células neurales o algunas veces células bipolares o ganglionares. No siempre somosescrupulosamente exactos en la terminología neurológica. Con r:ecuencia se utilizan conceptos abstractos como receptores y ganglios cuando en realidad se incluyen una complejidad total de elementos ---células amacrinas, células horizontales, receptores de varios tipos y una gran variedad de mecanismos sinápticos. Pero los elementos importantes de los circuitos neurales pueden presentarse más fácilmente si nos limitamos a dos tipos de diseños : transformadores Y combinadores, o en términos neurales, células receptoras y células neurales.
El receptor. El receptor reacciona a señales externas -sonido, luz, tacto, sabor-- y provoca una respuesta neural. El símbolo para un receptor se muestra en la Figura 2-4. Representamos la salida de un receptor mediante un número - -la tasa en que se producen las respuestas neurales. En general, simplificamos las cosas al ignorar los mecanismos que traducen una intensidad física en una tasa determinada de respuesta. De esta forma, especificamos la intensidad de una señal mediante el número de respuestas neurales que se producen en el receptor. Una señal de intensidad 5 significa una señal con una intensidad que produce 5 unidades válidas de respuesta neural. La Figura ilustra los símbolos y cómo se utilizan.
La célula neural. Es un artefacto de propósito general para mezclar entradas neurales. El símbolo para la célula neural es un círculo. Existen dos tipos de conexiones o entradas en una célula neuraL una es excitadora, la otra inhibidora. Una neurona recibe tantas entradas como sean necesarias, pero sólo existe una salida {aunque puede dirigirse hacia muy distintos lugares).
64 PROCESAMIENTO DE INFORMACION HUMANA
Símbolos de receptores
10 Intensidad sensorial 5
o
1 0
Respuesta neural
o
o o
?? o o
Luz (o cualquier señal sensorial)
Respuesta neural
1 0 1 0 o o
?? 10 1 0 o o
FIGURA 2-4
Señal sensorial
Receptores
Respuesta
Con frecuencia, una neurona tiene una tasa fundamental de respuesta. Es decir, aunque no le llegue ninguna señal, puede existir una salida de la célula. En los siguientes circuitos, la tasa fundamental correspondiente a la actividad espontánea se coloca frecuente-
PROCESAMIENTO DE INFORMACION NEURAL 65
mente a 100. En determinadas aplicaciones este número puede variar, siendo algunas veces superior, otras inferior y algunas veces cero.
A cada entrada de una célula neural se le asigna un número positivo o negativo. El número es la ganancia de esa entrada. Una entrada con una ganancia positiva ( + ) es excitadora ; una entrada con una ganancia negativa ( - ) es inhibidora. Por ejemplo, supongamos que una entrada tiene una ganancia de 0,5. Esto signifi-
�ii-"' .V�� ���¡.. v¡ºs � �s
Célula neural o ganglionar
Respuesta
ENTRADAS EXCITADORAS
80� y Tasa fundamental= 100
Respuesta : l 00 + 0.25 x 80 = J 20
ENTRADAS INHIBIDORAS
80� y Tasa fundamental= 100
Respuesta: 100-.25X80=80
ENTRADAS COMBINADAS
75 �--72
�----70 Tasa fundamental= 100
Respuesta : 1 00 - 1/e (80) + 1/2 (78) + 75 + '/8 (72) - '/, (70) = 178
FIGURA 2-5
66 PROCESAMIENTO DE INFORMACION HUMANA
ca que por cada 1 00 unidades de actividad neural en la entrada, la salida de la neurona se incrementa en 0,5 x l 00 o 50 unidades. Si la ganancia fuese de - 0,5, la salida de la neurona sufriría un decremento de 50 unidades por cada 1 00 unidades de entrada. Para simplificar los diagramas, las conexiones excitadoras se representan mediante flechas ; las conexiones inhibidoras por puntos. La salida de una neurona es la suma algebraica de la tasa fundamental más la contribución de todos los impulsos excitadores, menos la contribución de todas las unidades inhibidoras.
EXTRACCIÓN DE CONTORNOS
La información básica de una imagen visual se transporta mediante variaciones en las intensidades de luz que golpean las distintas partes de la superficie de la retina. Estas variaciones se extienden sobre una gran parte de la escena visual, en correspondencia con las variaciones de luminosidad en los distintos componentes de la escena. En los lugares que se corresponden a los contornos de los objetos, el cambio en intensidad es brusco y fuerte. La organización de las interconexiones neurales en el aparato receptor, determina cómo se codifican estas configuraciones luminosas en impulsos neurales por medio dei sistema nervioso visual.
Sensibilidad versus especificidad
Por otro lado, es deseable tener sistemas sensoriales tan sensibles como sea posible a las señales que oéurren en el ambiente. Además, ·un sistema sensorial debe retener tanto como pueda los detallesde la estructura energética de la señal externa. Estos dos requisitosentran en conflicto. Consideremos la organización básica de los
FIGURA 2-6 Microfotografia de células de la fóvea humana, vistas de frente, de Po/yak (1957) .
PROCESAMIENTO DE INFORMACION NEURAL 67
receptores en un sistema sensorial, los detectores de luz del ojo (bastones y conos).
En este caso, existen numerosos elementos receptores individuales fuertemente agrupados. La energía luminosa que incide sobre el ojo se distribuye · á través de estos receptores. Para conseguir un sistema sensible, la forma más simple de conectar los receptores con el siguiente nivel celular del sistema (llamadas células ganglionares) , consiste en conjuntar las respuestas de cierta cantidad de receptores y emitirlas hacia una célula ganglionar única (Figura 2-7).
Receptores de la retina
Célula ganglionar
Receptores de la retina
FIGURA 2-7
68 PROCESAMIENTO DE INFORMACION HUMANA
Cuantos más receptores estén conectados a una célula ganglionar única, más sensible es el sistema a señales luminosas débiles. Para obtener el máximo de respuesta, una célula ganglionar deberá agrupar las respuestas de tantos receptores como pueda.
Pero el incremento en sensibilidad se realiza a costa de un precio. Si una célula ganglionar agrupa las respuestas receptoras de una amplia región de la retina, se pierde la capacidad para discriminar diferentes estructuras luminosas. Los campos receptores de una célula ganglionar deberán ser pequeños, si se desea retener los detalles de las formas luminosas. De esta forma, cuando consideramos las posibles formas con que puede organizarse la información receptora en el primer nivel de procesamiento sensorial, encontramos un intercambio entre el mantenimiento de la sensibilidad y el registro de los detalles de la señal.
Inhibición laterat
Las técnicas necesarias para descubrir el ·diagrama de activación del ojo son bastante engañosas. Sólo se pueden registrar a la vez unas pocas células distintas. Una gran parte de la estructura de las interconexiones neurales sólo se pueden deducir mediante experimentación inteligente.
Una gran cantidad del conocimiento básico del ojo proviene del estudio del Limu/o o cangrejo.
F I G U RA 2-!S Limulo o cangrejo. De Corns11·eet 1 1970) .
PROCESAMIENTO DE INFORMACION NEURAL 69
Este animal tiene un ojo muy accesible, con fibras nerviosas grandes y fáciles de analizar. El primer paso consiste en realizar una disección del ojo, de forma que los receptores individuales puedan estimularse directamente sin necesidad de atravesar lentes ni sustancias biológicas (Figura 2-9).
FIGURA 2-9 Ampliación del ojo lateral del Limulo. De Cornsweet ( 1970).
Esto permite al experimentador estimular una célula receptora individual del ojo. A continuación, se coloca el electrodo en una célula ganglionar y se emite una luz.
Supongamos que se observan las respuestas de la célula ganglionar cuando la luz se dirige hacia el receptor etiquetado con A en la Figura 2- 10. Si se incrementa la respuesta neural de la célula ganglionar, entonces parece evidente que esta célula registra la actividad del receptor A.
Supongamos que la luz se mueve hacia el receptor B y tomacontacto con él. En esta ocasión, el electrodo no registra ningún cambio en la actividad de la célula ganglionar (Figura 2- 1 1) . Aparentemente, el receptor B no influye en la célula ganglionar de A.Pero antes de sacar la conclusión de que sólo el receptor A afecta a esta célula ganglionar, consideremos lo que sucede con una combi-
70 PROCESAMIENTO Dti INFORMACION HUMANA
nación de luces. Comencemos de nuevo con la luz en A. Después, conectamos una segunda luz en B : la respuesta neural de la célula ganglionar decrece.
Luz en A Luz en B
�������� � �·�,,.� ������� ' � Estimulación de A : Célula ganglionar Estimulación de B : Respuesta observada en la célula ganglionar
FIGURA 2-10
Luz en B Luz en A
Estimulación de A v B :l a respuesta de l a célula ganglionar se retrasa cuando se estimula B.
] il e
J�
Ninguna respuesta de la célula ganglionar
FIGURA 2-11
� '----+�����������-� ---f Comienzo de luz A 1 1 �,,-C-om-i-en_z_o-de�lu-z B
1 1 � .. 1111411111••11•1111r1i11n111111 I 1 1 11 1 1 11 1 1 1 1 1; Impulsos nerviosos reales
F I G U RA 2-1 2
Aunque la luz sobre receptores distintos de A no pueden iniciar una respuesta en la célula ganglionar, sin embargo pueden hacer decrecer cualquier actividad de la célula ganglionar que ya esté actuando.
Este simple experimento demuestra uno de los mecanismos más importantes del procesamiento de información sensorial : la inhibición lateral. La actividad de una célula se modifica por medio de la actividad de otras cercanas. Conceptualmente, la noción es simple. Pone de manifiesto la actuación de un proceso inhibitorio,
PROCESAMIENTO DE INFORMACION NEURAL 71
que hace que las respuestas de una célula disminuyan a partir de las respuestas de otra : calcula la diferencia entre dos entradas. La aparente simplicidad es un engaño. En realidad, proporciona toda la potencia de cálculo necesaria para convertir una estructura complej a de luz que afecta a los receptores, en la reorganización abstracta del mensaje sensorial que eventualmente se envía a los centros superiores del cerebro.
Circuitos de extracción de contornos
Con los mecanismos de inhibición lateral actuando, considere las propiedades básicas de una retícula que extrae los contornos de una figura. Comenzaremos con una red uní-dimensional con todos los receptores alineados. Una luz se extiende sobre los receptores. El problema de detectar contornos consiste en determinar donde está cambiando la intensidad de luz. Si existiese una conexión simple, directa entre los receptores y las células ganglionares, no se podría conseguir nada (Figura 2-1 3).
La respuesta neural sería simplemente una reproducción bastante exacta de la configuración de luces que inciden sobre los receptores. Esto es interesante en algunos casos, pero no proporciona ningún mecanismo para extraer los contonos de una figura. Se necesita añadir algo más al sistema.
Básicamente, para la extracción de contornos necesitamos tener una actividad de respuesta relativamente pequeña cuando las luces tienen una intensidad constante, y una gran cantidad de actividad cuando se producen cambios de iluminación. Una forma de conseguirlo consiste en utilizar la inhibición1 de forma que la respuesta de un receptor sea modificada por los receptores de sus alreded.ores. Por ejemplo, supongamos que existe una fuente de luz constante de 1 0 unidades : el receptor excitado produce una tasa de respuesta de 1 0. No deseamos ninguna salida de la célula ganglionar ante esta fuente de luz. Por tanto, necesitamofj. restar 1 0 unidades de actividad, posiblemente restando 5 unidades de cada lado. Esto se consigue fáci lmente estableciendo la conexión entre la célula ganglionar y sus receptores 'Vecinos a -0,5 (Figuras 2- 1 4 y 2- 1 5).
Las figuras representan un sistema que solo responde a los contornos de la estructura de luz. De hecho, si se estudia cuidadosamente, se verá que sólo responde cuando cambia la diferencia de intensidades de luz al incidir sobre pares sucesivos de células vednas.
Este circuito pone de manifiesto distintos puntos. En primer lugar, vemos la necesidad de una actividad fundamental o de fondo.
72
Intensidadde luz
lO
Respuesta neural
•
PROCESAMIENTO DE INFORMACION HUMANA
� 10 10 10 10 10 10
Receptores
Respuestas lO 10 1 0 1 0 10 10
• J l
FIG U RA 2-1 3
PROCESAMIENTO DE INFORMACION NEURAL 73
EL CIRCUITO BASICO Luz
Respuesta
PRINCIPALES CALCULOS JO 1 0 ! O
o o
1 0 1 0
(-2Y>) (-21',)
10 10 10 1 0
FIGURA 2- 1 4
74 PROCESAMIENTO DE INFORMACION HUMANA
Si no existiese una tasa fundamental, no se podría observar la parte negativa de la respuesta a la entrada, puesto que una tasa de disparo negativa, no tiene sentido. Sin embargo, con una tasa fundamental, se pueden observar las respuestas positivas y negativas, cuando aumentan y disminuyen la tasa normal a la que responde el ganglio. Esto se representa en la coordenada vertical derecha de la parte final de la Figura 2-1 5, donde se supone que la tasa fundamental es de 20 respuestas por segundo.
I ntensidad de luz
10
Una conexión tipica
Respuesta neural
(-•)
. . . . \ ,/\___/\ \/ \ / " 'l
F I G U RA 2-is
Respuestas
PROCESAMIENTO DE INFORMACION NEURAL 75
Este circuito sólo responde a los contornos : toma contacto con el mundo en forma de una caricatura dibujada. Las diferencias de intensidad total de las distintas regiones de la escena no se codifican : es posible que el circuito haya conseguido demasiado.
Tiene sentido llegar a un compromiso entre el primer sistema que no es sensible a la señal y el segundo que sólo extrae los contornos. Una forma de conseguirlo consiste en reducir el efecto de las conexiones inhibitorias. Supongamos que se provoca una ganancia de - 0,2 (Figura 2-1 6).
IO
Intensidad luminosa 5
Respuesta neural
10
1
ganglionares
Respuestas
F I G U RA 2- 1 6
76 PROCESAMIENTO DE INFORMACION HUMANA
Así conseguimos un resultado útil. Las respuestas más fuertes se producen ante los contornos, pero se retiene también la información sobre las intensidades relativas de las diferentes regiones.
En consecuencia, con la misma retícula básica, los ajustes en la fuerza relativa de los procesos inhibitorios alteran el tipo de información que se extrae de la imagen visual. Es necesario realizar medidas muy cuidadesas, para poder encontrar los valores típicos de inhibición en un sistema nervioso real. Proporcionamos aquí algunos gráficos de registros neurales, realizados en situaciones casi idénticas a las descritas anteriormente.
-Receptores
3.0 2.0
Al amplificador B 1.0 •
o Frecuencia (impulsos por segundo)
FIGU RA 2-1 7 De Hartline y Ratliff (1957).
Como ocurría antes, la tasa de impulsos neurales decrece cuando se conecta la luz A. El efecto de una neurona sobre otra es recíproco : A afecta a B de la misma forma que B afecta a A. También se puede observar que parece que existe un umbral para la operación de los procesos inhibitorios. No existe ningún cambio en la tasa de disparo de A hasta que B responde con unos 8 o 9 impulsos por segundo. Sin embargo, una vez que la inhibición comienza a actuar, la disminución de la tasa neural es lineal. La pendiente de la línea recta del diagrama indica que la cantidad en que una unidad afecta a otra es directamente proporcional a la tasa de respuesta. Concretamente, el coefi�iente de proporcionalidad es de 0, 1 6. Por cada incremento en la tasa de disparo de 1 0 impulsos por segundo, la neurona que recibe la inhibición decrece en 1 ,6 impulsos por segundo. De esta forma, la ganancia inhibitoria en
PROCESAMIENTO DE INFORMACION NEURAL 77
este circuito es de - 0, 16, muy cercana al valor de - 0,20 del circuito diseñado. Por tanto, la estructura de respuesta en el ojo del cangrejo seria muy semejante a la mostrada en la Figura 2- 1 6.
La Figura 2- 1 8 ofrece la tasa real de respuesta neural, medida en el ojo del cangrejo. La fotografía muestra la estructura de la prueba : exactamente la misma estructura luminosa que hemos estado examinando. El electrodo de registro estaba colocado en una célula ganglionar. Así, para ver la respuesta provocada por esta estructura luminosa fue necesario mover la luz, manteniendo el electrodo constante, como se indica mediante las flechas sobre el campo
� e 8 8.0 � � 7.0� ; = � 6.0� � .... 8. 5.0 .;;! rJ'.I o o ¡¡ -3 4.0 ¡: Q.
� ,s 3.0
\ \ o.o 1 .0
-2.0 -3.0 -4.0 - 5.0 " 5 LO � l 1 .0 .__ _________________ __. u ¡;:
0,5 mm. del ojo
FIGURA 2-18 Arriba: De Ratliff ( 1965). Abajo: de Rathffy Hartline ( 1959).
78 PROCESAMIENTO DE INFORMACION HUMANA
luminoso. Evidentemente, esto es muy fácil y totalmente equivalente a mantener fija la luz y mover el electrodo. En primer lugar, la luz estaba focalizada mediante una pantalla con una pequeña abertura sobre la parte del ojo donde estaba colocado el electrodo de registro---- el punto marcado con el símbolo ®. Sólo en la parte excitadora del campo receptivo se recibía la luz, de forma que las respuestas neurales (L'.1) reflejan el resultado de la actividad neural sin ninguna inhibición. A partir de este diagrama, podemos observar que esta respuesta neural proporciona un boceto bastante exacto de la estructura luminosa.
Después se retiró la pantalla y se expuso el ojo a la configuración total de luz. Esto permitió que todos los factores inhibitorios entrasen en acción ; la actividad neural resultante se representa en la curva inferior (O). La retícula de respuesta ya no es una reproducción simple ; se han acrecentado los límites de intensidades que cambian rápidamente.
Antes de abandonar este experimento, debemos examinar la estructura ofrecida en la Figura 2-19 . Mírela cuidadosamente. ¿Da la sensación de que las líneas son un conjunto de bandas oscurecidas por igual? ¿Parece que las bandas tienen todas una intensidad constante? Intente analizar la respuesta neural que produciría el circuito de la Figura 2- 1 6 ante tal estructura, el análisis sería equiparable a su percepción.
Todos los sistemas sensoriales estudiados por este procedimiento parecen tener mecanismos de extracción de contornos, basados en los principios de inhibición lateral. Además, este mecanismo básico tiene una gran cantidad de flexibilidad, y puede utilizarse para realizar otros tipos de análisis de la imagen visual. Resulta instructivo intentar diseñar estos circuitos.
Campos centrales-periféricos
En los organismos más complejos, como por ejemplo los mamíferos, las operaciones retinianas difieren de las de un cangrejo, pero son similares las características básicas del análisis. Sin embargo, surgen diversos problemas al estudiar estos sistemas visuales más complejos. En primer lugar, un receptor individual puede estar conectado a células ganglionares muy distintas, haciendo imposible limitar la fuente de luz de forma que sólo una célula ganglionar sea excitada por la señal. En segundo lugar, las interconexiones entre receptores y células ganglionares en los organismos superiores son tanto excitadoras como inhibidoras. En el ojo de un cangrejo,
F I GURA 2- 1 9
PROCESAMIENTO DE INFORMACION NEURAL
Posición
1- ---1
Entrada. intensidad de luz
r---1 ,---
1 r---1 r---
1
Salida y nivel de actividad neural
Posición
79
Cada fragmento de la fotografia tiene una intensidad uniforme, pero no es uniforme la intensidad percibida de cada fragmento. La configuración de salida (línea contínua) prevista por la distribución de ·intensidad de la entrada. De Cornsweet ( 1970) .
80 PROCESAMIENTO DE INFORMACION HUMANA
una célula sólo puede tener un efecto negativo sobre sus vecinas. Esto no ocurre con otros animales. Las células receptoras vecinas pueden incrementar y disminuir la respuesta de una célula ganglionar.
Consideremos este registro típico en la retina del gato. En primer lugar, el electrodo se coloca en una célula ganglionar y se registran las respuestas a la luz. Después se localiza la región de la retina donde la estimulación luminosa incrementa la tasa de respuestas -el área excitadora-, moviendo el punto luminoso. Esto es lo que se tepresenta en la Figura 2-20. Observe la nueva · característica que se ha añadido a las estructuras de respuesta neural. La unidad responde a la luz con una explosión inicial de actividad, superior a su tasa de respuesta sostenida posteriormente. De hecho, la tasa permanente posterior a la explosión inicial sólo puede ser escasamen-te superior a los nivel�s de actividad espontánea.
·
Luz
Célula ganglionar
F I G U RA 2-20
Campo receptor
Tasa de respuesta
de la célula
ganglionar
o 100 500 . Tiempo Luz apagad Luz encend1d�
PROCESAMIENTO DE INFORMACION NEURAL 8 1
Después de esto, se mueve la luz cuidadosamente a su alrededor para determinar la región exacta de la retina que puede activar la célula ganglionar. Normaimente, el área excitadora es un círculo apaisado, con un diámetro medio entre 0, 1 y 1 ,0 mm. Cuando la fuente de luz se mueve fuera del círculo, la región excitadora, se produce un tipo distinto de respuesta. En lugar de regresar simplemente a la tasa normal, retirar la luz origina que la célula ganglionar incremente sustancialmente su tasa de respuestas durante breves momentos. La región que produce respuestas a la extinción de la luz también tiene forma circular y rodea al área excitadora central (Figura 2-2 1).
Luz
Célula ganglionar
F I G U RA 2-2 1
Tasa de respuesta
de la célula
ganglionar
o 100 500 . Tiempo Luz apagada Luz encend1d�
Esta unidad ganglionar y sus correspondientes ganglios, se designan como unidad central-on y periférica-off. La luz en la región central provoca un incremento en la respuesta del ganglio ; la luz en la región circundante provoca un descenso en la tasa de respuestas
82 PROCESAMIENTO DE INFORMACION HUMANA
con una breve explosión de actividad cuando se retira la luz. Una luz difusa sobre la región receptiva total -tanto central como periférica- no produce ninguna respuesta perceptible (Figura 2-22).
Luz
Célula ganglíonar
FJG U RA 2-22
Campo receptor
Tasa de respuesta
de la célula �---------
o 100 500 Tiempo Luz apagada
Luz encendida 'l..., _____ _._..
_JI ... --
En general, el sistema nervioso es bastante simétrico. Cuando se encuentra un tipo de respuesta neural, también podemos esperar encontrar el tipo complementario de respuesta. Además de la unidad central y la periférica, existe un número igual de unidades donde la estructura de respuesta es inversa : la unidad se inhibe mediante
f '
'
PROCESAMIENTO DE INFORMACION NEURAL 83
estimulación en la región central y se excita mediante estimulación en la periférica- se designan como unidad central-off y periférica-on.
Circuitos abiertos-cerrados
¿Cuáles son los mecanismos neurales que provocan esta estructura complementaria abierta-cerrada ( on-oft) ? Utilizando el mecanismo básico de receptor-ganglio de la sección anterior, no es muy dificil diseñar circuitos que realicen esta tarea. Pero, ¿cuál es el siste�a que realmente utiliza el sistema nervioso ? Existen varias posibilidades que aún están en debate.
Consideremos el sistema central-oniperiférico-off. Una posibilidad es que la región central esté completamente conectada a un sistema-en excitador y el periférico esté completamente conectado a un sistema-off inhibidor (Figura 2-23).
Esta posibilidad se representa en el diagrama introduciendo una nueva célula llamada célula bipolar. Un bipolar recoge actividad receptora en la región-on ; el otro recoge actividad en la región-off. A continuación, los dos bipolares convergen en la misma célula ganglionar. Esta es una implementación simple y directa del sistema on-off. Naturalmente, se supone que existe una distinción muy clara entre la región central y la periférica. ¿Qué ocurre si las cosas no son tan nítidas, y la distinción es más ambigua?
Supongamos que las respuestas de los receptores pueden ser tanto excitadoras como inhibidores a lo largo de todo el campo receptor, pero con más conexiones excitadoras en la región-on y más conexiones inhibidoras en la región-off. Todavía se producirá la misma estructura de respuestas. En la región central, prevalecen las conexiones excitadoras, provocando respuestas on (Figura 2-24).En la periférica, existen más conexiones inhibidoras, provocando respuestas off. La respuesta a señales en un punto de cualquier región depende de las diferencias entre la actividad excitadora e inhibidora producida. Para el sistema central-off/periférico-on, la operación es simplemente la inversa. Ambos modos de conectar .las células receptoras conducen fundamentalmente al mismo resultado.
En la retina del gato, alrededor del 30-50�� de las células ganglionares responden de una manera central-periférica. El resto de las células manifiestan diversas características peculiares. Algunas sólo responden a la excitación de la luz o sólo a la extinción de la luz, pero sin el campo receptivo concéntrico. Muchas células
84 PROCESAMIENTO DE INFORMACION HUMANA
FIGURA 2-24
Campo receptor
Número de receptores
Campo receptor
Negativos conectados
FIGU RA 2-23
Número derespuestas excitadoras Número de
tes puestas / inhibidoras
a esta célula
La respuesta es iJual a la respuesta ( - ) restada de la res uesta ( + )
son del tipo central-periférico, pero con campos receptivos de forma particular. Algunas parecen no responder en absoluto a ninguna de las estructuras típicas ante las pruebas experimentales usuales. El tipo más simple de campo receptivo concéntrico puede producir complicadas formas de respuesta bajo distintas condiciones. En la Figura 2-25 se representa la respuesta neural de una unidad ganglionar central-on/ periférica-off. En a, la luz incide en el área on con dos niveles de intensidad : intensidad media en el primer dibujo, baja intensidad en el segundo, y de nuevo una intensidad intermedia en el tercero. En b, la luz estimula la región-off y
Luz en
Región off b
PROCESAMIENTO DE INFORMACION NEURAL
h1
--Región � on y off ª
+ b !:::=:!! FIGURA 2-25 De Kufjler (1953) .
Respuestacelular
85
I ntensidadluminosa
se representan las respuestas a las señales de intensidad media y de intensidad elevada. Observe que la respuesta off se produce cuando la luz se apaga. En la tercera fila se muestra la respuesta cuando se combinan las formas a y b. El resultado depende de la mezcla relativa de luz en las regiones on y off.
El mecanismo básico central-periférico también puede actuar con luces de diferentes colores en lugar de luces blancas en las distintas regiones. La Figura 2-26 muestra las respuestas de una célula ganglionar en la retina de un pez dorado ante distintos colores de luz. Se estimula la misma parte del campo receptivo, pero se varía la longitud de onda de la luz. La célula cambia de una respuesta central-on a una central-off justo cuando cambia la longitud de onda de la luz que estimula. Esta es una importante propiedad de las células sensibles al color y que discutiremos con más detalle en la sección sobre el color del Capítulo 5.
RESPUESTAS TEMPORALES
Hemos observado la explosión transitoria de actividad que acompaña típicamente a la incidencia de una luz. No está claro si esta forma de respuesta representa un mecanimo adaptivo para retrasar las respuestas y conseguir que el sistema sea menos sensible ante estimulación prolongada, o si representa una sensibilidad especial a la iluminación transitoria. Cualesquiera que sean los mecanismos, la respuesta transitoria puede tener un gran efecto. Existe en todo
86 PROCESAMIENTO DE INFORMACION HUMANA
11
1 1 1
1 1 1 1� t 1 H 1 -+i 1 , r
1 1 1
400 5
. ..
450 9 ( 10) , .
1 1 1 1 1 Httil 1 °tH�jr
5bo 1 1 1 (12).. ...
550 ' • -l •l•rso.¡., • .:.
1 1 1 1
......11-'1'--+--tt-+-�1�-1-- 0,5 seg. -----!
1 1 1 1
1 1 ti• 1 1 1
�1+�1
1 IV TIJ&I q f
1 1 1 1 650
E &1 11 l 1 + f �· 1 1 1 1 700
[' 1 • 1 1 • ··llial ,, 1 1 1 1 750
¡�,-·
l--- 0.5 seg.�
FIGURA 2-26 Impulsos emitidos por una célula ganglionar de la retina del pez dorado, en respuesta a destellos luminosos de 0,5 seg. La longitud de onda en nanómetros está indicada en el extremo derecho de cada registro. De Wagner, MacNichol y Wolbarsht ( 1960) .
esto un registro del proceso transitorió durante la actuación. Se enciende una luz sobre un grupo de receptores durante 2 segundos. Los círculos blancos representan la respuesta de un ganglio conectado de una forma on. En primer lugar, la tasa de respuesta crece rápidamente hasta unos 80 impulsos por segundo, después desciende bruscamente a una tasa sostenida de unos 40 impulsos por segundo. Esta tasa se mantiene hasta que se apaga la luz. En este caso, la tasa sostenida es ligeramente superior al nivel normal de actividad fundamental de 30 impulsos por segundo.
PROCESAMIENTO DE INFORMACION NEURAL 87
Los círculos negros del gráfico representan la respuesta a una unidad inhibida por la luz. Aquí se produce una disminución transitoria en la tasa de respuesta hasta los 5 impulsos por segundo, una tasa muy inferior al nivel de respuesta sostenida durante el resto de la señal.
o 2 Tiempo (segundos)
FIGURA 2-27 De Rat/iff ( 1961 ) .
Circuitos para producir respuestas transitorias
3
Es más simple diseñar mecanismos neurales que produzcan una respuesta transitoria, que decidir cómo lo consigue realmente el sistema nervioso. Lo primero sólo requiere algún trabajo cuidadoso en los circuitos básicos ; lo segundo exige una investigación elaborada y trabajosa de la microanatomía de células aisladas. De momento, no tenemos evidencia sobre lo segundo ; mientras tanto, veremos qué es lb que podemos inventar.
Una forma simple de producir una respuesta transitoria consiste en insertar una vía inhibidora paralela a otra excitadora entre do.s células neurales. En el caso representado en la Figura 2-28,existe una conexión entre los niveles de las células bipolares y las células ganglionares. Cuando aparece la luz, su tendencia excitadora se ve contrarrestada por la vía paralela inhibidora. Para no bloquear la respuesta, supongamos que los procesos inhibidores
88 PROCESAMIENTO DE INFORMACION HUMANA
transcurren más lentamente que los excitadores. De esta forma, ante la incidencia de la luz, la actividad neural comienza a construirse por la actividad más rápida del sistema excitador. Cuando los circuitos inhibidores comienzan a funcionar, la tasa de activación se hace más lenta, después comienza a declinar y eventualmente desaparece. La última tasa mantenida dependerá de la ganancia relativa de los canales excitadores e inhibidores.
Campo receptor
acción rápida acción lenta
FIGURA: 2-28
Un circuito alternativo para producir conducta transitoria consiste en permitir que la inhibición llegue a través de su propio canal neural, evitando así el requisito .de que la misma neurona envíe tanto conexiones excitadoras como inhibidoras (Figura 2-29).
Como antes, la respuesta transitoria depende del supuesto de que la cadena inhibidora reaccione algo más lentamente que la cadena excitadora. En la literatura técnica, estos dos mecanismos se designan como inhibición proactiVa para distinguirla de la inhibición lateral o «circundante» que actúa entre células cercanas.
Aún existe otra forma de obtener la respuesta transitoria, queconsiste en que la respuesta de una célula ganglionar (B, en laFigura 2-30) retro-alimente a las células que anteceden a su propioimpulso.
Sistema excitador
PROCESAMIENTO DE INFORMACION NEURAL
Campo receptor
Sistema inbibidor
Conexión excitadora
Célula ganglionar
Célula ganglionar
FIGURA 2-29 FIGURA 2-30
89
Campo receptor
El diagrama representa un sistema inhibidor «retro-alimentando» la salida de la célula B, para inhibir la salída de la célula A. La célula intermedia, F, es la célula de retro-alimentación. A diferencia �e los otros cir�uitos, el retraso de la inhibición se consigueme�iante este mecamsmo ; todos los bucles pueden actuar con igualrapidez. Naturalmente, es perfectamente posible simplificar este bucle de retro-alimentación. Para empezar, se puede eliminar la célula F, de forma que B inhiba directamente A. De hecho, la célula A se puede eliminar, de forma que la salida de B regrese directamente a la entrada de B -la célula se inhibe directamente. Tales sistemas son circuitos e lectrónicos comunes. Si esto es posible o no en los circuitos neurológicos, es algo que no se sabe. Observe que só!º. este método de inhibición por retroalimentación, explica automat1camente la explosión de rapidez de respuestas que ocurre cuando desaparece la señal.
Hemos explorado tres tipos distintos de mecanismo excitador-inhibidor : lateral, proactivo y de retroalimentación. La inhibición lateral actúa en contornos pronunciados : responde selectivamente a las variaciones en la forma espacial de iluminación. La inhibición proa�tiva y de retroa�imentación actúa en respuestas neurales pronunciad
.as a
.n�e camb�os temporales .de iluminación. Parece que la
e�trategia bastea cons1st� en proporcionar un tratamiento preferencial a los aspectos cambiantes de las señales externas ; extraer cambios, suprimir los aspectos constantes.
90 PROCESAMIENTO DE INFORMACION HUMANA
RESPUESTAS AL MOVIMIENTO
Un último problema básico que tiene que solucionar el sistema nervioso visual es el del movimiento. La mayor parte de los receptores mencionados hasta ahora no están fundamentalmente interesados en distinguir entre objetos en movimiento y objetos fijos. Sin embargo, responden tanto a objetos en movimiento como a objetos fijos. Por ejemplo, si movemos una luz de izquierda a derecha sobre una unidad central-periférica, la respuesta cambia en función de la localización de la luz sobre el campo receptivo : primero, cuando la luz está a la izquierda del periférico, obtenemos una tasa fundamental, después inhibición, luego excitación y por último la tasa fundamental de nuevo.
Respuesta de la célula ganglionar
F I G U RA 2-3 1
T Campo receptor
1
Colocación del electrodo
PROCESAMIENTO DE INFORMACION NEURAL 91
Estas respuestas no cualifican a la unidad como un detector de movimiento. Los detectores de movimiento sólo deben responder cuando un objeto se mueve y no en otras ocasiones. Teóricamente, también deberían ser selectivos con respecto a la dirección y quizá a la rapidez de la estructura del movimiento.
Si buscamos detectores de movimiento en el sistema nervioso visual, los podemos encontrar. Las retinas de los conejos, ardillas y ranas tienen unidades que son selectivamente sensibles a tipos determinados de movimiento. Examine los datos del sistema visual dél conejo (Figura 2-32).
80
� 60 " " � � 40
"" 2 " s 20 '" z
oº
. . · 1 . 1 2 -------
. . . Tam,añ
0o del(unto/
··�27 . · 111 19 ----------
-11 68 -:::::::::.-_1 , . . . .••• ,79
oº3 1 5° t �5º
' JI 270° --- - 90°
225° / • ' 1 35°
180°
90° 1 80° 270° oº Dirección del movimiento
F I G U RA 2-32 De Barlow, Hill y Levick (1964) .
En el centro del diagrama, se ofrece la disposición de los campos receptivos. La región central produce respuestas on-off (designadas por el símbolo ± ), y la luz que estimula la región que rodea
92 PROCESAMIENTO DE INFORMACION HUMANA.
esta parte central no produce aparentemente ninguna respuesta (designada por el símbolo O). Las flechas muestran la direccióndel movimiento de un punto que atraviesa el campo receptivo : se indican las tasas de respuesta para cada dirección. La respuesta máxima (79 impulsos) se produce cuando el punto se mueve hacia adelante. La respuesta mínima (2 impulsos) se produi::;e cuando el movimiento se realiza exactamente en dirección opuesta -hacia atrás. El número de respuestas producidas por el movimiento en direcciones intermedias se ofrece en el gráfico inferior.
Circuitos para detectar el movimiento
¿Cómo actúa un detector de movimiento? Un campo receptivo normal contiene mecanismos inhibidores laterales. Hemos visto que estos circuitos son especialmente sensibles a los contornos, pero no responden diferencialmente en función de la dirección del movimiento. Se necesitan dos características para hacerlos sensibles direccionalmente. La primera consiste en que las conexiones inhibidoras sean asimétricas; la segunda es que la inhibición lateral produzca algún retraso. Aquí está el circuito básico con la ganancia indicada en cada conexión ; realice los cálculos.
Luz que se mueve de izquierda a derecha -
- Luz que se mueve de derecha a izquierda
20
1 0--------'
Receptor
1
)..(i V Circuitos inhibid ores
1
Célula ganglionar
FIGURA 2-33 Cada conexión ínhíbidora tiene un retraso dP una unidad
PROCESAMIENTO DE INFORMACION NEURAL 93
La luz que se mueve de izquierda a derecha. Examine la Figura 2-34. Los números indican la tasa de respuesta real, no la obtenida. Al principio, no existe respuesta de la célula ganglionar. Inicialmente, la intensidad de luz es de 1 O unidades. Por tanto, la salida de cada receptor es 1 0. Esta salida se anula por completo por el efecto inhibidor de la célula de la derecha. Pero cuando la parte brillante de la luz (que tiene una intensidad de 20) alcanza el primer receptor, provoca una respuesta de 20, aun cuando este receptor sólo continúa inhibido por un valor de - 10 del receptor de su derecha. De esta forma, la célula ganglionar comienza a responder con 1 0 unidades (ver Figura 2-34b).
En la Figura 2-34c, la luz se mueve a través de dos receptores. Sin embargo, puesto que las influencias inhibidoras están retardadas, la primera célula aún no ha recibido el nivel de incremento de inhibición. Las dos células están excitadas en 20 unidades e inhibidas por 1 0 : la salida combinada de la célula ganglionar es de 20. En D, la luz se mueve a través de más de un receptor y la inhibición comienza a producir efecto. En este caso, tres receptores se están activando por una intensidad superior. Después de que ha transcurrido un tiempo suficiente, la luz alcanzará el segundo receptor de forma que su influencia inhibidora paraliza la primera célula ; por tanto, aunque los tres receptores son activados por una alta intensidad, la respuesta de la célula ganglionar permanece constante en 20 unidades.
Cuando la luz continúa moviéndose, se realizan cálculos exactamente análogos. La respuesta ganglionar permanecerá en 20 unidades hasta que la luz haya salido del campo receptor y haya transcurrido suficiente tiempo para que ocurran los procesos de retraso inhibidor. En ese momento, la célula ganglionar regresa a su nivel básico (O, en este caso).
La luz que se mueve de derecha a izquierda. Se produce una respuesta totalmente distinta cuando la luz se mueve de derecha a izquierda (Figura 2-35). En la posición B, aunque la luz hayaalcanzado al primer receptor, no se produce todavía ninguna respuesta del ganglio. La inhibición que llega desde la derecha produce efecto cuando se estimula el primer receptor, anulando así una respuesta. La inhibición creciente del primer receptor al segundo todavía no ha ocurrido. Sin un retraso de la inhibición, el primer receptor incrementaría inmediatamente su influencia inhibidora, reduciendo así la actividad de respuesta en la segunda unidad y por últímo a la célula ganglionar en - 1 0 unidades. El movimiento
94 (a )
PROCESAMIENTO DE I NFORMACION HUMANA
(d ) ;::,--) 20 -Luz r--
�---------10 E:_ 10
Salida
Salida
Salida
(b )
(e )
(e ) E-: '-------- 10
9. J? J? R ? J? R R d· d· o· d· d Cf· cr d· � ·�·
w m
(f) E= �'------10
? J? J? R ? J? R R d· d· o· d· d Cf· o· Cf · lO 10 o o o o o o
FlGU RA 2';-V 9
10
t:: ID
podría detectarse por la disminución en una tasa inferior al nivel básico normal. A causa del retraso, no ocurre ningún cambio en la célula ganglionar, ni un incremento ni una disminución.
Hemos construido un detector de movimiento direccionalmente sensible. La unidad no responde ni a fuentes constantes de luz ni al movimiento de derecha a izquierda. El retraso de inhibició� es extremadamente importante. De hecho, se convierte en un requisito general del circuito : los detectores de movimiento deben tener un mecanismo de retraso.
PROCESAMIENTO DE INFORMACION NEURAL 95
(a )Luz
10
Salida
Salida
Salida
(b ) 10 � 10
(e )
FIGURA 2-35
Se pueden construir detectores de movimiento bastante complejos, utilizando este mismo diseño básico. Observe, por ejemplo, que el detector de movimiento respondería al máximo ante un objeto que se moviese a una velocidad específica, la velocidad que correspondiese a la tasa del movimiento de la influencia inhibidora a través de los campos receptivos. Y el retraso de la inhibición recibida por una región receptora determinada, dependería de la distancia entre la región y el objeto en movimiento. Además, el
96 PROCESAMIENTO DE INFORMACION HUMANA
tiempo de reacción de los procesos excitadores e inhibidores del sistema nervioso depende de la intensidad de la señal. De esta forma, se puede esperar que las respuestas de los detectores de movimiento dependerán de la intensidad de la señal y de su rapidez de movimiento.
Aunque estos circuitos representan mecanismos posibles para detectar movimientos, no solucionan todos los problemas que surgen ante un ambiente visual dinámico. Sería posible, por ejemplo, engañar a un detector de movimiento. Provoquemos un simple destello de luz de corta duración sobre un receptor, después esperamos el tiempo adecuado y producimos otro destello sobre un receptor vecino. Esto produciría una respuesta similar a una luz que se moviese continuamente a través del campo. De hecho, vemos movimiento continuo cuando dos luces se encienden y apagan alternativamente con alguna distancia entre sí, proceso denominado fenómenoji. La distancia sobre la que se percibe el movimiento fi es mayor que el campo receptivo del detector de movimiento que se encuentra en los sistemas visuales típicos.
No se ha discutido nada, al tratar de estos circuitos, sobre la discriminación entre los movimientos originados por la cabeza y los ojos, y los producidos por movimientos reales de objetos externos. Los mecanismos cerebrales superiores deben coordinar la información proporcionada por los detectores de movimiento retiniano con las órdenes motoras que controlan los ojos y la cabeza, si se quiere distinguir entre los cambios retinianos producidos por los movimientos de la cabeza y los ojos de los producidos por los movimientos en el mundo externo.
PROCESAMIENTO DE SEÑALES EN EL NÚCLEO GENICULADO LATERAL
El análisis realizado hasta ahora describe los mecanismos que extraen características básicas de la imagen visual. En la mayoría de los animales, las células estudiadas hasta ahora se localizan en el ojo mismo, dentro de las tres capas de células que componen la retina. Estos procesos sólo representan el primer nivel del análisis de la señal. Las señales neurales son posteriormente conducidas por el nervio óptico hacia etapas más avanzadas de procesamiento (ver Figura 2-36). Ahora es el momento de seguir el trayecto de la información visual hacia el cerebro.
Las señales neurales que salén de la retina viajan a lo largo de los axones de las células ganglionares de la retina, hasta que
PROCESAMIENTO DE INFORMACION NEURAL 97 llegan a la siguiente estación de relevo-- el Núcleo Geniculado Lateral(NGL). Es aquí donde las fibras de las células retinianas realizan conexiones sinápticas con nuevas células que transportan el mensaje sensorial hasta las áreas receptoras corticales del cerebro (ver Figura 2-36). Las fíhras que vienen de regiones adyacentes de la retina terminan en las partes adyacentes del NGL. De esta forma, las regiones vecinas del NGL reciben información neural de las partes vecinas del campo visual.
Corteza visual
FIGURA 2-36
Núcleo geniculadolateral
El NGL está compuesto de capas separadas entre sí, tres capas en el gato, seis en el mono y en el hombre. Cada una de las capas recibe fibras nerviosas de un sólo ojo, alternando cada capa la información de cada ojo. Las capas actúan como registros, de formá que cuando se ve un objeto, la actividad neural que se produce en un ojo se dirige a una región particular de una capa del NGL, y la actividad en la región retiniana correspondiente del otro ojo se dirige a las regiones correspondientes de las capas del NGL directamente anteriores o posteriores.
Las elegantes operaciones de procesamiento de datos descubiertas en las uniones sinápticas de la retina y la nítida organización anatómica del NGL, sugieren que la organizacíón y el análisis posterior de la información sensorial debe producrise en este centro cerebral superior. Estas expectativas no consiguen materializarse. Hasta el momento, la nítida organización anatómica del NGL es un auténtico rompecabezas. El NGL parece que no modifica de ninguna forma
98 PROCESAMIENTO DE INFORMACION HUMANA
los mensajes que llegan de la retina. Las fibras que salen del NGL tienen campos receptivos casi idénticos a los encontrados en las fibras ganglionares de la retina. Tienen una organización circular central-periférica y los campos son similares en tamaño. De esta forma, el NGL parece ser una auténtica estación de relevo : transmite fielmente la información visual sin ninguna distorsión hacia el siguiente nivel de procesamiento.
Sin embargo, los canales neurales, a diferencia de otros sistemas de comunicación, no necesitan ninguna amplificación para mantener en actividad las señales. ¿Para qué puede servir entonces el NGL? No se ha solucionado este enigma, pero parece insinuarse alguna posibilidad. Por un lado, las entradas al NGL no llegan exclusivamente de la retina. Otras partes del cerebro también envían señales al NGL, particularmente un área del cerebro medio llamada .formación reticular (estudiaremos esta estructura neural en la página 623, al estudiar la activación). Existe la sospecha de que la actividad de estas vías no sensoriales pueden ayudar a determinar si las señales que llegan al NGL deben enviarse o no al siguiente nivel del sistema. De esta forma, parece posible que el NGL actúe normalmente como un control de intensidad sobre las señales visuales que se desplazan del ojo al cerebro. Esta es una posibilidad fascinante, pero que aún no está demostrada.
Después de la salida del NGL, ya no existen más interrupciones en el camino, antes de que la información visual llegue a las áreas receptoras corticales del cerebro. En ese momento, en la corteza visual, aparecen de nuevo los circuitos neurales para el procesamiento de las señales, circuitos que son muy parecidos en su modo de actuar a los encontrados en la retina.
EXTRACCIÓN DE CARACTERÍSTICAS
Tres áreas distintas de la corteza están implicadas en el análisis de los mensajes visuales que llegan del NGL. En cada una de las áreas de recepción visual, las fibras de las regiones contiguas de la retina terminan en las partes adyacentes de los centros receptores corticales. Dos de las áreas reciben entradas directas del NGL, y el conjunto de las tres áreas están altamente interconectadas. Las fibras que salen de las áreas primarias de recepción visual van a los lóbulos temporales a los lados del cerebro, un área que parece estar implicada en el aprendizaje y la retención de los hábitos visuales.
PROCESAMIENTO DE INFORMACION NEURAL 99
Al igual que el NGL, la corteza visual está organizada en capas, aunque en esta ocasión son cinco. Dirigiéndose desde la superficie externa hacia la interna del cerebro, las fibras de entrada del NGL terminan principalmente en la cuarta y quinta capa. Pero en la corteza, a diferencia del NGL, parece que existen muchas interconexiones entre las distintas capas. El análisis de un mensaje sensorial comienza en la cuarta y quinta capa, y se elabora a través de las sucesivas capas corticales hasta que la información sale finalmente de las áreas visuales y viaja hacia otras partes del cerebro.
El panorama general del procesamiento cortical es una especie de reorganización progresiva y análisis de aspectos específicos de la señal. El análisis se desarrolla región por región, con un gran número de distintos detectores corticales que se hacen responsables de las características de cualquier región determinada. ¿Es un contorno ? ¿Es un borde ? ¿Una línea negra? ¿Hay una luz de fondo ? ¿O es un rayo de luz sobre un fondo oscuro ? ¿Hacia dónde se orienta? ¿Se extiende más allá de la región específica? ¿Se produce un cambio de dirección ? Estos son los problemas que responden los detectores corticales.
Células simples
Características de la respuesta. El núcleo geniculado lateral proporciona información directa a la cuarta capa de la corteza, de forma que comenzaremos nuestro análii;is desde ahí. Si registramos la actividad eléctrica de la cuarta capa, introduciendo cuidadosamente el electrodo a través de la capa externa del cerebro hasta el lugar necesario para penetrar las tres primeras capas, nos encontramos con que las células responden cuando una pequeña luz se mueve a través de la retina. Sin embargo, existe una diferencia entre estas células y las de la retina. Las células detectoras de la retina son bastante específicas en su respuesta. Registran una pequeña región de la retina -el campo receptor- y a menos que la luz incidadentro de ese pequeño campo receptor, no se
'produce ninguna res
puesta en la célula ganglionar. Sin embargo, en la corteza, existe un tipo distinto de organización ; las respuestas no se limitan ya al pequeño campo receptor circular.
Una organización típica es aquella donde cualquier punto resplandeciente de luz a lo largo de una línea, incrementa la respuesta de la célula. Normalmente, cuando se encuentra una línea excitadora de ese tipo, también existe una línea paralela cercana que hace
100 PROCESAMIENTO DE INFORMACION HUMANA
que la respuesta de la célula disminuya cuando se excita por la luz. De esta forma, parece que existen dos campos paralelos receptivos, cada uno en forma de línea recta, siendo uno excitador y el otro inhibidor (Figura 2-37).
RESPUESTAS A UN PUNTO DE PRUEBA
Campo receptor
Esta luz provoca j 1 1 i I ¡' 1 j 1 1 d1smmuc10n de respuestas
Luz Onl Off -�-�. L_
Tie;;;PciRESPUESTA MAXJMA A UN CONTORNO CLARO-OSCURO
El contorno altobajo produce unarespuesta máxima
Luz º"1 Off ---�-
RESPUESTA MINIMA A UN CONTORNO OSCURO-CLARO
Tiempo
El contorno j j 1 j bajo-alto produc.e -. +f �i ++f�lli-ó!t---•l-+-1�+-+1-luna respuesta mm1ma
Luz º"¡ Ot't ---�· L_ Tie;;;p,,
FIGURA 2-37
Esta configuración de campos excitadores e inhibidores proporciona un detector de bordes : la célula responde al máximo ante un borde de luz alineado perfectamente con el eje de los campos. Cualquier otra señal produce una reacción menor.
Otras células simples tienen otros tipos de campos receptores. Otro esquema, similar pero un poco más avanzado, es un detector
PROCE�AMIENTO DE INFORMACION NEURAL 101
de aberturas. En este caso existe una zona inhibidora a ambos lados de la región excitadora (Figura 2-38).
DETECTOR DE ABERTURAS
Esta luz provoca una Esta luz provoca undisminución de la aumento de la respuesta respuesta
1 il 1 1 1 l · t l ·f 1�11 1 1 1 � on � on
-g ] e " .5
Alta intensidad -
:; � -- .
. • e" - - Í ---- -
El detector de luz produceuna máxima respuesta
� on
-g � e " .5 "
"<?�
DETECTOR DE LINEA
Esta luz provoca una Esta luz provoca un disminución de la aumento de la rerues¡a respuesta
l � 1 il , � IHiM , ¡, 1 1 11 • � on ___jR_ on
:..._ __ . _e---�----.�----· ···- - ----··--······-··-············ �'::�::: .. ······s:- - .: ··
···=-=� ' :: . - .
::: -�
:.=�
�?-�<: . . ' ::�-:�__; ... - ..... -��-· - . ���-:�� -···---�- -··-··--·- -------- ----------=��--.. ·:·:�·- -::----=:=== .. � -====�::= �
La línea produce una respuesta máxima
FIGURA 2-38
De esta forma, la respuesta máxima se produce por una línea brillante rodeada por dos áreas oscuras ; la respuesta mínima se produce por una línea oscura rodeada por dos áreas brillantes. Si recordamos la simetría usual del sistema nervioso, cuando existe una organización de campos -inhibidor-excitador-inhibidor-, deberá exisitr también la organización complementaria : y además, existe. Si la primera organización se representa por los símbolos - + - , entonces el segundo puede representarse como + + . Si el primero es un detector de aberturas, el segundo es un detector de líneas.
De esta forma, observe que la información llega de las células cuando decrece y cuando aumenta la tasa de respuestas. Ambas reacciones son informativas ; ninguna respuesta puede considerarse más básica o más importante que la otra. El sistema nervioso
1 02 PROCESAMIENTO DE INFORMACION HUMANA
utiliza tanto el incremento como la disminución de las tasas neurales como señales, de forma que sería un error suponer que las respuestas tipo on son más básicas o más importantes que las respuestas off. Lo importante es que se produzca algún cambio en la actividad.
Los detectores de bordes, aberturas y líneas registran regiones específicas de la retina. Dentro de una región específica, el borde o la abertura pueden estar colocadas perfectamente para producirla respuesta máxima. Así, aunque estas células reaccionan a características más complejas de la imagen visual, son selectivas en la posición y tipo de señal que necesitan para producir una respuesta.
Cómo construir detectores de aberturas y de líneas. Veamos qué ocurre al reunir estos circuitos simples. Esto es pura especulación, puesto que nadie ha reconstruido todavía los circuitos. Comencemos con la información que llega de la retina. El problema básico consiste en cómo se combina la información que llega de las unidades central-periféricas de la retina, para producir unidades que responden a líneas y aberturas. Para simplificar los diagramas, a partir de ahora utilizaremos un par de círculos concéntricos para representar la respuesta de las células ganglionares.
El método más directo para crear un detector de líneas o de aberturas consiste en recoger las respuestas de las células ganglionares, que descansan a lo largo de una línea de la región local de la retina y hacer que sus salidas incidan sobre una célula cortical única. Se produce un detector de línea o un detector de abertura, en función de si las células ganglionares son centrales-on/periféricasoff (aberturas) o centrales-off/periféricas-on (líneas).
Consideremos la respuesta característica de este circuito. Comenzamos con una abertura dirigida directamente sobre la región central excitadora de las células ganglionares, exactamente como lo muestra la Figura 2-40. El detector de aberturas responde al máximo. El hecho de extender la longitud de la línea más allá de la región donde existan receptores, no produciría ningún efecto en la respuesta del detector, puesto que no existen células para detectar el cambio de longitud. Sin embargo, si se acorta la línea, la tasa de respuesta cortical disminuirá hasta que el número de células centrales-periféricas activadas llegue a ser insuficiente para impulsar el detector cortical de aberturas.
Comenzando de nuevo con una abertura ideal colocada directamente sobre las regiones excitadoras centrales, consideremos lo que sucede cuando se incrementa la anchura de la abertura. Cuando la luz comienza a incidir sobre las regiones de los campos receptivos
PROCESAMIENTO DE INFORMACION NEURAL 1 03
ocupados por los periféricos, los efectos de los excitadores del central comienzan a ser contrarrestados por los efectos inhibidores del periférico, y la tasa de la respuesta decrece. Con una abertura suficientemente ancha, las dos influencias pueden anularse entre sí y la unidad cortical regresará a su tasa espontánea de actividad.
Región central Región periférica
Receptores
Célula ganglionar
Respuesta
Símbolos de las unidades central-periféricas
Central-off Central-on
Periférica-on Periférica-off
FIGURA 2-39
1 04 PROCESAMIENTO DE INFORMACION HUMANA
Luz de alta i.ntensidad
Respuesta
LONGITUD Y ANCHU RA
El incremento de la anchura aumentará la acción inhibidora
F I G U RA 2-40
La longitud de la abertura luminosa no importa, aunque sea mayor que el campo
JV Incremento de longitud
1� Incremento de anchura
¿Qué ocurre con la orientación? Mire la Figura 2-4 l . A medida que la abertura se desplaza de su orientación óptima, se activan cada vez menos los centros excitadores que alimentan al detector. La corriente del impulso del nervio visual desciende, y el receptor cortical regresa de nuevo a sus niveles de actividad espontánea. La respuesta exacta en cualquiera de los ángulos determinados depende de la cantidad exacta de campos excitadores e inhibidores que abarca la luz.
PROCESAMIENTO DE INFORMACION NEURAL
-90° o• Angulo
1 1 1
1so• F I G U RA 2-41 1
1 05
1 06 PROCESAMIENTO DE INFORMACION HUMANA
El panorama general está claro. Las unidades básicas central-periféricas pueden reunirse para proporcionar un reconocimiento de formas complejas. Existe una gran cantidad de libertad en todo esto, puesto que las unidades no sólo pueden construirse con respuestas centrales-on y centrales-off, sino que pueden combinarse de diferentes formas. Las unidades centrales-on pueden tener conexiones inhibidoras con la célula cortical, mientras que las centrales-off pueden ser excitadoras. Pueder. utilizarse otros tipos de unidades retinianas con diferentes formas y tipos de campos receptores. Es evidente que se puede construir una gran variedad de detectores a este nivel de procesamiento de la señal en la corteza.
Como ejemplo, demostraremos primero cómo pueden construirse detectores que sólo respondan a puntos de luz en movimiento. También es posible diseñar detectores de líneas en movimiento : unidades que sólo responden a una línea con una orientación propia y que se mueve en una dirección determinada. Se podría construir una unidad de este tipo, de forma que no respondiese ni a líneas fijas ni a líneas con movimiento adecuado, pero con una orientación angular errónea ; ni a líneas con una orientación correcta, pero con una dirección incorrecta del movimiento.
DIPOLOS
¿Recuerda el Efecto McCollough (pag. 46) ? Después de una estimulación prolongada a líneas horizontales rojas, las líneas horizontales blancas se perciben posteriormente como verdes. Una de las posibles explicaciones era que los detectores de líneas coloreadas estuviesen fatigados. Sin embargo, se puede añadir un tipo simple de artificio sensible a la orientación. El circuito neural se llama dipolo (Harris y Gibson, 1 968). Un dipolo es cualquier artificio asimétrico que es más sensible a una entrada lateral que a la otra (ver Figura 2-42). Por ejemplo, un dipolo puede ser sensible al rojo por un lado y al verde por otro.
Dipolos
+ Luz
1 1 1 1 1FIGURA 2-42
PROCESAMIENTO DE INFORMACION NEURAL 1 07
Un dipolo puede estar c°onstituido por dos campos, de forma que no estén
alineados con mucha exactitud. Pueden tener muchas formas. Pueden ser «circulares», con dos partes, una interna sensible a uno de los colores, mientras que la periférica lo es a otro. Esta unidad «circular» no estaría constituida exactamente por círculos concéntricos, sino más bien de forma excéntrica y asimétrica. Cualquier unidad central-periférica podría ser un dipolo, si las dos partes no fuesen exactamente concéntricas.
Ya hemos observado que las células sensibles al color son del tipo central-periférico, con el verde opuesto al rojo (y también algunas células tienen el azul como opuesto al amarillo ; ver página 34). Además, las células central-periféricas son normalmente asimétricas. Raramente tienen una forma perfectamente redondeada. El dipolo nos proporciona un artificio básico con sensibilidad orientada, mucho más simple que el detector de línea. Si un chorro de luz incide sobre la totalidad del dipolo, éste no responde. Sólo en la medida en que la luz cubra una de las dos partes del detector, éste responderá y se puede acomodar. Si no es un detector de línea preciso, el dipolo no es sensible a imágenes borrosas. Es sensible a la intensidad. Los dipolos son claramente menos complejos que los detectores de línea. Explican el Efecto McCullough mejor que los detectores de línea de color.
Células complejas
En el siguiente nivel de procesamiento cortical, las cosas son distintas. Aún están implicados los mismos tipos básicos de características -bordes, líneas, aberturas, líneas en movimiento, etc.-, pero desaparecen algunas de las limitaciones. En las células simples, un detector de línea sólo responde cuando la línea está colocada en una posición muy precisa ante la retina. A un nivel superior, la línea debe tener aún una anchura y orientación correctas, pero la posición no es tan crítica : puede estar localizada en cualquier lugar dentro de una amplia región de la retina (ver Figura 2-43). Estas células son más complejas que las del nivel cortical inferior. De aquí el convencionalismo.adoptado para denominar estas células : si aquéllas son simples, éstas deben ser complejas.
Al igual que las células simples, los detectores de líneas y bordes complejos no se ven afectados por la extensión del estímulo más allá del campo receptor. De la misma manera, las células complejas reaccionan cuando se mueve la señal adecuada a través de sus campos receptores, y con frecuencia tienen una dirección preferente.
Por tanto, en las células complejas, la respuesta aún está críticamente determinada por el tipo, dirección y anchura de la señal de estimulación. Sin embargo, la información proporcionada por estos detectores es algo más abstracta que la de los niveles inferiores, puesto que es menos importante la posición de los contornos dentro del campo visual. De esta manera, las áreas retinianas donde reaccio-
1 08 PROCESAMIENTO DE INFORMACION HUMANA
nan los detectores complejos ante estímulos adecuados, son bastante mayores que el campo receptor de los detectores corticales simples.
F I G U RA. 2-43 Respuestas típicas de células símples y complefas
Cómo construir células complejas. ¿Qué es una célula compleja? La explicación más sencilla consiste en afirmar que es el producto de una combinación de cierta cantidad de células simples. En la Figura 2-44 se demuestra cómo la combinación de las respuestas de ocho células simples pueden producir una célula compleja. Si se activa cualquier célula simple, entonces responde el detector complejo de línea. De esta forma, cuando se mueve una línea en la región de la retina donde responden las células simples, las salidas de las distintas células simples se transmiten a la célula compleja. Observe que la anchura y orientación de la línea son tan críticas para la activación de la célula compleja como para la respuesta de una de las simples. Cualquier fracaso en provocar ut¡a respuesta en una célula simple, también fracasará en activar la célula compleja correspondiente. Esta organización es una forma de ampliar el tamaño del área retiniana que produce las respuestas, sin disminuir la exactitud de las espec i ficaciones del tipo de estructura necesaria para activar un detector complejo de características.
Células hipercomplejas
Sería útil obtener una mayor especificidad en algunas de las características que están presentes en la señal. como por ejem plo
PROCESAMIENTO DE INFORMACION NEURAL 109
la longitud de las líneas. El último nivel de células corticales que se han investigado es precisamente éste. Existen células aún más complejas que las del segundo nivel, células hipercomple;as.
Simbo/a nuevo
Respuesta
Respuesta
Retina
Células simples
FIG U RA 2-44
La única característica que añaden estas células es la de que el borde o la línea debe finalizar adecuadamente para obtener la respuesta máxima. Las Figuras 2-45 y 2-46 muestran algunos ejem plos de la respuesta de células hipercomplejas. En el primer diagrama, el campo receptor está señalado por líneas puntuadas.
1 1 0 PROCESAMIENTO DE INFORMACION HUMANA
Es un detector de línea en movimiento : sólo una línea horizontal que se mueve hacia abajo produce una respuesta. Las líneas con otras orientaciones o que se mueven en otras direcciones producen una reacción reducida. Naturalmente, éste es un resultado típico de una célula compleja. Pero observe lo que sucede cuando se extiende en longitud más allá del campo rectptor : la célula hipercompleja ya no responde. Esta es la nueva dimensión que se añade en este nivel de procesamiento- la especificación del tamaño.
La especificidad del tamaño no es. exacta, como lo demuestran los detalles de la figura. Sí la línea es demasiado larga, como ocurre en las Figuras 2-45 y 2-46, existirá muy poca o ninguna respuesta. Sin embargo, una línea de la misma longitud que se mueve de forma que un extremo de la línea termina adecuadamente, puede producir la respuesta de la célula hipercompleja, como en la Figura 2-46.
Existe otra novedad en estas células. Aunque la auténtica natura-
O Respuesta
A Unea horizontal, no mayor que el ,#.. -.f1+i1•Ltooj1�t""'t--•• -• campo receptor, moviéndose hacia abajo 11 j 1 • .
e u,� hm'"'"' ='" '"' " oom<><> d/ . " . 1 " o receptor, moviéndose hacia abajo � •
D o · • • • 6 . . . . . ... El mismo movimiento. pero hacia arriba
FIGLRA 2-45 De Hube/ y Wiesel ( 1965).
PROCESAMIENTO DE J NFORMACION NEURAL 1 1 l leza de un detector de movimiento lo hace específico para movimientos de una sóla dirección, las células hipercomplejas pueden mostraralgunas veces alguna especificidad a movimientos en dos direcciones.De esta forma, en la Figura 2-47 vemos que la célula respondecuando la línea se mueve hacia arrib� y a la derecha o haciaabajo Y a la izquierda. Ahora bien, si la línea es demasiado larga,la respuesta se termina.
Los detectores de bordes también muestran especificidad al tamaño. Las Figuras 2-48 y 2-49 representan un detector de bordes
A � Respuesta
& ·---+-· -
B LJ ___ , __ , .......... L-._ Z.7 '-H!-lli-c� ZJ · � I trlll· l ftl
F I G U RA 2-46
8 17"i 0 1 { { F I G U RA 2-47
FIGURA 2-48
Las Figuras 2-46 y 2-48 son de Hube/
y Wiesel ( 1965 ) . La Figura 2-47 es de
Hube/ y Wiese/ ( /968j .
1 1 2 PROCESAMIENTO DE INFORMACION HUMANA
que responde a un pequeño rectángulo que se mueve en el campo en cualquiera de las distintas direcciones-- de nuevo, una respuestatípica de célula compleja. Pero tan pronto como el rectan�ulose ensancha más allá de una cantidad critica, la respuesta se termma.
Todavía se encuentra otra novedad en las células hipercomplejas de este nivel de procesamiento,: un detector de ángulos. La Figura 2-50 representa una célula muy sensible al movimiento ase
.endente
de un ángulo recto a través del campo receptor. Otros angulos,
s Respuesta
� --1: MHRl•-•1�111'-�
~ �-.....IMt ...... 1 -·
. •• I�
FIG U RA 2-49
Estas figuras son de Hube[ y Wiesel
( 1965) .
1 11 FIG U RA 2-50
PROCESAMIENTO DE INFORMACION NEURAL 1 1 3 aunque provocan algunas respuestas, no son tan claramente eficaces en la activación de la célula.
Cómo construir células hipercomplejas. No seria sorprendente darse cuenta de que las células hipercomplejas pueden construirse combinando entre sí las salidas de las complejas. La característica más nueva es que ahora la inhibición juega un gran papel : la Figura 2-5 1 muestra la conexión de tres células complejas para formar una célula hipercompleja muy sensible a una línea de orientación y longitud específica (Observe que en lugar de utilizar inhibición, podría conseguirse el mismo resultado reuniendo las salidas de tres células complejas, que tuviesen un detector de aberturas ( - + - ) en la célula intermedia y dos detectores de línea ( +
- +) en las restantes).
Retina
Célula hipercomplej a
F I G U RA 2-51
l l4 PROCESAMIENTO DE INFORMACION HUMANA
Nuestro argumento termina en este punto, porque perdemos la pista a los mensajes sensoriales cuando se introducen en las regiones más centrales del cerebro. No significa que todo acabe aquí -muy lejos de ser cierto-, sino que éste es el estado actual del conocimiento.
Las células que conocemos ahora están esquematizadas en la Figura 2-52. Todavía estamos muy lejos de comprender los mecanismos de reconocimiento de formas. Parece que las redes neurales
Objeto emplrico Lente del ojo
Etapa l
A nálisis por célula simple
(Movimiento)
®'----- ====� __ .UJJ ovimiento) 1-1-11,
8
8 Tipos de detectares
Q Contornos
® Movimiento
G Angulos
® (Movimknto)
8 Longitud de línea específü::a
FIGURA 2-52
Etapa 2 Análisis mediante células
complejas
Etapa 3 Análisis mediante células
hi ercom le·as
1 lReconocimiento de formas
<<Un cubo en movimiento»
PROCESAMIENTO DE INFORMACION NEURAL 1 1 5
de extracción de características se complican crecientemente a medida que el mensaje sensorial se introduce en el cerebro, pero todavía no sabemos adónde conduce cada uno de ellos.
CONCLUSIÓN
Hemos conseguido una gran cantidad de princ1p10s generales. El análisis de los mensajes sensoriales parece realizarse en pequeños pasos, cada uno produciendo una reorganización de la información proporcionada por los pasos anteriores. La elaboración se desarrolla durante las interrupciones en el camino sensorial-- las sucesivas estaciones de relevo por donde pasan los mensajes desde el ojo hasta las regiones centrales del cerebro. En cada una de las reorganizaciones, se extraen las distintas características del mensaje sensorial. En ocasiones, la información proporcionada por los estados anteriores se convierte en más específica : los detectores de línea del primer nivel de la corteza son insensibles a la longitud de la línea ; los niveles posteriores son más selectivos y sólo responden a líneas con longitudes específicas. Otras veces se extrae una característica más general, combinando las respuestas de detectores específicos de etapas precedentes. El segundo nivel del procesamiento cortical es mucho menos sensible a la posición exacta de una línea, en comparación con los detectores que actúan en el nivel inmediatamente anterior.
En general, cuando el mensaje sensorial se introduce en el sistema, se reduce continuamente la cantidad de información que transporta. La actividad de los 1 25 millones de receptores del ojo se registra en la estructura de la respuesta de las 800.000 fibras ganglionares que salen del ojo. A medida que avanza el mensaje, desciende cada vez más el número de neuronas que responden a cualquier señal determinada. Una línea en una región específica provocará la respuesta de todos los detectores de línea que registran esa región. Dos niveles más, y sólo responderán los detectores sensibles a líneas de una longitud específica. En los niveles superiores, la actividad neural se limita primariamente· a las partes de la imagen donde cambia la dirección de los contornos- los ángulos de la estructura del estímulo o los puntos donde termina la línea. Las tasas espontáneas altas y la actividad de respuesta sostenida ante señales continuas en los niveles inferiores del procesamiento neural, desaparece en los niveles superiores del sistema. La corteza está relativamente calmada, y solamente se altera mediante breves y
116 PROCESAMIENTO DE INFORMACION HUMANA
esporádicas ráfagas dt:' actividad, cuando el signo externo cambia de alguna forma.
La reducción de información durante el análisis sensorial es muy arbitrario y aleatorio. La regla básica del sistema nervioso parece consistir en descubrir cambios en la estructura de la señal. Se comparan las intensidades de las regiones cercanas de la retina : las respuestas están en función. de las diferencias. Algunos circuitos comparan la señal actual con la anterior. Si son iguales, el resultado consiste en una inactividad relativa; si son diferentes, se produce una fuerte respuesta, pero sólo por breves momentos. La estrategia básica del análisis parece que consiste en una comparación : se observan las diferencias ; las constancias tienden a suprimirse.
El mecanisQlo primario de comparación consiste en enfrentar las influencia., excitadoras contra las inhibidoras. Los procesos para sumar y restar entradas a una neurona, proporcionan la potencia . de cálculo necesaria para desarrollar el complicado análisis de la imagen visual. Estas simples comparaciones inhibidoras y excitadoras forman la base de todos los circuitos neurales, en todos los sistemas sensoriales y en todas las especies de animales que se han investigado hasta ahora.
En principio, podríamos continuar y utilizar el mismo tipo de maquinaria para construir detectores aún más complejos-- detectores para reconocer familiares, coches y casas. Realmente, una simple extrapolación de lo que se conoce sobre procesamiento de información neural, sugiere que esto es de hecho lo que ocurre. Pero hemos visto en el primer capítulo y veremos de nuevo en el siguiente que tales extrapolaciones son peligrosas, cuando se estudia un sistema tan complejo como el cerebro humano. Un cuidadoso examen de la percepción humana sugiere que aún existen cierta cantidad de misterios que todavía no pueden explicarse por medio de estos mecanismos básicos de procesamiento de información neural.
LECTURAS RECOMENDADAS
Una buena introducción a los problemas planteados en este capítulo, la proporciona el libro de Ratliff Mach Band� (1965). Algunos ejemplos utilizados en este capítulo se sacaron de · ese libro. Además, el lector interesado en los mecanismos de interacción neural debe comenzar con los ya ctásicos trabajos de Barlow, Hill y Levick (1964), las series de Hu�l y Wiesel (1962, 1963, 1965, 1968) y el original escrito sobre «What the Frog's Eye Tells the
PROCESAMiENTO DE INFORMACION NEURAL 117
Frog's Brain» de Lettvin et al. (1959). Casi toda la información fisiológica sobre células aisladas de este capítulo se ha sacado de las siete referencias que acabamos de mencionar. Algunos escritos más avanzados sobre este asunto se pueden encontrar en la colección Sensory Communication, editada por Rosenblith (1961).
Cornsweet (1970) y Dodwell (1970) presentan una revisión de los mecanismos neurales de una forma muy parecida a como lo hemos hecho aquí. Ambos libros son importantes para distintos capítulos de este libro : Cornsweet trata muchos problemas d� percepción visual de una forma magnífica y elegante ; Dodwell discute el problema general del reconocimiento de formas. Deutsch ( 1967), un ingeniero electrónico, presenta un conjunto interesante de modelos neurológicos en su libro.
Modelos del sistema nervioso
C. F. Stevens (1966) presenta un libro sobre neurofisiología, como lo haría cualquier texto de psicología fisiológica publicado en la década de 1960 ó 1970. .
Eccles (1953, 1964, 1965) discute las implicaciones fisiológicas de las estructuras neurológicas, al igual que proporciona una descripción detallada del proceso de la sinapsis. Literatura más reciente y avanzada se puede encontrar en los artículos del Annual Review, especialmente los de Bishop (1967) y los de Creutzfeldt y Sakmann ( 1969) (en el Annual Review of Physiology).
Georg von Békésy revisa el papel de la inhibición lateral en muchas modalidades sensoriales, en su pequeño libro Sensory lnhibition (1967). Básicamente, se puede decir que tanto el libro de Ratliff Mach Bands como el de Békésy es una literatura obligada paraquien tenga interés en todo el material de esta sección. �mb?slibros tratan ampliamente la inhibición lateral, el concepto pnmano implicado en la construcción de circuitos neurales. Además, los dos libros son amplios y fáciles de leer.
Sekules y Ganz ( 1963), y Pantle y Sekules ( 1 968) exploran algunas implicaciones de los detectores de movimiento en la percepción humana.
Los estudios sobre el Efecto McCollough se realizan con tantarapidez, que lo mejor es buscar literatura a través del Psycho/ogi�alAbstracts y del Annual Reviews (los artículos importantes apareceran en las secciones de percepción, visión del color y mecanismos fisiológicos de la visión). Desde luego, se debe comenzar con los artículos
1 1 8 PROCESAMIENTO DE INFORMACION HUMANA
mencionados en estas secciones sobre el efecto, Capítulos 1 Y 2 :
Harris y Gibson ( 1968), McCollough ( 1 965), Stromeyer ( 1969); Stro
meyer y Mansfield ( 1970). Otra forma de reastrear este fen�me�o
es buscar las citas del artículo original de McCollough en el Cztatwn
Abstracts. 3
TEORIAS DEL RECONOCIMIENTO DE FORMAS
PANDEMÓNIUM: Características para el reconocimiento de letras. -Cómo construir un pandemónium.-La importancia de los errores.-Respuestas ante formas distorsionadas.-Características para el reconocimiento del habla.-EI problema de
1la segmentación.--Detectores de características del habla.---Fonemas.-Características distintivas.�--Resumen del análisis de características.-ANÁLts!S POR SÍNTE· sis : El problema del contexto.--Calcetines húmedos.--La importancia de la redundancia.-LA SÍNTESIS DE VN MENSAJE SENSORIAL : La secuencia de operaciones.-CARACTERÍSTICAS VERSUS EXPECTATIVAS.-LECTURAS RECOMENDADAS.
En el último capítulo estudiamos algunos mecanismos neurales que fundamentan nuestras experiencias perceptivas. ¿Son suficientes estos sistemas de detección para explicar el reconocimiento humano de formas ? Si pensamos un poco sobre este problema, nos surgen de inmediato unos problemas básicos.
Si el sistema debe ser un modelo del reconocimiento humano dé formas, entonces es necesario que tenga bastante flexibilidad. Por ejemplo, debe ser capaz de reconocer con cierta fiabilidad una letra determinada, aun cuando se presente en distintos T AMAÑOS y 0,;ent•<ͺ"" Además, no deberá estar muy influido por los distintos tipos de distorsiones que se puedan producir en las formas. Podemos reconocer fácilmente una forma aun cuando se omitan algunas partes de ella.
o cuando aparecen líneas irrelevantes ·
o cuando diversas formas están asociadas con la misma letra :
A A w aA�llt-aAA ·supp1;:,Au! sUJ1;:,1 1;:,;:,¡ som;:,pod •somuz101s;:, sou ¡s 'oq:xn-t ;:,a
1 20 PROCESAMIENTO DE INFORMACION HUMANA
Esta es una lista formidable de requisitos. Sin embargo, tenemos que enfrentamos a ellos si queremos comprender el procesamiento de información perceptiva. Tenemos que examinar el tipo de sistema que surge cuando intentamos combinar las características extraídas durante los procesos visuales, junto con la potencia y flexibilidad de la percepción humana, para intentar construir un modelo de reconocimiento humano de formas.
PANDEMÓNIUM
Un posible método para utilizar el análisis de características en el reconocimiento de formas, es el sistema llamado Pandemónium (Selfridge, 1 959). Este sistema se compone de una serie de demonios que trabajan sobre la forma, cada uno realizando una tarea distinta (Figura 3- 1 ).
DEM ON IOS COG NITIVOS
FIG U RA 3 - 1
El primer conjunto de demonios, los demonios de la imagen, realizan la tarea más simple. Sencillamente registran la imagen inicial del signo externo. A continuación, la imagen se analiza mediante los demonios de características. Cada demonio de característica busca un aspecto particular de la forma : la presencia de cierto t ipo de línea ; la presencia de ángulos de alguna clase ; o, quizá, ciertas curvas o contornos. Los demonios cognitivos se encargan de las respuestas de los demonios de características. Cada demonio cognitivo es responsable del reconocimiento de una forma.
1
TEORIAS DEL RECONOCIMIENTO DE FORMAS 1 2 1
De esta manera, se utilizará un demonio cognitivo para reconocer la A ; otro para reconocer B, y así sucesivamente. El demonio cognitivo de A intenta encontrar pruebas de la presencia de las características asociadas con una forma particular. Cuando un demonio cognitivo encuentra una característica adecuada, comienza a gritar. Cuantas más características descubre, más fuerte grita. Finalmente, un demonio de decisión escucha el pandemónium producido por los demonios cognitivos. Selecciona el demonio cognitivo que grita más fuerte como la forma que ocurre en el medio ambiente con más probabilidad.
Por tanto, el pandemónium describe la secuencia de acontecimientos que se necesitan para analizar las características de las formas. Solo se diferencia del esquema del patrón, mencionado en el capítulo primero, en que se registra primero la imagen me?ianteun conjunto de características, en lugar de realizar una comparación directa contra una réplica o representación interna. Al igual que el esquema del patrón, e l pandemónium busca todas las formas al mismo tiempo. Cada demonio cognitivo registra el grado en que la entrada se asemeja a un conjunto·particular de características. Es un esquema atractivo y flexible para el reconocimiento de formas. Por ejemplo, es posible conseguir efectos de aprendizaje. Cada demonio cognitivo, aprenderá gradualmente a interpretar las distintas características asociadas con su forma particular. Resulta bastante fácil incluir los efectos del contexto, añadiendo demonios contextuales que sumen sus voces al pandemónium. Además, el análisis de características es compatible con lo que sabemos sobre la forma en que el sistema nervioso analiza las señales externas. Como hemos visto en capítulos anteriores, las neuronas individuales del sistema perceptivo tienen exactamente el mismo tipo de respuesta, lo que las convierte en útiles demonios de características.
¿Puede solucionar un sistema de reconocimiento de características, los problemas asociados con el cambio de tamaño, orientación y posición de una forma determinada? No directamente. Depende de la naturaleza de las características que se estén analizando. Supongamos que se describe la H como dos líneas verticales más una corta línea horizontal. Con este conjunto de características, cualquier cambio de orientación plantearía tantos problemas al análisis de características como a la comparación con un patrón. El pandemónium esboza cómo se pueden utilizar las características para reconocer las formas ; de ninguna forma nos dice cuáles son las características que se están recogiendo realmente de la información sensorial de entrada.
1 22 PROCESAMIENTO DE INFORMACION HUMANA
Características para el reconocimiento de letras
Cuando pretendemos diseñar una máquina para reconocer formas, estudiamos la totalidad de la forma, e intentamos determinar las características que clasifican inequívocamente a cada forma. En principio, somos perfectamente libres de seleccionar cualquier conjunto de características que pensamos discriminan de una manera fiable unas formas de otras. El principal criterio consiste en que el conjunto de características sea tan simple como se pueda; que produzca la menor cantidad de errores posibles ; y que las características puedan analizarse utilizando circuitos simples. Revisaremos este proceso, pero no de una forma tan arbitraria. Intentaremos utilizar lo que sabemos sobre el sistema nervioso humano, para determinar un conjunto de características que pueda utilizarse por el sistema de reconocimiento humano de formas.
Cómo construir un pandemónium
El estudio de los tipos de las respuestas neurales, producidas por señales específicas de entrada, sugiere que los sistemas perceptivos de los organismos de nivel superior extraen una gran cantidad de datos sobre las características específicas de la imagen visual. Recordemos que en los centros cerebrales que reciben información sensorial de nuestros receptores, algunas neuronas individuales sólo reaccionan ante la presencia de una línea recta en una orientación determinada de un sitio determinado de la imagen retiniana. La misma reacción se produce al margen de la longitud de la línea. Las neuronas cercanas también responden al máximo ante una línea de orÍentación particular, pero no son tan exigentes sobre su localización exacta. Otras neuronas parecen ser más sensibles a los contornos de ciertas formas
·o a las líneas de intersecciónque forman un ángulo de un tamaño determinado. Por tanto, los sistemas visuales extraen una gran cantidad de información detallada sobre las características específicas de la imagen visual. De hecho, se extrae más información que la que sería necesaria para reconocer las letras mediante un esquema de pandemónium.
Se puede condensar la información aplicando el mismo principio que hemos utilizado para construir patrones : reunir cierta cantidad de células para construir un detector de característica más general. Por ejemplo, las neuronas que responden a líneas verticales en diferentes partes de la imagen retiniana, podrían reunirse para producir un detector de línea vertical. La tasa de respuesta de este demonio de característica representaría la cantidad de líneas verticales en
TEORIAS DEL RECONOCIMIENTO DE FORMAS 1 23 la forma, al margen de la longitud, intensidad o «bondad» de cada línea. De la misma manera, se podría conectar un demonio de característica general de líneas horizontales y líneas diagonales a los detectores neurales adecuados. Se podría hacer lo mismo con la información de ángulos : un demonio de característica podría especificar la cantidad de ángulos rectos en la forma ; otro, la cantidad de ángulos agudos. Finalmente, debería existir alguna información relacionada con las curvas. De momento, podemos inventar dos demonios de curvas que serían útiles en un sistema de reconocimiento de formas : uno que responda a la cantidad de curvas continuas (tales como las que aparecen en la O y la Q), y otro que responda a la cantidad de curvas discontinuas (D y C). Despuésde realizar las conexiones adecuadas, el sistema resultante se parecería al de la Figura 3-2 (Tabla 3- 1) .
DEMONIO DE LA IMAGEN
� 1 1 1 1 1 1
DEMONIO$ DE CARACTERISTICAS
FIGURA 3-2
1 24
A
B e o
E F G H
J K L M
N o
p
a R
s T
u V
w X y z
PROCESAMIENTO DE INFORMACION HUMANA
Líneas Líneas Líneas Angulos Angulos Curvas Curvas verticales horizontales oblicuas rectos agudos continuas discontinuas
1 2 3 1 3 4 2
1 1 2 2 1 f 3 4 1 2 3 1 1 1 1
2 1 4 1 2 4 1 ! 1 2 f 2 1 1 1 2 2 3
2 1 2 1
1 2 3 1 j 2 1
1 2 1 3 1 2
1 1 2 2 1
2 1
4 3 2 2
1 2 i 2 1 2
TABLA 3- l
En este caso, se analiza la información sensorial para siete tipos generales de características. Cada demonio de característica registra la cantidad de cierto tipo de características que contiene la forma. Los demonios cognitivos buscan los valores particulares
TEORIAS DEL RECONOCIMIENTO DE FORMAS 1 25
de las características que describen una forma, y la fuerza de su respuesta está determinada por el número encontrado de tales características. Se selecciona finalmente la forma adecuada mediante el demonio de decisión, que reacciona ante el demonio cognitivo que responda con más fuerza.
Debemos solucionar un problema más, antes de que el sistema pueda funcionar. Algunas letras sólo difieren de otras en que tienen características adicionales. Por ejemplo, la F tiene una línea vertical, dos líneas horizontales y tres ángulos rectos. La letra P tiene todas estas características más una curva discontinua. Si se presenta la P al sistema, no hay problema : el demonio de la P responde más que el de la F. Pero si se presenta la F, los demonios de la F y de la P gritan por igual : el demonio de la decisión será incapaz de elegir entre ellos. Se plantea el mismo problema entre la P y la R, la V y la Y, la O y la Q, etc.
Una forma de solucionar este problema consiste en determinar un nivel típico de respuesta máxima para todos los demonios. Un demonio solo responde con su tasa máxima cuando están presen· tes todas las características que busca. Tanto la ausencia de una
'éaracterística buscada como la presencia de una característica irrelevante, inhiben la plena capacidad del grito del demonio.
En esquema, éste es un replanteamiento para un sistema de reconocimiento de características específicas. ¿Podría funcionar? La única forma de saberlo consiste en comprobarlo y ver cuál es su conducta. Veamos lo que sucede cuando se presenta una letra - -por ejemplo, la letra R (Figura 3-3).
En primer lugar, la R está codificada por los demonios de la imagen, y se envía la información para un procesamiento posterior. Ahora es cuando comienzan a responder los demonios. de las características. El primer demonio de característica registra la presencia de una línea vertical. Esto no sirve de mucho para clasificar la forma. El diagrama muestra a los demonios cognitivos, que se activan por la presencia de una línea vertical única. De las 26 posibles letras del alfabeto, I 3 tienen una línea vertical única, 6 tienen dos líneas horizontales. A medida que avanzamos en la lista, observamos que las distintas características activan diferentes conjuntos de demonios cognitivos. En este caso, el demonio de decisión tiene una fácil decisión, puesto que la R es claramente la respuesta más activa. La siguiente forma más probable sería una P, que aparece en cuatro de las siete listas, y el tercer demoniomás activo sería el de la D, que se empareja con tres de
. las siete
características.
1 26
DEMONIO DE LA
IMAGEN
F I G V RA 3-3
PROCESAMIENTO DE INFO�MAClON HUMANA
� 1 1 1 l 1 l 1 1
DEMGNIOS DE CAllAC'TI!RISTICAS DEMONIOS COGNITIVOS
La importancia de los errores. Observe alguna de las características importantes, que se esperaban en este tipo de sistema de reconocimiento de formas. Por ejemplo, para reconocer la R no se necesitan los siete demonios de características. Es suficiente observar que existe un ángulo agudo y un contorno ctrrado. Ocurriría lo mismo si se recogiese toda la información de ángulos sobre la forma -la presencia de tres ángulos rectos y uno agudo caracteriza la forma como una R. Por tanto, para cualquier letra, los siete demonios de características proporcionan más información de la que se necesita. Esto significa que aunque algún demonio de característica fracasara, el sistema de reconocimiento de formas todavía actuaría correctamente ante algunas señales. Las siete características sólo se necesitan cuando se consideran en conjunto todas las formas
TEORIAS DEL RECONOCIMIENTO DE FORMAS 1 27
posibles. Es decir, si escribimos los valores de las características asociadas con cada letra, necesitamos siete características distintas para obtener una serie única de números para cada letra. Si se añaden más formas, se tienen que utilizar más características, y la naturaleza de las características dependerá de las características de las formas adicionales.
Un segundo punto a tener en cuenta es que el conjunto particular de características seleccionadas para el reconocimiento de formas, determinará los tipos de errores de reconocimiento que se producen. En general, si existe alguna dificultad para identificar una R, podemos esperar que la P sea la alternativa más probable. Cuando la señal de entrada se transforma en el conjunto de características, la P es la forma más similar a la R.
Por tanto, una comprobación de la teoría podría consistir en presentar a la gente, las distintas letras en condiciones de dificultad de identificación, para ver qué tipos de errores cometen. El resultado de tal experimento produce una matriz de confusión, que describe las formas de los errores que se producen cuando se intenta identificar las letras. La Figura 3-4 muestra un ejemplo de una matriz
Caracteres nombrados A B C O E F G H I J K L. M N O P Q R S T U V W X Y Z 1 2 3 4 5 6 7 B 9 e
A 1 9 10 2 l S e 1 29
o 14 2
-f-t-t--t-1-j-t-t--t-l-t.rt--t;t� .� 6
10 6 7
+-+-+-lf-+-++-+-1 1:
FIGURA 3-4 De Kinney, Marsetta y Showman (1966).
· : �1 3 " 4 "' 5
4
o 1 3 8 4
1 28 PROCESAMIENTO DE INFORMACION HUMANA
de confusión, producida mediante la presentación instantánea de las letras de la Figura 3-5 sobre una pantalla, pidiendo después a los sujetos que informasen sobre lo que habían visto. (Estos datos provienen de un experimento de Kinney, Marsetta y Showman, 1 966).
A B C D E F G H I J K L M N O P Q R
S T U \/ W X Y Z I 2 3 4 5 6 7 8 9 121
FIGURA 3-5
Verticalmente, a la izquierda, aparecen las letras que fueron pFesentadas. Horizontalmente, en la cabecera, aparecen las letras que los sujetos informaron que habían visto. Si buscamos la R en la columna izquierda, y después la fila correspondiente horizontal, veremos las respuestas que se han producido cuando el sujeto intentaba identificar esta letra. Recorriendo esa fila, descubrimos que los observadores cometen un total de seis errores al identificar la R : cuatro de esos seis errores se cometieron con la P.
Un tercer aspecto a observar sobre el esquema de reconocimiento de características, es que los errores al identificar las letras no son necesariamente simétricos. Observe la letra C, por ejemplo. Si se presentase esa letra, solo respondería el demonio del contorno abierto (curva discontinua). De esta forma, cuando aparece la C, el demonio de decisión tendría problemas para decidir si es una C o una G. Observe los errores realizados al reconocer la C en la matriz de confusión. Los sujetos tienen más dificultad para reconocer la C que en cualquier otra letra : 2 1 veces informaron de una G cuando realmente se presentaba una C. Sin embargo, la Ietr¡;t C no sería una respuesta frecuente cuando se presenta una G.
Respuestas ante formas distorsionadas. Ahora que hemos explicado algunas características del pandemónium, volveremos a considerar los problemas producidos por las distorsiones de la forma externa : los cambios en el tamaño de los caracteres no presentan ningún problema para este esquema de extracción de características. Los demonios de las características recogen información de los detectores de líneas, siendo ellos mismos insensibles a la longitud de las líneas. Los ángulos rectos siguen siendo ángulos rectos, y los ángulos agudos continú!ln apareciendo como agudos, al margen del tamaño de la letra.
La orientación es un asunto distinto. Si acostamos la F sobre un lado, se produciría mucha confusión en estos demonios partícula-
TEORIAS DEL RECONOCIMIENTO DE FORMAS 1 29
res, puesto que se origina una forma con dos líneas verticales Y una horizontal, más tres ángulos rectos. Sin embargo, si giramos la F por completo, no se produce alteración alguna en este sistema de reconocimiento de formas : los demonios de líneas horizontales y verticales producirían exactamente la misma respuesta.
Evidentemente, una forma de corregir la sensibilidad del sistema a la orientación, consiste en construir demonios de características aún más generales. Podemos reunir todos los demonios que responden a las líneas rectas, para producir un demonio general de línea que responda al margen de la orientación (Figura 3-6).
DEMONIO DI! LA IMAGEN
FIGURA 3-6
DEMONIOS COONJTIVOS
En la medida en que hablamos de teorías, esto se consigue fácilmente. Pero ¿aún sería capaz el sistema de reconocimiento de reconocer todas las letras con este conjunto más general de características ? No lo suficiente. Las letras M y W se confundirían,
1 30 PROCESAMIENTO DE INFORMACION HUMANA
puesto que cada una tiene cuatro líneas y tres ángulos agudos. De la misma manera, la N y la Z serían confusas : estas dos letras tienen tres líneas y dos ángulos agudos (Figura 3-7).
DEMONIO DE LA IMAGEN
� \ ' 1 1 1 1 1 '
FIG U RA 3-7
DEMONIOS COGNITIVOS
Normalmente, los adultos no confunden estos dos conjuntos de letras, aunque ocurre en algunos niños. Parece claro que esta última combinación de características no constituye una descripción adecuada del análisis de características realizado por los humanos.
Características para el reconocimiento del habla
No es muy difícil ver cómo puede el esquema de extracción de características próporcionar una iniciación razonable para un sistema de reconocimiento de letras. Aun con un conjunto muy
TEORIAS DEL RECONOCIMIENTO DE FORMAS 1 3 1
simple de características, parece que se consigue un proceso razonablemente adecuado para las formas de las letras. Pero la cosa no es tan simple con el habla. En este caso, la naturaleza ondulatoria del habla añade grandes dificultades en el análisis. A pesar de los grandes gastos de dinero y esfuerzo, nadie ha conseguido un sistema de recono<iimiento del habla, que tenga una capacidad aun limitada de reconocer palabras, y aun cuando las palabras sean pronunciadas con claridad y cuidado por cierto número limitado de personas.
Existen tres grandes dificultades en el reconocimiento del habla. En primer lugar, existe el problema de la segmentación : las unidades que deben reconocerse no están claramente delimitadas. Segundo, existe una gran variedad de formas ondulatorias físicas, cuando personas distintas pronuncían la misma palabra, o cuando la misma persona dice una palabra determinada ·en contextos distintos. Finalmente, existe poco acuerdo sobre la identidad de las características básicas que podrían utilizarse para el reconocimiento del habla, si es que existe alguno.
El problema de Id segmentación. En el análisis del texto impreso, cada letra está claramente separada de las demás por una cantidad determinada de espacio, y cada palabra está separada de las letras por otra cantidad mayor de espacio. De esta forma, es bastante simple determinar los límites entre las letras, palabras y sentencias _:_no ocurre lo mismo con el habla.
Cuando se escucha hablar a alguien, sus palabras suenan distintas y con frecuencia bastante bien articuladas. Parece que existe una separación bien definida entre la mayoría de las p::il 1bras. Todo esto es una ilusión. Las distinciones claras que se perciben tan fácilmente, no están presentes en la señal física sino que son �l resultado del proceso de reconocimiento de formas : están producidas por el análisis. De hecho, las ondas sonoras constituyen una combinación particular de sonidos inarticulados, segmentos mal pronunciados, omisiones y contracciones. Lo peor de todo es que no exista una conexión aparente entre las pausas de las ondas sonoras y los límites entre las palabras.
La forma más fácil de convencerse de esto, consiste en escuchar a alguien que está hablando una lengua extranjera. Si no se conoce esa lengua, parece que las palabras fluyen en una corriente continua y con un ritmo rápido. Hasta el estudiante que aprendió cuidadosamente el vocabulario de un lenguaje, descubre que tiene una gran dificultad para captar las palabras que conoce, en las expresiones
1 32 PROCESAMIENTO DE INFORMACION HUMANA
aparentemente continuas del orador nativo. De hecho, la aparente rapidez de los lenguajes extranjeros es, en la mayoría de los casos, una ilusión. Las diferencias éle nuestras percepciones se deben a la actuación de un sistema de reconocimiento de formas. En el caso propio, los sonidos se pueden interpretar significativamente y las palabras aparecen como entidades discreta&� en el caso ajeno, el sistema de reconocimiento es inadecuado y los sonidos se presentan como desorganizados, carentes de sentido.
Existen algunas propiedades en las ondas fisicas que son de alguna utilidad para la segmentación del mensaje verbal. Sin embargo, ninguna de las características fisicas estudiadas hasta ahora proporcionan indicios completamente fiables como para establecer límites entre palabras. Y sin embargo, en muchos casos, parece que el sistema de análisis puede darse cuenta de que la palabra que va delante descubre sus propios límites. Cómo puede segmentarse adecuadamente la forma sonora p-a-n-a-l, sin saber si las palabras están asociadas a la frase La miel depositada en un panal, o a la frase Llevó el pan al caserío. La solución para esta circularidad en el análisis de las formas sonoras es un sistema de reconocimiento de formas más complicado, que se discutirá en la siguiente sección.
Detectores de características del habla
Fonemas. Los lingüistas han intentado durante mucho tiempo caracterizar los componentes sonoros del habla. Es evidente que en el castellano escrito, la sílaba y la letra individual representan unidades elementales de una palabra. En la lengua hablada, las unidades básicas no son tan fáciles de encontrar. Pero para el oído entrenado, parece que existe un pequeño vocabulario de sonidos básicos a partif de Jos cuales se forman las palabras. Un sonido particular se cualifica como unidad básica si sirve para algún propósito funcional del lenguaje. Consideremos las palabras mal, cal y sal. Cada una de estas palabras tiene un significado distinto. La diferencia está completamente determinada por el cambio de un solo sonido, en este caso los sonidos iniciales «m», «c» y «s». Un sonido que puede cambiar por sí mismo el significado de una palabra, se llama un fonema. Los sonidos «a», «e», «i», «O» y «U» también son fonemas. Cuando se sustituyen sistemáticamente en una palabra, también producen nuevas palabras significativas.
Observe que cada letra no se corresponde necesariamente con un fonema. Además, la cantidad y naturaleza de Jos fonemas difiere
TEORIAS DEL RECONOCIMIENTO DE FORMAS 1 33
de un dialecto a otro de un mismo lenguaje. En lengua inglesa, en algunas partes del país, las tres palabras merry, marry y Mary se pronuncian igual. Sin embargo, en otras partes de lo� �st�dosUnidos, las tres palabras se pronuncian de una manera muy distmta.
Las diferencias de sonidos que no señalan diferencias en el significado tienden a pasar desapercibidos. El fonema «d» se pronuncia de una manera muy distinta cuando aparece en diente que cuando aparece en sed, aunque el orador normal rara vez se da cuenta de estas diferencias.
TABLA 3-2. Los Fonemas del inglés-ameril'ano general •.b
Vocales Consonantes
ee como en heat t como en tee s como en see
l como en hit p como en pea sh como en shell e como en in head k como en key h como en he
ae como en had b como e n bee v como en view
ah como en father d como en dawn th como en then
aw como en call g como en go z como en zoo
U como en put m como en me zh como en garage oo como en cool n como en no l como en law .1.. como en ton ng como en sing r como en red uh como en the f como en /ee y como en you
er como en bird e como en thin w como en we
oi como en to11
au como en shout
ei como en take
ou como en tone
ai como en might
ª El americano general es un dialecto del inglés hablado en las áreas del oeste Y del medio oeste de los Estados Unidos, y que influye sobre un número creciente de americanos. Algunos fonemas de otros dialectos regionales (por e;emplo, el Sur, Inglaterra. etc.) pueden ser distintos. b De Denes y Pinson ( 1963) .
Si los fonemas son los bloques básicos de construcción de las palabras, ¿hemos encontrado entonces las . características para un sistema pandemónium de reconocimiento del habla? Probablemente, no. Hacer equivalentes los fonemas a las características no es de mucha ayuda. A diferencia de los detectores de línea y de ángulo del sistema visual, no se conoce ninguna forma de analizar y extraer realmente los fonemas de las óndas sonoras habladas. Hasta ahora, sólo el hombre puede reconocer un fonema en las ondas sonoras.
134 PROCESAMIENTO DE INFORMACION HUMANA
Características distintivas. Las dificultades para identificar fonemas han conducido a otros esquemas para clarificar los sonidos del habla. Un método consiste en examinar cómo se produce el habla, para ver si las ondas pueden describirse en términos de las distintas operaciones implicadas en la generación de sonidos. Los sonidos del habla son el resultado de la compleja interacción de ciertas partes del aparato vocal. El diafragma expulsa el aire a través de la tráquea. El velo del paladar abre y cierra los conductosnasales al paso del aire. La lengua, los dientes y los labios semueven sincrónicamente para determinar la estructura armónica y temporal de las formas sonoras producidas.
Los · sonidos pueden clasificarse en función de la operación deestos distintos componentes. Si el aire que pasa a través de Ja tráquea hace vibrar las cuerdas vocales, produce un sonido sonoro, como la «a» o la «b». Cuando las cuerdas vocales no vibran durante la producción del sonido, se produce un sonido sordo, como en la «s» de más. Otra característica distintiva está formada por laposibilidad de limitar el paso del aire en la boca para producir un sonido silbante, llamado fricativo -«s», «f». En otros sonidos, se interrumpe por completo el paso del aire por un corto periodo de tiempo, para después dejarlo pasar explosivamente, produciendo un sonido oclusivo -«p» y «t», por ejemplo. Las oclusiones producenuna ruptura definida en la forma de la onda sonora, pero desgraciadamente estas rupturas no están relacionadas con los límites de las palabras. Cuando producimos la palabra standard, por ejemplo,existen tres rupturas distintas en el flujo del habla : uno después de la «S», otro después de la «n» y otro después de la «rn. Tambiénexisten tres rupturas en la frase, utiliza puntuaciones standard.
De esta forma, podemos codificar los sonidos del habla . en función de las características asociadas con su producción: cada uno produce una característica única en el sonido resultante. Presentamos aquí una posible cki.sificación de las características distintivas de cada uno de los fonemas del lenguaje inglés (Tabla 3-3).
Al igual que los fonemas, las características distintivas son difíciles de identificar en las ondas sonoras continuas. El carácter de los sonidos cambia fundamentalmente cuando aparecen en contextos distintos. En consecuencia, y de momento, tenemos diversas formasposibles de clasificar sonidos, pero ninguna de ellas funciona con plena eficacia. Algunas autoridades en la materia prefieren los esquemas de c lasificación basados en la producción del habla ; otros destacan la percepción del que escucha ; algunos intentan combinar las dos orientaciones. De momento, no hemos tenido éxito al intentar
�·ª .� :a :a 8 e "
;:,;. e i::: - � � i§ i§ � § ;¡¡ � <:> <:> "' U 8 - i::i � !i "' :::: i::;¡ i::;¡
�1 ¡;: � �
f i! ·1 "' .::; � i::;¡
-
l� :e: º
l� � !'.-;
- i::i i::s -.� � - ... � � u �
-., e - "" � � ·- e.!::: � � �
TEORIAS DEL RECONOC IMIENTO DE FORMAS ..
+ + + + + + + I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 ! + + + + + + + + + + + + + + + + + + + + 1 1
+ + + 1 1 1 + + + + + + + I 1 1 1 1 1 1 1 1 1 1 1
+ + 1 + + 1 + + + + + I 1 1 1 1 1 1 1 1
+ 1 + t
+ I 1 1 1 1 1 + 1 1 1 1 + 1 1 1 1 1 1 + 1
+ + + I 1 1 + + I 1 + + + 1 1 1
+ 1 1 + 1 1 + 1 + 1 + + 1 + + 1
+ 1 + I + 1 + 1
� �---e-� c - -- e - - = c�� c � .-;:::- a c..: c.. o. � � g ;:: c = e = -:-= �Q:..� :::-9 ::e 8. � a .... - ;¡; · - ·- ·:::i E - ·- ·¡: ·- - --:: - ·- --:: "3 .e: 1 o. c.. ·a..e - ":! � � C'IJ ·� � e:: � � ..Q -·e; - ·-e: � .....
5 5 5 5 fi t 5 6 5 5 5 5 � � u 5 fi 5 5 � � 5 � 5 5 � 5 5 º º º º º º º º º º º º � º º º º = º � º º º º º ºe e e e e � i e e e e e e e 8 e e e 1 - e e e e 1 1 1 18 8 8 �� 8 8 g 8 8 � 8 !�- 8 �í �!���¿���� ;;� :::i o �= = == � �� � e = � > � = � = ... N � � .c: •
1 35
1 36 PROCESAMIENTO DE INFORMA<:;ION HUMANA
diseñar un esquema que permita una máquina que reconozca el habla con facilidad, fluidez y en distintos sujetos.
Resumen del análisis de características
Hemos discutido ya lo suficiente como para poder comenzar a pensar sobre la forma en que está construido un sistema de reconocimiento de formas, sobre la base del análisis de características. La discusión proporciona material sobre cómo se construyen y comprueban las teorías del reconocimiento de formas. En cualquier teoría, la primera decisión es si puede funcionar de hecho. ¿Las características seleccionadas clasifican e identifican realmente todas las formas? Si estamos construyendo una máquina para leer direcciones y distribuir correo, entonces, si es posible, no deseamos que cometa ningún tipo de error. Pero los humanos cometen errores. Si pretendemos un modelo humano de reconocimiento de formas, entonces nuestro sistema debe producir los mismos errores que los que cometería una persona. El análisis de los errores se convierte en una de las formas más importantes para obtener información sobre el proceso del reconocimiento humano de formas.
Esta orientación general del reconocimiento de formas parece que es un camino correcto, pero los detalles son indudablemente incorrectos. Un aspecto importante consiste en estudiar los distintos niveles posibles de abstracción en el sistema de generalización de características. En un determinado nivel, el sistema respondería ante la cantidad de líneas verticales, horizontales y ángulos agudos de una región. En un nivel distinto, sólo podría analizar la cantidad total de líneas con determinada orientación. Y todavía sería preferible tener pasos intermedios o analizadClres aún más generales de características. En los humanos, lo más probable es suponer que una forma se clasifica simultáneamente en distintos niveles de generalidad. En el nivel superior, el sistema sólo podría responder cuando se le presenta una A. Los niveles inferiores informarían que la A está inclinada, por ejemplo. Otras partes del sistema probablemente se ocuparían de los detalles de la entrada, de las líneas y puntos innecesarios que deben eliminarse, antes de pasar a etapas superiores del procesamiento. En algunas tareas, sería suficiente con atender sólo a las características muy generales de la forma -su línealidad o curvatura general. Sin embargo, en otras tareas se puede necesitarun análisis detallado de la entrada. Cuando pretendemos diseñar un esquema general del reconocimiento de formas al margen de
TEORIAS DEL RECONOCIMIENTO DE FORMAS 1 37
FIG U RA 3-8
Roy Lichtemtein, «Cathedral # 5». Litografia, 123,19 x 82,55 centímetros. Copyright © 1969, Gemini G.E.L.
1 38 PROCESAMIENTO DE INFORMACION HUMANA
las distorsiones, es importante no descartar la posibilidad de observar que estas distorsiones estén de hecho presentes en la señal de entrada.
ANÁLISIS POR SÍNTESIS
Los esquemas de extracción de características descomponen las situaciones que los humanos tratan de una manera rutinaria. ¿Cómo puede decirnos el análisis de características si los sonidos (lle-va-remos-ta-za) representan las palabras (llevaremos taza) o las palabras (llevaré mostaza) ? ¿Qué características nos pueden decir que los símbolos 13 son números cuando aparecen en el contexto 13 O Y,pero son letras cuando aparecen en el contexto 13 579? ¿Cómo se enfrenta un sistema de reconocimiento de características a la siguiente forma? ¿Cuáles son las características que describen a la catedral ?
En realidad, los demonios del pandemónium no son suficientes. Es necesario incluir más información en el proceso de reconocimiento de formas, para explicar la enorme potencia del sistema de reconocimiento humano. ¿Qué otra cosa se necesita, cuando es evidente que fracasan tanto los patrones como las características?
El problema del contexto
Una gran parte de la interpretación de los datos sensoriales proviene del conocimiento de lo que debe ser la señal, más que de la sola información contenida en la señal misma. Esta información extra surge a partir del contexto del acontecimiento sensorial. El contexto es el ambiente total donde están incorporadas todas las experiéncias. Se saben muchas cosas sobre el material que se está leyendo, además de las formas de las letras de esta página. Sabemos que está escrito en castellano, que se discute sobre psicología en general, y en particular sobre psicología del reconocimiento de formas. Además, probablemente ya se ha aprendido bastante a estas alturas sobre el estilo del escritor, de forma que, cuando sus ojos se mueven sobre la página, se puede hacer una buena predicción de las palabras que se esperan. La enorme cantidad de información que se acumula y rutiniza para comprender los acontecimientos, recibe el nombre de contexto de esos acontecimientos. La capacidad para utilizar el contexto es la que hace al sistema de percepción humano superior y más flexible que cualquier sistema electrónico de reconocimiento de formas que se haya inventado hasta ahora.
TEORIAS DEL RECONOCIMIENTO DE FORMAS 1 39
Calcetines húmedos
Los efectos del contexto son fáciles de exponer. Se percibenmás rápida y fácilmente las figuras que tienen significado que lasque son simple decoración. La capacidad para leer y recordar letrases mucho más dificil cuando se colocan en una serie aleatoriasin significado -rasbuod-, que cuando las mismas letras aparecenen un orden significativo -absurdo. Aun cuando las letras formenpalabras significativas-laca sa eram uyb oni ta
, éstas son muy dificiles de percibir a menos que aparezcanen el formato que acostumbramos a utilizar.
Se han utilizado cierta cantidad de técnicas experimentales para demostrar los efectos del contexto sobre el análisis perceptivo de las señales de entrada. En un determinado ejemplo (un experimento realizado por Miller, l 962a), los sujetos escucharon una serie de palabras como calcetines, algunos, compró, húmedos, quién. Las palabras estaban mezcladas con ruido, de forma que cada palabra aislada sólo podía identificarse correctamente alrededor del 50% de las veces. En una segunda prueba, las palabras estaban ordenadas de forma que tenían cierta unidad significativa -quién, compró, algunos, calcetines, húmedos, para que los sujetos intentaran identificarlas. Cuando las palabras se escuchaban en orden gramatical, el reconocimiento de los sujetos mejoraba drásticamente. De hecho, los indicios contextuales mejoraban el reconocimiento en una cantidad equivalente a disminuir la intensidad del ruido en un 50 % de su valor anterior. La información fisica era la misma en ambos casos. Era el contexto el que producía una gran mejoría en la percepción de la señal fisica idéntica.
Veamos lo que sucede cuando se éscucha una palabra sin ningún contexto, como por ejemplo, compró, en la serie calcetines, algunos, compró, húmedos, quién. Suena como un murmullo ininteligible. Quizá se consigue extraer algunas características. Puede que se reconozca el sonido «c» y se observe que la palabra es de dos sílabas. Las dos características son suficientes como para rechazar palabras tales como hospital, Mississipi, cartulina y carretera, pero todavía existe gran número de posibilidades -palabras tales como compró, carne, corcho,
140 PROCESAMlENTO DE lNFORMACION HUMANA
corre, caza, cubre, calma, colgó. Utilizaremos estas ocho palabras como las ocho mejores elecciones posibles. Cualquier suposición en este momento sería correcta una vez de cada ocho, es decir, un 1 2,5%.
Supongamos ahora que la misma palabra está incorporada dentro d
_e _ l� frase, quié� c �lgunos calcetines húmedos, la segunda
con�ic10n del experimento de Miller. El contexto permite reducir considerablemente las posibles alternativas. Lo más probable es que la palabra desconocida sea un verbo, de forma que eliminamos carne Y c�rcho com.� alternativas posibles. Debe tener algún significado plausible. «Qmen corre algunos calcetines húmedos» y «Quién caza algunos calcetines húmedos», son enunciados altamente improbables, de forma que eliminamos corre y caza; lo mismo ocurre co� cub
.r� _Y calma.
, La pal�bra pue�e ser compró o colgó : sólo��s posib1hdades. Solo mediante conjeturas hemos conseguido un
exito probab�e en un 50% ; una gran mejoría sobre el 1 2,5 % queobteruamos sm la ayuda de la información contextual.
La pot�ncia del . contexto es evidente. Se pueden utilizar reglaspara reductr la cantidad de alternativas posibles que deben considerarse en determinado momento. Esto no quiere decir, naturalmente que la percepción necesite una orientación consciente de ensay� Y err?r, para
-�eterminar cuál es la alternativa que mejor se ajusta
a la mformac10n contextual. No sabemos con exactitud cuáles son los mecanismos que utilizan la información contextual, pero sabemos que el contexfo juega un gran papel en nuestras percepciones. El contexto nos proporciona las reglas que fundamentan nuestro mundo perceptivo, diciéndonos lo que podemos esperar y mostrándonos interpretaciones plausibles de lo que estamos percibiendo.
Debemos tener en cuenta que para utilizar la información contextual, la percepción debe retrasar la información que recibe de los sistemas s��soriales. La percepción de la palabra compró no sólo estab� facilitada por palabras que aparecían antes (quién), sino tambien por palabras que aparecían después (calcetines). Este retraso entre la entrada de información sensorial y la interpretación final · de un mensaje, es una parte importante de nuestro análisis perceptivo.· Cuando leemos en voz alta, por ejemplo, los ojos examinan las palabras que . están más adelante de la parte del texto queesta_mos pronunc�ando. Cuando una mecanógrafa experimentada copia un manuscnto, va leyendo el texto siguiente al que está copiando. Nos adelantamos para obtener tanta información contextual c?mo sea posible, antes de ejecutar realmente las respuestas necesanas para la tarea que estamos realizando. Cuanto más sabemos lo que va a venir, más fácil es percibir lo que está ante nosotros.
TEORIAS Dr:;L JlECONOCiMJENTO bE. FORMAS
La importancia de la redundancia
141
La estructura del . lenguaje est� diseñada de forma que complemente la capacidad humana de reunir el significado de una comunicación, a partir de unos pocos fragmentos aislados. El castellanoes muy redundante. Decimos y escribimos mucho más de lo quese necesita para poder entender. Si se omiten muchas palabraspara abreviar el texto, su comprensión no plantea un gran problema.Un sistema para valorar la redundancia del lenguaje consiste enmutilar el texto de una forma sistemática, y pedirle a una per�onaque reconstruya las secciones omitidas. La facilidad con la quepuede realizarse esta tarea, nos proporciona una medida de laredundancia del lenguaje. Asx, poxemxs eximxnax caxa txerxcexalxtrx, y axn sx enxiexde xasxanxe bxen.
Si el lenguaje fuese más eficiente, o s! los humanos fuesenmenos capaces de utilizar información contextual, entonces la comunicación sería un proceso muy penoso y al azar. Tendríamos queatender muy cuidadosamente a cada una de las palabras : una palabraolvidada o una sílaba deformada, y podría perderse o modificarseel significado total de una sentencia. No podríamos descuidarho:; .ni un instante. El más ligero ruido podría cc_:mducir al · desastre. · Por tanto, la redundancia del lenguaje nos permite atender selectivamente a trozos y fragmentos de la comunicación, antiéipar. lo quepuede aparecer y buscar selectivamente las palabras y. las frasesclave, que fundamentan el significado básico del mensaje. Err
.conse
cuencia, podemos relajarnos en la confianza de que se puedendescuidar muchos detalles del habla o la escritura, sin perder elsignificado total.
LA SÍNTESIS DE lJN MENSAJE SENSORlAL
Es mucho más fácil demostrar los efectos del contexto, quedescubrir los mecanismos reales que fundamentan el uso de lainformació!) contextual, en la .interpretación de las señales sensoriales. Desconocemos lo necesario sobre los procesos cognitivos humanos y sobre la estructura de la memoria, de forma que no seha podido conseguir un modelo totalmente adecuado. Sin embargo,podt:mos indicar cómo se ataca el problema, para proporcionaruna orientación general.
Lo que sabemos hasta ahora nos indica, por un lado, quelos sistemas sensoriales responden ante acontecimientos externos
1 42 PROCESAMIENTO DE INFORMACION HUMANA
y transforman el mensaje sensorial en tipos específicos de características. Por otro lado, el sistema de memoria contiene información sobre experiencias pasadas -los datos y teorías necesarias para interpretar las señales sensoriales. De alguna manera, estas dos fuentes de información deben combinarse. La evidencia sensorial debe compararse con la información almacenada, para poder reconocer la señal. Pero el proceso de comparación no puede ser arbitrario. No es posible seleccionar un ítem cualquiera de la memoria y esperar que esté relacionado de alguna manera con la entrada sensorial. Si se eligiesen arbitrariamente los ítems de la memoria, tardaríamos mucho tiempo en identificar aún lós objetos más familiares, como las mesas y las sillas.
Aquí es donde aparecen nuestras consideraciones sobre el contexto. El sistema de memoria no sólo es la clave del reconocimiento, sino que también retiene el conocimiento de los acontecimientos sensoriales que ya han sido interpretados. Esto es lo que se llama expectativa sobre lo que puede ser el siguiente acontecimiento sensorial, apoyándose en lo que ya ha sido percibido. Además, estas expectativas sobre lo que va a llegar, se modifican continuamente a medida que se procesa la señal anterior. Denominamos proceso de síntesis activa a la construcción y revisión de las expectativas durante la interpretación de un mensaje (Figura 3-9).
En el diagrama, la mayor parte del modelo pandemónium que presentamos anteriormente, está incluido en el cuadro de «análisis de características». El demonio de decisión se encuentra ahora en el cuadro de «proceso de síntesis activa», pero en esta ocasión tiene memoria, además de contar con los datos sensoriales. La tarea del proceso de síntesis activa consiste en reunir en un contenido lógico y consistente ambas fuentes de información. De momento, el cuadrado está vacío. Ahora podemos esquematizar lo que se introduce : detenemos el proceso de síntesis en la mitad de la interpretación de un mensaje (Figura 3 - 1 O).
En la Figura 3- 1 0, hemos paralizado la acción en la mitad de la lectura de la sentencia, EL MUCHACHO PREOCUPABA A SU PADRE. El sistema de análisis sensorial está trabajando en la letra R : acaba de encontrar características de dos líneas rectas en el cuadrado de análisis de características. Al mismo tiempo, el sistema de memoria contiene la parte del mensaje que ya se ha interpretado : EL MUCHACHO P . . . . En el medio, entre el análisis sensorial y la memoria, el proceso de síntesis activa está intentando comparar las expectativas con la evidencia sensorial.
Observe las expectativas. La palabra que se está analizando
TEORIAS DEL RECONOCIMIENTO DE FORMAS
Análisis de caracterís·
ticas
activa
FIGURA 3-9
143
actualmente comienza por P .... Supongamos que las palabras posibles que se están considerando son PREGUNTABA, PERDONABA, PREOCUPABA. Vamos a pensar que éstas son las únicas palabras conocidas por el sistema y que son consistentes con la evidencia de los datos. Se están considerando estas palabras porque
1 44 PROCESAMIENTO DE INFORMACION HUMANA
Análisis de
FIG URA 3-1 0
comienzan con P, y son verbos que pueden tener una persona como objeto. Es indudable que el análisis de la palabra tiene una l ista más grande de posibilidades. A medida que continúe la interpretación, se irá modificando continuamente el conjunto de expectativas.
TEORIAS DEL RECONOCIMIENTO DE FORMAS
EL MUCHACHO PREOCUPABA A SU
Proceso de síntesis activa Expectativas videncia
alabras Característica sensorial
1=
FIG U RA 3- 1 1
145
Cuando termina el proceso de síntesis con ese fragmento del mensaje, puede pasar al siguiente fragmento. La información contextual debe decirle que la siguiente parte del mensaje es el objeto del verbo, quizá sea también un término de parentesco, puesto que la sentencia anterior también se centraba sobre Las relaciones del muchacho con su familia. Cuando se continúe con el detallado análisis de las siguientes palabras, se originarán nuevas expectativas y se comprobarán mediante evidencia sensorial (Figura 3-1 l ) .
1 46 PROCESAMIENTO DE INFORMACION HUMANA
Por tanto, tenemos un esquema de reconocimiento de formas que construye y revisa continuamente las expectativas de lo que se está percibiendo, cuando interpreta un mensaje sensorial. No confia exclusivamente ni en sus propios modelos internos ni en la evidencia de sus. sentidos, sino que compara las dos fuentes de información antes de decidir que ha interpretado correctamente la señal de entrada.
Este tipo de sistema de reconocimiento de formas necesita de la capacidad de construir y comprobar las hipótesis simultáneamente a distintos niveles. Las reglas incorporadas en la gramática y el significado del lenguaje conducen a la expectativa de un verbo, a la expectativa de que la información siguiente incluirá un objeto de ese verbo, quizá un modificador, y probablemente a que las palabras tienen algo que v�r con las relaciones familiares del muchacho. Dentro de este contexto general, un pequeño conjunto de palabras específicas se comparan con el contexto y con la evidencia sensorial de lo que ya se ha interpretado. Estas expectativas generan a su vez predicciones sobre la forma específica que se está descifrando actualmente. Tan pronto como los demonios del contorno comiencen a informar, el complejo total de expectativas será comparado simultáneamente, y el sistema podrá trasladarse al siguiente segmento.
Por otro lado, el sistema sensorial debe proporcionar cierta cantidad de distintos niveles de evidencia sensorial. Los datos sensoriales, en función de la longitud y forma general de la palabra, se combinarán con la información contextual para limitar el conjunto de alternativas posibles. La información sobre el tamaño y forma aproximada, y el número de palabras cercanas, probablemente se utiliza para decidir sobre la interpretación siguiente. Además de estas caraderísticas generales, una pequeña parte del mensaje se estará analizando simultáneamente.
La gran virtud de un proceso de síntesis consiste en que permite un muestreo de la información ambiental, de forma que sólo se necesita recoger la cantidad imprescindible de evidencia, para interpretar sin ambigüedad una señal. El proceso de síntesis dirige la atención hacia las partes más pertinentes del mensaje y, dentro del foco de atención, hacia las características más pertinentes de la forma. Se pueden originar hipótesis incorrectas y pueden surgir errores en la predicción de acontecimientos sensoriales, pero tiene muchos mecanismos de seguridad. Supongamos que cuando ya se ha obtenido toda la evidencia, los datos sensoriales fracasan al comparar una de las letras esperadas. El suave desarrollo del procesamiento debe interrumpirse hasta que se pueda solucionar
TEORIAS DEL RECONOCIMIENTO DE FORMAS 1 47
esa ambigüedad. Pero veamos cuále.s son las opciones de un sistema de detectar y corregir errores. Pueden pasarse por alto las letras ; es posible realizar comprobaciones. ¿Se ajustan los datos sensoriales a las actuales expectativas? Si ahora se produce una comparación con éxito, el error previo puede deberse a una entrada deformada o detectada inadecuadamente. Cuando sucede esto es necesariovolver atrás y comprobar de nuevo, para ver si continuamos un rastro equivocado. Puede ocurrir que una palabra esté completamente fuera del contexto, de forma que las limitaciones contextuales tienen que relajarse para permitir que la información sensorial juegue un papel más dominante en la dirección de las interpretaciones. Una palabra que está fuera de contexto en una sentencia puede entenderse, aunque puede provocar que el sistema realice una doble interpretación. Aun palabras que no se han visto nunca pueden analizarse, aunque evidentemente no se encontrará ningún significado para una entrada de este tipo.
LA SECUENCIA DE OPERACIONES
Se han simplificado dos puntos en los ejemplos precedentes. En primer lugar, en la discusión de los efeetos del contexto, se suponía que todas las palabras de la senteneia podrian percibirse claramente salvo la palabra que se está analizando. De esta forma, sugeríamos que las palabras confusas podrían comprenderse por medio de las demás palabras que limitan el conjunto de posibilidades. En el experimento de Miller, descrito anteriormente, las demás palabras también tenían ruido de fondo. ¿Cómo puede un conjunto de palabras percibidas i mperfectamente ayudar a descifrar otro conjunto que tampoco se percibe bien? Un supuesto distinto,
pero relacionado con éste. debe tenerse en cuenta en el ejemplo que acabamos de discutir : el análisis de la palabra PREOCUPABA en la sentencia EL MUCHACHO PREOCL'PABA A SU PADRE. En este caso, la descripción suponía que el análisis de la sentencia se realizaba letra a letra, con la interpretación parcial de la P ... provocando expectativas sobre los siguientes sonidos que pueden presentarse,
Ninguno de estos enuneiados es incorrecto, pero la problemática está simplificada. Lo importante del procedimiento de análisis por síntesis consiste en que es capaz de utilizar cualquier fuente de i nformación sobre la naturaleza de la entrada que se intenta comprender. Si el significado ayuda, se utiliza el significado. Si se tiene que utilizar una letra aislada para terminar la interpretación de una palabra, se analiza la letra. Y si un segmento completo de sonidos � -a veces una palabra entera� - no parece necesario para la comprensión de los acontecimientos sensoriales,
entonces se ignora la totalidad de e�e segmento. Además, el proceso no se realiza necesariamente segmento a segmento, letra a letra. Puede ocurrir de distinta manera, o con varios segmentos al mismo tiempo. Es natural suponer que el análisis se realiza a medida que se reciben las señales sensoriales individuales, pero aunque esto parece conveniente (y así lo hemos hecho en el ejemplo), no parece totalmente necesario.
Observe cómo se puede analizar la secuencia de símbolos que se ofrecen en
1 48 PROCESAMIENTO DE INFORMACION HUMANA
la Figura . 3-12. No se puede identificar ninguna letra aislada. Sin embargo, sila secuencia se presenta en una forma adecuada, incorporada dentro de Ja sentencia de la Figura 3- 13_, entonces no es dificil interpretarla. En la Figura 3- 1 3 tenemos una mancha de
_ tmta que sólo permite ver exactamente los mismos símbolos que
se ven en la Figura 3-12, pero ahora es bastante simple leer Ja sentencia THE WORK MUST GET DONE. Hay que observar que este ejemplo se enfrenta a nuestros dos puntos problemáticos. En primer lugar, la percepción de los segmentos confuws
. de la W parecen ayudarnos a percibir la R, de igual manera que la
percepc10n de las partes confusas de la R nos ayuda a percibir la w. Cada una de las partes de la secuencia de símbolos ayuda a percibir las demás partes. Aun cuando no se pueda ve: claramente ningún segmento aislado, Ja palabra total s� ·lee con bastante fac1)1dad. Por tanto, éste es un ejemplo de una secuencia des1mbolos que no puede analizarse IBtra a letra, sino que debe analizarse como un todo. Además, la percepción de cada parte se ve ayudada por el contexto q�e proporc10nan las otras tres partes -una vez más, aun cuando ninguna parte aislada se perciba con claridad.
\\ V \ \ FIGURA 3- 1 2
THE V'f MUST GET DONE
FIGURA 3- 1 3
CARACTERÍSTICAS VERSUS EXPECTATIVAS
Se utiliz�n. dos cosas _en el análisis de la información perceptiva :
las caractenshcas sensonales y las expectativas. En las experiencias nor�ales, se comparan las características y las expectativas para produc1� una pe�cepción simple y sin ambigüedades. Sin embargo, en determmadas situaciones, se omite una de las fuentes de información de forma que la percepción tiene que interpretarse a partir de la otr� fu�nte. Podemo� repasar algunos ejemplos utilizados en capítulos antenores de este libro. De esta forma, veremos explícitamente la información proporcionada por las características y la ofrecida p�r el contexto Y las expectativas. Presentamos a continuación una fotografia
TEORIAS DEL RECONOCIMIENTO DE FORMAS 1 49
que se puede interpretar fácilmente : se combinan tanto las características como las expectativas.
FIGURA 3- 1 4 Robert Glasheen (fotógrafo), «La Jo/la». Copyright 1966, Glasheen Graphics.
Pero inten,tamos ahora mirar la línea simple del dibujo de la Figura 3- 1 5. Las características están presentes, y casi surgen las expectativas� aunque no lo suficiente. En consecuencia, nuestra percepción de la imagen fluctúa cuando intentamos forzar un conjunto u otro de reglas de interpretación.
Si sólo existen características, sin ninguna expectativa, entonces la percepción total fluctúa radicalmente, siendo incapaz de conseguir una interpretación estable. En la Figura 3- 1 6, están presentes distintas características, pero sin limitar las interpretaciones, de forma que es posible ver la escena como manchas, retículas triangulares, como tubos rectangulares que se extienden en profundidad, o de otras muchas maneras.
Finalmente, recordemos el dibujo del dálmata (Figura 3- 1 7). Aquí no existen características dignas de mencionar, solo interpretaciones. Sin embargo, una vez obtenido el diseño básico del perro, el
1 50
F I G !J RA 3- 1 5
PROCESAMIENTO DE INFORMACION HUMANA
fose/ Albers. «Structural Constellmion» 1953-1958. De Despite
Straight Lines, págs. 63, 79. Cortesía del artista.
TEORIAS DEL RECONOCIMIENTO DE FORMAS
FIG U RA 3- 1 6 De Carraher y Thurston ( 1968) .
1 5 1
proceso d e síntesis compara las manchas blancas y negras del dibujo, de forma que se identifica correcta y perfectamente la imagen del dálmata. Sin el proceso de interpretaCión, este dibuj o es ini nteligible. Mediante el proceso de interpretación, el perro surge con claridad.
Para entender el proceso de reconocimiento qe formas, tenemos que comprender muchos pasos distintos del análisis de la in forma-
1 52 PROCESAMIENTO DE INFORMACION HUMANA
ción. Las formas de energía que inciden sobre los órganos sensoriales, sólo se pueden interpretar como señales significativas a través de la combinación del análisis sensorial, de los procesos de memoria y del pensamiento.
- .
":. .... � . ........... .:. .... · ... -
-,,- . -..
t �
� .�- --
--..
FIGURA 3-1 7 R . C. James (j(11ógrafo). Cortesía delfo1ógrajo.
. ...
...
El análisis por síntesis es un esquema de reconocimiento de formas que realiza la tarea bajo todos los ángulos posibles. Intenta convertir la evidencia sensorial en una interpretación consistente con nuestro conocimiento sobre el mundo. Se está construyendo continuamente, comprobando y revisando hipótesis sobre lo que se percibe. Cuando las predicciones fracasan o se carece de contexto, el análisis actúa lentamente, descansando principalmente en los datos sensoriales. Cuando se actúa en un mundo familiar y con predicciones muy posibles, el análisis se realiza rápida y eficazmente, recogiendo sólo los datos suficientes para confirmar las expectativas y reconstruyendo lo que no se ajusta a las reglas de su modelo interno. Por otro lado, la utilización de un proceso de síntesis activa determina algunas exigencias interesantes sobre la memoria y sobre las funciones cognitivas. Tiene que ser una memoria temporal, para que pueda informar de los resultados del análisis en un momento determinado. También
TEORIAS DEL RECONOCIMIENTO DE FORMAS f53
tiene que poder recuperar c'on rapidez y eficacia la información pertinente, a partir de las estructuras permanentes de la memoria. Debe ser capaz de trabajar con distintos tipos de información a distintos niveles de análisis simultáneamente, para integrar suavemente los procesos sensoriales, cognitivos y de memoria. Es un mecanismo complicado, pero así es el cerebro humano. Se necesita cada fragmento de su wmplejidad para explicar el reconocimiento humano de formas.
LECTURAS RECOMENDADAS
El reconocimiento de formas no está muy extendido en la literatura psicológica, aunque· esto probablemente cambiará en el futuro. Se ha publicado recientemente un libro (Dodwell, 1 970) que tr�t�una gran parte de la problemática cubierta por este capítulo. Qmza sea Neisser el que proporciona el mejor tratamiento existente de los esquemas del patrón y de otros muchos en su libro Cognitive Psychology ( 1 967) y en el artículo del Scientific American sobre «Pattern Recognition by Machine» (Selfridge y Neisser, 1960). También es importante un artículo del Scientific American sobre «Visual Search» ( 1 964) .
El ejemplo de los «calcetines húmedos» proviene del trabajo de Miller, quizá más accesible y mejor interpretado en el lí?rode Norman ( 1 969a), especialmente el Capítulo 3 . Uhr ha reumdo un conjunto de lecturas sobre esta materia ( 1 966), pero la literatura mejor proviene de la ingeniería y de las ciencias d�l compu��dor,y la mayor parte es bastante técnica. Una buena mtroducc10n al material técnico es el libro de Grasselli ( 1 969), del que hemos recogido el ejemplo ofrecido en el Capítulo 1 sobre la detección de bloques interrelacionados (del capítulo de Guzmán). El modelo pandemórrium surge en el trabajo de Selfridge ( 1959). . .
Una magnífica introducción a los problemas del reconoc1m1ento de formas aparece en el libro de Huey The Psychology and Pedagogy of Reading. aun cuando fue escrito en 1908 (reimpreso por MIT Press en 1968). Kolers trata el problema con gran cantidad de discusiones mtly sugestivas, tanto en la introducción a la reimpresión de Huey en M IT Press como en Recognizing Patterns : Studies in Living and Automatic Systems (Kolers y Eden, 1 968).
Se puede encontrar una introducción elemental al análisis del habla en The Speech Chain ( 1 963 : se consigue llamando a la oficina
1 �4 PROCESAMIENTO DE INFORMACION HUMANA
local de la compañía telefónica). Existe· un material
. más avanzado
en la literatura de lingüística y acústicá, pudiendo comenzar porel libro de Chomsky y Halle The Sound Pattern of English ( 1 968)y el artículo de Liberman sobre el habla ( 1970), que proporcionamuchas referencias sobre literatura de análisis por síntesis -tambiénllamada la teoría «motora» de la percepción del habla. Estos escritosconducen a otro tipo de literatura, en la media en que remitena las revistas donde se publican la mayor parte de los trabajos.Norman ( 1 969a) proporciona una introducción fácil a la literaturade análisis por síntesis.
Una buena revisión del reconocimiento automático del lenguajehumano aparece en tres ejemplares del IEEE Spectrum, realizadapor Lindgren ( 1 965). Gran cantidad de trabajos interesantes estánreunidos por Wathen-Dunn ( 1967), a partir de las actas de uncongreso sobre la percepción del habla y sobre la forma visual.En su libro, Models of the Nervous System, Deutsch ( 1967) analizaalgunos de los problemas del reconocimiento de formas.
Un artículo interesante sobre las dificultades de analizar cualquier parte simple del habla, el problema de reconocer la vozdel orador, se puede encontrar en el artículo «ldentification ofa Speaker by Speech Spectográms» (Bolt, Cooper, David, Denes,Pickett y Stevens, 1 969).
4 EL SISTEMA VISUAL
LA LUZ : Decibelios.-LA VÍA ÓPTICA: La pupila.-El cristalino.-Enfoque y Convergencia.-La retina.- - RESPUESTAS QUÍMICAS A LA LUZ : La reacción fotoquímica.-NEUROANATOMÍA DE LA VISIÓN : La retícula retiniana.-EL CAMINO HACIA EL CEREBRO : MUESTREO DE LA INFORMACIÓN VISUAL. -Movimiento del ojo.-El canal de localización.-Visión sin corteza visual.-La visión sin colículo superíor.-LECTURAS RECOMENDADAS. .
La luz se introduce por los ojos y atraviesa distintas partes -la córnea, el humor acuoso, el iris, el cristalino y el' cuerpo vítreo---, hasta que finalmente alcanza la retina. Cada una de las partes realiza una tarea simple, pero parece que cada una tiene defectos. En muchos aspectos, el ojo es un tipo muy especial de instrumento óptico. Desde luego, si un especialista en óptica intentase diseñar un ojo, pretendería evitar algunos de los defectos que se encuentran en el ojo humano : defectos que lo convierten en un instrumento incómodo e imperfecto. Sin embargo, de la misma manera que ocurre con las distintas partes del cuerpo, el ojo termina siendo un instrumento útil, perfectamente adaptado a la función que tiene que realizar, mucho más sensible, flexible y de confianza que cualquier artefacto construido por el hombre.
LA LUZ 1
La luz se describe primariamente mediante su frecuencia e intensidad. La frecuencia de la onda luminosa es el factor primario en la determinación del color (matiz) que se percibe. La intensidad es el factor primario en la determinación del brillo. Las ondas luminosas forman parte del espectro electromagnético.
1 Es conveniente leer la primera sección de «La Medida de Variables psicológicas» (Apéndice A). en el tercer volumen de esta obra, antes de comenzar esta sección.
1 56 PROCESAMIENTO DE INFORMACION HUMANA
Las frecuencias de la parte visible del espectro son menores que las de transmisiones de radio por micro-onda y las de infrarrojo, y son superiores a las de la energía ultravioleta y las de rayos X (ver Figura 4- 1 , en la página 226b). Como las frecuencias de luz son bastante altas, las frecuencias no se formulan directamente (los números fluctúan alrededor de 10 1 5 por segundo 2), sino que se acostumbra a describir la luz mediante su longitud de onda, la distancia que recorre durante el tiempo que necesita para completar un ciclo. La longitud de onda de una luz visible fluctúa entre unos 400 (violeta) y unos 700 (rojo) nanómetros 3 .
La especificación. de las unidades de amplitud, intensidad y energía de luz, siempre resulta un asunto muy engorroso. Como no son importantes en estos momentos esas especificaciones, no utilizaremos unidades fisicas. La diversidad de intensidades de luz que estimulan el ojo es muy grande : la intensidad de luz mayor que puede verse sin dolor, es aproximadamente un millón de billones de veces más intensa que la luz visible más débil (una dispersión de unos 1 016). Para describir esta enorme diversidad de intensidades, es conveniente hablar en potencias de 1 0 al comparar dos luces entre sí . Es decir, describimos la relación entre dos i ntensidades de luz como el logaritmo de la razón de las dos intensidades. Este procedimiento fue utilizado por primera vez por los ingenieros en acústica para la especificación de intensidad del sonido, de forma que la unidad utilizada para especificar el logaritmo de una intensidad con otra, recibió su nombre de Alexander Graham Bel! : el bel. Un bel es una unidad demasiado grande, de forma que las razones de intensidades se expresan normalmente en décimas de bel : decibelios ( dB). El número de decibelios que separan dos intensidades de luz 1 y 10 se determina por l O log (1/10) .
2 Un ciclo por segundo recibe e l nombre d e un hertz (en abreviatura. Hz). La unidad se denominó así por el flsico alemán Heinrich R. Hertz (1857- 1 894), quién consiguió producir y estudiar las ondas electromagnéticas. Utilizaremos con frecuencia el hertz en el Capítulo 6, donde estudiamos el sistema auditivo.
3 Un nanómetro (nm) es la billonésima parte de un metro ( 1 0 �9 metro). Algunas veces, en libros antiguos, la longitud de onda se especificaba en mi/imicras (m µ ). angstroms ( A ), o hasta pulgadas. Un nanómetro es igual a una mílímicra. 1 0 unidades angstroms o 40 x 1 0 9 pulgadas.
EL SISTEMA VISUAL 1 57
TABLA 4- I A
Intensidad Correlato fisiológico (dB)
200 1 80 1 60 Umbral del dolor 140 Sol 1 20 100 80 Papel blanco con luz de lectura 60 Pantalla de TV 40 Luz baja para visión del color 20 Umbral de la visión de un ojo' o Adaptado a la oscuridad
TABLA 4- 1 8
Longitud de la onda Correlato fisiológico
400 violeta 450 azul 500 verde 550 amarillo-verde 600 naranja 650
700 rojo
DECIBELIOS
l . Al duplicar (o dividir por dos) la razón de intensidades de señal, sumar (o restar) 3 dB.
2. Al multiplicar (o dividir) la razón de intensidaues de señal por 1 0, sumar (o restar) 10 dB.
3. Si dos luces se diferencian en 10 dB, su razón de intensidades es 1 0°. Por ejemplo, una diferencia de 60 dB en las intensidades de dos luces, significa que una luz es 106 (1 míllón) veces más intensa que la otra.
4. Puesto que los decibelios hacen referencia a la razón de dos intensidades, decir que una señal tiene un nivel de 65 dB, carece por completo de significado a no ser que se conozca el nivel de comparación. En general, cuando aparece un enunciado de esta forma, significa que la señal es 65 dB más intensa que el nivel de referencia ti pico : 10-10 lamberts es el número que se utiliza en este libro como típico. Este nivel es una intensidad muy baja de luz. Aproximadamente, es la intensidad mínima de luz que puede detectar un observador humano.
1 58 PROCESAMIENTO DE INFORMACION HUMANA
Decibelios
Número de dB= 10 log(l/!0) !/lo dB !/lo dB
0,000 1 -40 10000,0 40
0,001 -30 10000,0 30
0,01 0 -20 1 00,0 20
0,032 -1 5 3 1 ,6 1 5 0,1 0 - 1 0 1 0,0 1 0 0, 1 3 - 9 7,9 9
0, 1 6 8 6,3 8
0,20 · - 7 5,0 7
0,25 6 2,0 6
0,32 5 3,2 5 0;40 4 2,5 4
0,50 - 3 2,0 3
0,63 - 2 1 ,6 2 0,79 - 1 1 ,3 1 1 ,00 o 1 ,0 o
La vía óptica
Cuando la luz incide sobre el ojo, se encuentra en primer lugar con la ventana protector.a externa, la córnea (ver Figura 4-2). La mayor parte del enfoque de la imagen se consigue realmente mediante la inflexión de luz sobre la superficie de la córnea. A continuación,la luz atraviesa una Sl:lstancia viscosa, el humor acuoso ; después traspasa la ventana del iris (la pupila) .
La pupila
En principio, la pupila controla la cantidad de luz que se introduce por el ojo. Se contrae en situaciones de mucha claridad (para proteger el ojo del exceso de luz) y se distiende cuando hay oscuridad (para permitir toda la entrada de luz que se pueda). Pero tengamos en cuenta estq : la máxima intensidad de luz que se detecta sin dolor es muchos billones más intensa que la luz más débil detectable. Dado este amplio rango de intensidades, los cambios en el tamaño de la pupila producen muy poca diferencia. La amplitud máxima de la pupila tiene alrededor de 7 u 8 milímetros (mm) de diámetro ; la mínima tie-
EL SISTEMA VISUAL 1 59
ne unos 2 o 3 mm. No es muy grande el cambio total del área. En su contracción máxima, la pupila permite pasar 1 / 1 6 de cantidad de luz en comparación con su dilatación máxima. Los cambios en el tamaño de la pupila sólo reducen las intensidades de las señales que atraviesan el ojo en un factor de 1 6 (o unos 1 2 dB). En consecuencia, no se reduce gran cosa el rango de intensidades a las que está expuesto el ojo. Una amplitud de 1 0 billones a l ( 1 00 dB) quedan reducidos a un rango de 0,6 billones a 1 (88 dB) : algo insuficiente para producir una gran diferencia.
Hu mor vi treo
F IG U RA 4-2
Los ajustes de la pupila no son muy rápidos. Cuando se producen de la oscuridad a la luz, la pupila tarda unos 5 seg en contraerse plenamente, y unos 1 ,5 seg en contraerse a 2/3 de su tamaño mínimo. Cuando se produce de la luz a la oscuridad, tarda unos to seg en di-
160 PROCESAMIENTO DE INFORMACION HUMANA
!atarse a 2/3 de la cantidad máxima y unos 5 mín. en dilatarse porcompleto. Claramente, la pupila no controla la intensidad de luz. Su función primaria debe ser limitar la luz en las regiones centrales del cristalino, donde el enfoque es más preciso. También ayuda a mantener una buena profundidad en el campo, manteniendo el diámetro tan pequeño como pueda bajo una determinada condición de luminosidad. La pupila ajusta su tamaño para mantener un equilibrio entre la agudeza del foco (que fuerza la contracción al máximo) y el paso suficiente de luz a la retina (que fuerza la dilatación al máximo).
Además de responder a los cambios de intensidad de luz, el tamaño de la pupila parece que registra los estados del sistema nervioso. En consecuencia, el tamaño cambia mediante factores emocionales y hasta con el pensamiento y la resolución de problemas. Se han realizado algunas medidas del tamaño de la pupila como una forma de registrar el progreso de una persona durante el intento de solucionar problemas dificiles y también para sus respuestas emocionales.
El cristalino
El cristalino es el siguiente paso que recorre la luz. La función primaria del cristalino consiste, naturalmente, en enfocar la luz que llega desde un objeto sobre los receptores sensibles a la luz en el fondo del ojo. Sin embargo, en términos de ejecución, los cristalinos biológicos no son de muy buena calidad.
El cristalino está compuesto de muchas capas finas de tejido, de una forma parecida a la piel de una cebolla. Consigue el enfoque incrementando y disminuyendo su espesor (es decir, cambiando su longitud focal). Esto se consigue encerrando el cristalino en una membrana, ligada a los músculos de control focal. El cristalino produce un gran número de distorsiones. La luz que incide en los bordes no está centrada en el mismo plano que la luz que incide en el centro del cristalino, produciendo una distorsión llamada aberración esf érica. Las luces de distintos colores se enfocan de diferente manera, produciendo una distorsión llamada aberración cromática.
Además de estos problemas, el cristalino está continuamente muriendo, como resultado de la naturaleza de su estructura. Todas las células vivas necesitan un suministro continuo de sustancias nutriti�
vas, que son transportadas normalmente por la corriente sanguínea. Pero evidentemente no es deseable tener vasos sanguíneos recorriendo el cristalino, puesto que perjudicaría seriamente su calidad óptica. Por tanto, para su nutrición, el cristalino se apoya en líquidos cerca-
EL SISTAMA VISUAL 16 1
nos, una solución que no es muy buena. Las capas internas del cristalino tienen dificultad para conseguir alimento adecuado, y durante el tiempo de vida del organismo mueren gradualmente. Cuando el organismo envejece, estas células muertas perjudican el funcionamiento del cristalino, y en particular, el enfoque.
Enfoque y Convergencia. Para conseguir la sensación del enfoque, ponga un lápiz ante sus ojos con los brazos extendidos y fijese en él. Después acérquelo lentamente en línea recta, manteniendo el enfoque de sus ojos. Cuando el lápiz está a unos cuantos centímetros de sus ojos, observe cómo la imagen se pone borrosa y produce una «impresión>> distinta. A medida que el lápiz se mueve, ocurren dos cosas. Un conjunto de músculos oculares ajusta continuamente la orientación de los ojos, para mantenerlos en posición (en convergencia) sobre el objeto que se aproxima. Un segundo conjunto de músculos incrementa continuamente el espesor del cristalino, dirigiendo así los rayos de luz para mantener el enfoque adecuado sobre el plano retiniano en el fondo del ojo (Figura 4-3).
Cristalinos gruesos y ángulo de convergencia grande, cuando el objeto está cerca
Cristalinos más delgados y ángulo de convergencia menor, cuando el objeto está más lejos.
Cristalinos muy pequeños y ángulo de convergencia insignificante. cuando el objeto está muy lejano
a;----a---
F IG U RA 4-3
1 62 PROCESAMIENTO DE INFORMACION HUMANA
Cuando el lápiz se aleja de los ojos, ambos conjuntos de músculos se relajan, el cristalino regresa a su forma normal alargada, y los dos ojos miran al frente. Mediante esta acción muscular, el cristalino de una persona joven es capaz de enfocar objetos desde muy cerca hasta tan lejanos como las estrellas. Sin embargo, con la edad, la capacidad para incrementar el espesor del cristalino se reduc� tanto, que con frecuencia es necesario utilizar lentes externos (gafas) para enfocar objetos cercanos.
Otra forma de sentir la acción muscular, consiste en poner un dedo delante de los ojos a una distancia de unos 1 5 cm. Después, sinmover el dedo, concentrándose primero en el dedo y luego sobre cualquier objeto que esté más lejos que el dedo (a ser posible, en la misma línea). Así se puede dar cuenta de la diferencia entre cambiar el enfoque de lejos a cerca (una contracción y acomodación activa de los músculos de enfoque), y cambiarlo de cerca a lejos (una relajación pasiva de los músculos).
El cristaliI}o humano modifica el enfoque cambiando su espesor ; en términos ópticos, es una lente de longitud focal variable. En las cámaras fotográficas y otros instrumentos artificiales y, adewás, en ciertas especies animales como los peces, el enfoque se consigue normalmente manteniendo la lente o cristalino fijo y cambiando la distancia entre el cristalino y los elementos sensibles a la luz.
Una de las actividades del ojo sin resolver todavía es la forma en que mantiene la distancia focal. Al igual que no se conoce cómo se registra un objeto mediante un enfoque sostenido. Se sospecha que el sistema de enfoque intenta mantener una agudeza máxima, provocando el máximo contraste en la imagen. Las células neurales que son sensibles a los contornos (detectores de bordes, de aberturas y de líneas) tienen su respuesta máxima en las imágeu.es enfocadas de una manera atenta. Aunque el enfoque típico se realiza automática e inconscientemente es posible modificar la distancia focal conscientemente. También ºes posible desenfocar los ojos de forma que no se vea claramente n ingún objeto. Este control consciente no podría ejercerse si el mecanismo de control fuese completamente automático e independiente de los centros cerebrales superiores.
La retina
Finalmente, después de atravesar el cristalino y la sustancia viscosa que rellena la p�rte interior del ojo (humor vitre o) , la luz llega a la retina, la parte del ojo responsable de convertir las imágenes lumi-
EL SISTEMA VISUAL 1 63
nosas en respuestas fisiológicas. Pero también aquí existen obstáculos para la luz. La retina está en el fondo del globo ocular, extendiéndose sobre la superficie interna. Los elementos sensibles a la luz están colocados en una dirección equivocada : apuntan hacia el interior, hacia el cerebro, en lugar de hacerlo hacia el exterior, hacia la luz (ver Figura 4-4). En consecuencia, las fibras nerviosas conectadas a lo
.s recep
tores de luz aparecen como un tejido enredado directamente en el camino de la \uz de entrada. Además, estas fibras están en el interior del ojo, de forma que para salir necesitan una abertura en la superficie. Esto produce un punto ciego en cada ojo.
FIG U RA 4-4
1 64 PROCESAMIENTO DE INFORMACION HUMANA
RlisPUEST AS QUÍMICAS A LA LUZ
Una de las primeras y más dramáticas demostraciones de la res
puesta fotoquímica del ojo a la luz, fue la creación de un «optigra
ma». Se encierra un animal, por ejemplo una rana, completamente
sin luz durante varias horas. Después se ilumina brevemente el lugar
mediante una luz intensa. A continuación, se sacrifica la rana y se
separan sus retinas para colocarlas en una solución química. Pasado
cierto tiempo, se puede observar el resultado de la reacción fotoquí
mica a la luz sobre las células : el ambiente visual estaba pintado de
fuerte amarillo y de rojo la retina de la rana. Esta técnica ha cautiva
do la imaginación de algunos novelistas, que escribieron sobre asesi
nos identificados a partir de los optigramas de los ojos de sus vícti
mas. - Los procesos fotoquímicos son los responsables de la respuesta
inicial del ojo a una señal visual. Cuando la retina no ha sido expuesta a la luz, es de color rojo-púrpura. Este color característico determina su nombre : púrpura visual. Al responder a la luz, la retina cambia de color, desde el roj o-púrpura hasta el amarillo pálido y, finalmente, se convierte en transparente y descolorida.
Los pájaros nocturnos y los animales tienden a tener concentraciones relativamente altas de púrpura visual, lo que quizá explica su magnífica visión nocturna. Los reptiles, los pájaros diurnos y varias especies de peces tienen sustancias fotoquímicas que palidecen en presencia de la luz, pero son algo distintas del púrpura visual en su sensibilidad a las luces de distintos colores. El método básico para describir estas reacciones químicas consiste en determinar cuánta decoloración se produce ante luces que tienen una intensidad constante pero con distintas longitudes de onda. El conjunto resultante de medidas se llama espectro de absorción de la sustancia fotoquímica.
La reacción fotoquímica
Actualmente se conoce bastante bien la reacc10n fotoquímica
exacta del ojo. Cuando no está presenta ninguna luz, existe una alta
concentración de rodopsina (el nombre químico de la púrpura visual).
Cuando aparece una luz, se produce una sucesión de cambios, termi
nando finalmente con una sustancia llamada retinene, que termina re
ducida a vitamina A. La retinene es la que proporciona el color ama
rillo del pigmento parcialmente descolorido. El predominio de vita
mina A, después de una exposición prolongada a la luz, produce la
EL SISTEMA VISUAL 1 65
aparición de falta de color de la retina, completamente descolorida. Parece lógico pensar que tienen que existir algunos mecanismos
para producir o regenerar los materiales fotosensitivos del ojo. La regeneración parece que se desarrolla mediante dos reacciones químicas distintas. Una proporciona una restauración relativamente rápida de los niveles de rodopsina, volviendo a combinar los productos parcialmente descoloridos de retinene y opsina para producir rodopsina. El segundo proceso, mucho más lento, produce rodopsina a partir de los productos completamente descoloridos, tales como la vitamina A4•
Las reacciones químicas juegan un papel en la determinación de las características generales de la sensibilidad visual. Desgraciadamente, parece que no existe una relación simple entre la sensibilidad visual y las reacciones fotoquímicas de los receptores de la retina. En condiciones luminosas normales, solo palidece un porcentaje muy pequeño de rodopsina. Además, la decoloración de sólo el 2 % de la concentración de rodopsina puede cambiar la sensibilidad en unas cincuenta veces.
A pesar de un esfuerzo considerable, no se ha descubierto todavía la naturaleza exacta de la relación entre la respuesta fotoquímica y la iniciación de los impulsos eléctricos en la fibras nerviosas. No se ha encontrado respuesta al problema del cómo las reacciones químicas generan los impulsos nerviosos que conducen la señal visual hasta el cerebro.
NEUROANATOMÍA DE LA VISIÓN
La retina no es una superficie continua de material sensible a la luz. Está compuesta de un gran número de elementos indivuales sensibles a la luz, o receptores, produciendo cada elemento una respuesta independiente ante la energía luminosa que incide sobre él. En los animales, como el mono y el hombre, existen dos tipos distintos de elementos sensibles a la luz, llamados bastones y conos (Figura 4-5).
4 El papel de la vitamina A en el- proceso fotoquímíeo conduce a la creencia de que comer zanahorias (ricas en vitamina A) es bueno para los ojos. En la II Guerra Mundial, durante la batalla de I nglaterra. corrieron rumores de que los aviadores británicos estaban tomando extractos vitamínicos especiales, para dotarles de una magnífica visión nocturna. El rumor fue estimulado como parte de un plan para encubrir Ja invención del radar.
De hecho, un exceso de vitamina A superior a la pequeña cantidad necesaria diariamente por el cuerpo, no tiene ninguna utilidad. Se puede decir con toda 'seguridad que no mejora la visión.
1 66 PROCESAMIENTO DE INFORMACION HUMANA
Otros animales tienen uno sólo de los dos, pero no ambos. Las palomas sólo tienen conos, mientras que la retina del gato está cubierta principalmente por bastones.
Al margen de la anatomía característica que facilita su identificación, los bastones y los conos tienen unas diferencias funcionales definidas. Son realmente dos sistemas visuales qµe funcionan dentro del mismo ojo. Cada sistema tiene su propia característica especial de respuesta. La púrpura visual, la rodopsina, sólo se encuentra en los extremos de los bastones - no en los conos. Los conos contienen una gran variedad de sustancias fotoquímicas necesarias para la visión del color. Un bastón es casi 500 veces más sensible a la luz que un cono, pero no proporciona ninguna información del color. Además de estas diferencias funcionales, también existen diferencias en la organización neural que transfiere la información de los dos sistemas, desde la retina hasta el cerebro.
En el hombre, cada ojo tiene aproximadamente unos 6 millones de conos y unos 1 20 millones de bastones : alrededor de 1 25 millones de receptores en total. Esto significa una densidad extraordinariamente rica de células receptoras. La imagen de una pantalla de televisión, por ejemplo, sólo tiene unos 250.000 elementos independientes. En general. la densidad de colocación de elementos sensibles a la luz es superior en el centro del ojo y disminuye en las regiones periféricas (Figura 4-6).
La distribución de los receptores es distinta para los bastones y para los conos. Los bastones aparecen más en la periferia, los conos en el centro. En el mismo centro del ojo, existe una pequeña región deprimida sin ningún bastón, sólo con conos. Esta región, llamada fóvea, tiene una alta densidad de receptores �aproximadamente unos 1 50.000 conos por milímetro cuadrado. Está perfectamente situada, de forma que recibe las partes centrales de la imagen alrededordel punto en el que el ojo está fijado. La fóvea también es la regiónde máxima agudeza. Aunque la mayor parte de los elementos receptores no están directamente conectados con el cerebro, los elementos individuales de la fóvea acostumbran a tener su propia línea privada de comunicación con los centros cerebrales superiores 5 .
Por tanto, los dos ojos recogen información del ambiente visual, con un total de cerca de 250 millones de receptores individuales, y
5 La mayoría de las personas t ienen dificultad en recordar qué es lo que hace cada
célula- - bastones o conos. Se puede recordar de esta manera. La fóvea en la parte central del campo visual : la fóvea es el foco de la atención. Es el punto donde se pueden
ver cosas en color. Los conos, en el centro del ojo. son sensibles al color. Los bastones
están en la periferia - -hacia los bordes.
EL SISTEMA VISUAL 1 67
envían la información al éerebro mediante casi 1 ,6 millones de fibras nervkisas. Los dos tipos distintos de sistemas receptores se complementan entre sí. El sistema de conos es un sistema muy específico, capaz de enviar información del color, pero su sensibilidad es limitada. El sistema de bastones es muy sensible a la luz, pero su especificidad es limitada y además es insensible al color. Al trabajar juntos, los dos sistemas proporcionan Un sistema extraordinariamente flexible y poderoso para transportar las reacciones visuales de las señales de luz que aparecen en el ambiente.
Dirección de la luz de incidencia
¡ l l
r
Cono periférico
Cono fóvíco Bastón
FIGURA 4-5
De Cornsweet ( 1 970) : de Greeff
(1900).
Eje visual
De Pirenne ( 1967).
FI G U RA 4-6
180,000 ,..--------,,-----,.-----------,
160,000
140,000
1 20,0-00
100,000
80,000
60,000
40,000
10,00-0 Conos
Bastones
Conos o r:::::::i=::r:::::::r:=r:::::r::'.'.I_J¡�r::t_.n::::::r::::r::::r:��:::::::l
10" 60" 50"' 40" 30º 20° 1 0" o� wº 20" 3oQ ""º� 5oº GOº 1 0" so"
Angulo (grados)
1 68 PROCESAMIENTO DE INFORMACION HUMANA
La retícula retiniana
En la misma retina, las respuestas neurológicas de los receptores comienzan a recorrer las etapas iniciales del procesamiento. En el Capítulo 2, estudiamos algunas operaciones que se desarrollan en la retícula retiniana. Desde un punto de vista anatómico, se pueden especificar dos tipos de organizaciones del camino neural : una organización vertical, que conduce la señal desde los receptores hacia el cerebro, y una organización horizontal, que es responsable de las distintas interacciones entre las células receptoras cercanas (Figuras 4-7 y 4-8).
En el camino de la señal desde los bastones y los conos hasta el cerebro, se emplean distintos tipos de células neurales. Las señales viajan verticalmente desde los receptores a través de dos sinapsis, la primera entre el receptor mismo y una célula bipolar, y después entre la célula bipolar y una célula ganglionar. Los axones de las células ganglionares forman el nervio óptico que sale del ojo. Al mismo tiempo, el análisis de las señales se· realiza por medio de la organización horizontal de la retina, principalmente por medio de células llamadas, con bastante acierto, células horizontales. Estas células horizontales realizan conexiones entre los receptores mismos, modificando la actividad en la unión entre los receptores y las células bipolares. Además, existe un segundo nivel de procesamiento horizontal realizado por las células amacrinas, a una nivel ligeramente superior. Las células amacrinas modifican la actividad en la unión de las células bipolares con las células ganglionares. Estos dos estratos de conexiones horizontales constituyen la base anatómica de los circuitos neurales de la retícula retiniana.
La densidad de las interconexiones varía en las distintas partes de la retina. En la periferia, una sola célula ganglionar puede recibir información de miles de bastones. En la región central de la fovea de la retina, un solo cono puede estar conectado directamente, a través de una célula bipolar, con una célula ganglionar, sin ningún tipo de interacción con las unidades cercanas. Las conexiones directas de este tipo se realizan normalmente por medio de células más pequeñas, células bipolares enanas y células ganglionares enanas. Normalmente, una célula ganglionar determinada sólo está conectada a bastones o conos, aunque se han encontrado algunas excepciones a este regla.
EL CAMINO HACIA EL CEREBRO
Cada célula ganglionar de la retina contribuye en una fibra al nervio óptico. Todas juntas, el número de fibras es de unas 800.000, fer-
h1pnlares , , 1 1 1 1 .H.:rinas
• ·r1 11 las { t clulas h1H·11onta lcs{ ' . 1p<1 . /{ . J 1 1 : 1 ptlca
1 1 'l L'PI ores
FI G l I R A 4-7
EL SISTEMA VISUAL
Luz
Fibras del nervio óptico
Células ganglionares
1 69
Capa Tejido - sináptica nervioso
interior
Esclcróríca
Corle lransrcrsal del Ji111do de la retina humana. Ampliación
aproximada x 150. De Po/yak ( 1957).
1 70
Fibras del nervio óptico
Células ganglionares
Capa sináptica interna
Células amacrinas Células bipolares Células horizontales
Capa sináptica externa
Núcleos rece pro res
Capa de receptores pigmentado> (células epiteliales)
PROCESAMIENTO DE INFORMACION HUMANA\ \ 1 1 1 r¡¡
F I G U RA 4-8 De Cornsweet ( 1970) .
mando un cable del grueso de un lápiz. En los humanos Y �n los �amíferos superiores, las fibras neurales que sal�n de c�da OJO atraviesan un lugar llamado quiasma óptico. �El qmasma tiene una f�r��semejante a la letra griega (chi), y de aht su nomb:e). !º?as �as fibrasde la mitad izquierda de cada retina van al hem1sfeno iz
.qu1erdo del
cerebro ; todas las fibras de la mitad derecha de cada retma se agrupan y se dirigen al hemisferio derecho del cerebro.
HL SISTEMA VISUAL 17 1 No existe ninguna interrupción de las fibras nerviosas en e l quias
ma óptico : no realiza ninguna unión sináptica nueva. Como muestran las Figuras 4-9, 4-lO y 4-1 1 , esta reagrupación del quiasma v_ptico divide la escena visual en dos mitades. Las partes de la mitad izquierda de la fóvea en la escena visual, terminan en la mitad derecha del cerebro ; cualquier cosa a la derecha del punto de fijación, termina en la mitad izquierda del cerebro. (El cristalino invierte la imagen visual : de esta forma, un objeto a la izquierda se centra en la mitad derecha de la retina y, en consecuencia, las señales neurales de esta parte de la imagen son enviadas al hemisferio derecho del cerebro).
MUESTREO DE LA INFORMACIÓN VISUAL
La atención primaria del procesamiento de la imagen visual se concentra en la parte central del campo visual, especialmente en la parte que incide sobre la fóvea. En la corteza visual, parece que más del 50% de las neuronas se interesan en el análisis del 1 0% central del campo visual.
La periferia del ojo es más sensible a la luz que el centro, pero no es tan sensible a los pequeños detalles de la escena o a la información del color, como ocurre en la fóvea.
El esquema de organización de la retina tiene algunas ventajas evidentes. Pero, como sólo se analiza con detalle una pequeña parte de la escena visual, el sistema de reconocimiento de formas debe utilizar algún procedimiento para orientar el ojo hacia partes específicas del campo visual.
Movimientos del ojo
Los ojos se mueven con frecuencia, recogiendo sucesivamente muestras de las distintas regiones de la escena. La forma de los movimientos del ojo está compuesta de una serie de saltos bruscos o sacudidas de una parte a otra de la escena. Esto ocurre unas cuatro o cinvo veces por segundo. Este movimiento brusco es el resultado de aplicar el máximo de fuerza a los músculos extraoculares (a seis de ellos), produciendo un cambio brusco de alta velocidad en la posición del OJ O.
En los humanos, el ojo no se mueve más de unas cuatro o cinco veces por segundo. Además, una vez que ha comenzado el movimiento del ojo, se dirige hacia una determinada meta sin ningún tipo de
1 72
• Punto ciego para el ojo izquierdo
PROCESAMIENTO DE INFORMACION HUMANA
1 Punto de fijación
@/ 1 \ 11 Este área llenará por
completo la fóvea. a unos 20 cm. de distancia
• Punto ciego el ojo derecho
Cualquier cosa vi
Cualquier cosa vista a este lado va al lado derecho de la retina y a la mitad derecha del cerebr?
a este lado va al ·
lado izquierdo de retina y a la mil
"
izquierda del ceieb
l.32cm.
FIGURA 4-9
Instrucciones : Cierre su oio derecho. Mantenga la página a unos 20 cms. (ver escala a la izquierda). Mantenga la página muy recta, sin inclinarla. Mire constantemente el punto de fijación. Ajuste el ángulo y la distancia del papel hasta que desaparezca el punto ciego del ()jo izquierdo.
• Abra su 'ojo derecho �reaparece el punto ciego (continúe mirando el punto de f¡jaciónj .
• Cierre e l ojo izquierdo �-desaparecerá e l punto ciego del ojo derecho (quizá se vea obligado a ajustar de nuevo el papel).
• Cuando encuentre el punto ciego, empuje un lápiz hacia él a lo largo del papel. Verá como desaparece el extremo del lápiz. (No se olvide de mantener cerrado un <y'o ).
EL SISTEMA VISUAL
Corteza visual
FIGURA 4- 1 0
1 73
Núcleo geniculado lateral
Radiaciones ópticas
corrección- el movimiento es balístico. No es como el lento movimiento del brazo al recoger un lápiz, donde el movimiento se �stá corrigiendo continuamente para asegurar que el brazo llega a su blanco.Por el contrario, es como el lanzamiento de un balón : una vez queel balón ha salido del brazo, no se
· puede hacer nada para alterar su
camino. El mecanismo neural utilizado para el cálculo y control de la posi
ción del ojo todavía no se ha estudiado con detalle : las etapas finalesde la cadena de sucesos que dirigen los movimientos del ojo, pareceque están asociados con las regiones anteriores de la corteza- elcampo frontal del ojo. La estimulación por electrodos de estas regiones inicia movimientos bruscos, dependiendo la dirección y extensióndel movimiento de la localización particular del electrodo. En general, la estimulación del hemisferio izquierdo inicia movimientos bruscos hacia la derecha y la estimulación del hemisferio derecho producesacudidas hacia la izquierda. Cuando se estimulan simultáneamenteambos hemisferios, se produce un resultado de compromiso : la dirección y extensión de los movimientos dependen de la intensidad relativa de la estimulación de los dos hemisferios.
Pero se desconocen los mecanismos responsables del cálculode la dirección y extensión del movimiento durante el análisis dela imagen visual. Algunos movimientos parece que son relativamenteautomáticos. Un movimiento en las partes periféricas del campovisual, por ejemplo, produce con frecuencia el disparo de un moví-
1 74 PROCESAMIENTO DE INFORMACION HUMANA
F I G U RA 4- 1 1
EL SISTEMA VISUAL 1 75
miento involuntario dirigido hacia la fuente del movimiento. Sin embargo, la mayor parte de los movimientos del ojo parece que reflejan un muestreo sistemático de la información ambiental, basado en una interpretación significativa de los datos sensoriales de entrada. Los movimientos también ocurren durante el sueño. Por espacio de muchos años, los movimientos bruscos del ojo han constituido el principal índice de los períodos de ensoñación (sueño con movimientos rápidos del ojo) en el estudio del sueño.
El canal de localización
Aunque todavía no se comprende bien cómo se calcula la localización de objetos en la imagen visual, estudios recientes sugieren que debe realizarse por medio de un canal neural distinto del implicado en el reconocimiento normal de formas. Esto era de esperar. Normalmente, las operaciones asociadas con la localización de un objeto en el ambiente y las implicadas en reconocerlo, se coordinan fácilmente. Pero un análisis dirigido a determinar dónde están las cosas es, en alguna medida, incompatible con un análisis para determinar qué son las cosas.
Para identificar un objeto en la imagen visual -una persona o una silla-, no es importante la orientación exacta, la distanciao su localización en el campo visual. Teóricamente, el sistemade reconocimiento de formas ignora todas estas propiedades y se concentra sólo en las características que son importantes para identificar el objeto como una silla (o una persona). Sin embargo, para localizar un objeto, la identificación de los objetos no es importante. Los únicos datos relevantes son la posición y la orientación.
¿Existen dos canales neurales independientes, implicados en estos dos tipos distintos de análisis ? La anatomía del sistema visual sugiere que debe ser así. Un conjunto de fibras nerviosas, que van desde el ojo hasta el cerebro, se apartan de las vecinas y, en lugar de ir al núcleo geniculado lateral junto con el resto, terminan en un centro cerebral llamado colículo superior (Figuras 4- 1 2a y b).
Al igual que el geniculado lateral y la corteza visual, las fibras que salen de las regiones cercanas a la retina, terminan en las regiones cercanas al colículo superior. Es decir, se conserva la organización espacial de la retina. Sin embargo, a diferencia de la corteza visual, la región de la fóvea ocular no parece recibir ningún tratamiento especial. Las fibras que salen del colículo parecen estar conectadas al sistema de control motor de los movimientos del ojo, orientación
1 76 PROCESAMIENTO DE INFORMACION HUMANA
de la cabeza y ajuste de posturas. Finalmente, existe alguna evidencia de que existen entradas en esta estructura colicular desde las áreas receptoras visuales de la corteza.
Corteza visual
FIGURA 4- 1 2a
Núcleos que
controlan los movimientos oculares
La organización anatómica de esta vía colicular, la convierte en un candidato ideal para un canal neural específicamente interesado en la localización de objetos en el ambiente. Pero la evidencia es más sugestiva que anatómica. Cuando se activan las neuronas de este canal mediante electrodos en un animal despierto, se producen algunos movimientos de cabeza y ajuste de postura. Cuando se estimulan las neuronas asociadas con una parte determinada del campo visual, el animal se orienta en la dirección adecuada, dirigiéndose hacia el lugar donde debería estar el objeto, como
EL SISTEMA VISUAL 1 77
FIGURA 4- 1 2b
si la actividad se hubiese producido mediante condiciones visuales normales 6 .
Consideremos en primer lugar los resultados obtenidos al alterar el canal que se supone que está fundamentalmente implicado en el reconocimiento de formas.
6 Algunos estudios muy recientes sugieren que el colículo combina información tanto del movimiento como de la localización. Además, se han descubierto algunas células sensibles a la estimulación auditiva en el colículo visual. Tiene sentido que en un centro de localización se combine información sobre la posición, a partir de todas las modalidades sensoriales. La información sobre el movimiento está estrechamente relacionada con la información sobre la localización, de forma que el colículo parece ser un lugar razonable para combinar el análisis.
1 78 PROCESAMIENTO DE INFORMACION HUMANA
Vision sin corteza visual
El canal neural asociado con el reconocimiento de formas, se puede alterar eliminando quirúrgicamente la corteza visual (ablación cortical) . En los gatos y los monos, la ablación de la corteza visual parece producir en principio una ceguera total. Los animales muestran una incapacidad total para ver los objetos del medio ambiente, para desarrollar una coordinación normal viso-motora, o para aprender cualquier tarea que necesite una discriminaciónentre señales visuales. Sin embargo, una comprobación cuidadosa demuestra la existencia de algunos residuos de capacidad visual. El animal sin corteza visual puede aprender a realizar algunas discriminaciones, apoyándose en el brillo y quizá en el tamaño.
Recientemente, se ha demostrado que los monos sin corteza visual tienen también cierto éxito en la localización de objetos. Parece que lo más importante son los movimientos. Cuando el experimentador coge un alimento apetecible, como por ejemplo una nuez, al principio el mono no parece observarlo, pero si el experimentador mueve su mano, el mono se dirige hacia la direccción adecuada. Sin embargo, comete errores en la estimación de profundidad. El animal nunca es capaz de aprender tareas que obliguen a una discriminación entre formas visuales.
Parece que es posible algún grado de localización, cuando se altera el canal que transporta la información sobre la forma. Puesto que la operación no interfiere con el colículo superior, se sospecha que este canal neural manipula información sobre la posición. Para demostrar esta información, se puede alterar el canal colicular y comprobar la capacidad de localización del animal. Si los dos canales funcionan independientemente, entonces el reconocimiento de formas permanecerá intacto y la localización será gravemente perjudicada.
Visión sin coliculo superior
El animal experimental es en este caso el hamster, cuyos canales colicular y cortical están particularmente bien separados, convirtiéndolo en muy útil para cirugía. Cuando se destruye la estructura colicular, el hamster pierde toda la capacidad de localización. Cuando se le ofrece alimento (como por ejemplo, semillas de girasol), es incapaz de orientarse adecuadamente y conseguir una respuesta con éxito. Pero la incapacidad aparente de localización podría ser
. EL SISTEMA VISUAL 1 79
realmente una deficiencia en el reconocimiento de formas. Puede ocurrir simplemente que no reconoce el alimento que se le ofrece.
Se nos plantea aquí un dificil problema experimental. Si se utiliza una prueba experimental típica, el hamster parece incapaz de aprender a discriminar formas visualmente simples. Por ejemplo, si tiene que elegir entre dos formas colocadas al final de dos corredores, nunca aprende a seleccionar la correcta para obtener el alimento. Los hamster normales no tienen ningún problema con esta tarea : aprenden rápidamente a identificar la forma adecuada y tienen éxito en la obtención de recompensa cada vez que se colocan en la caja. (Figura 4- 1 3).
FIG lJ RA 4- 1 3
INSTALACION EXPERIMENTAL
El hamster camina por un callejón hacia dos puertas contiguas de plástico. que tienen pegadas en su parte de atrás unas tarjetas con diferentes dibujos. Una puerta se abre empujando; Ja otra está cerrada. Detrás de las puertas está la recompensa: un depósito de agua.
Los hamsters con lesiones en el coliculo superior fueron ca paces de aprender todas las tareas de discríminadón de formas: es decir. aprendieron a discriminar entre todos los pares de tarjetas dibujadas. cuando se les permitía orientarse hacia ellas por medíos no visuales.
Los an imales con lesiones en la corteza visual fueron incapaces de distinguir entre las tarjetas con lunares y las tarjetas rnyadas.
Pero reflexionemos sobre esta tarea. Para realizarla, el animal debe reconocer la forma correcta y también localizarla adecuadamente ; pero si planeamos la tarea de forma que no se necesite n inguna localización, las cosas cambian. Sin el requisito de la localización, la conducta del hamster cambia radicalmente. Se acerca a un extremo de la caja, y llega a una de las puertas marcadas. Entonces se levanta sobre sus patas traseras e inspecciona la forma.
1 80 PROCESAMIENTO DE INFORMACION HUMANA
Después, o se introduce en la puerta o continúa arrastrándose a lo largo de la pared hasta que llega a la puerta siguiente, donde repite su conducta. Si no se introduce en la siguiente puerta, puede continuar alrededor de la caja hasta que regresa a la primera puerta y comienza de nuevo la secuencia completa. Exte experimento pone de manifiesto la diferencia entre localización y reconocimiento 7 •
El trabajo experimental e n este área permanece e n sus primeras etapas, y todavía no se han estudiado los detalles del sistema de localización. Los resultados hasta el momento coinciden en indicar que existen dos sistemas separados de actuación : uno nos dice dónde están las cosas ; el otro nos dice lo que son. Pero normalme1í1te, los dos sistemas no pueden trabajar independientemente; de: lo contrario, ¿cómo se podrían comparar los objetos con su localizadión adecuada ? Los dos canales juntos proporcionan una estruétiira poderosa y complicada, para investigar y analizar el ambiente visvaL
LECTURAS RECOMENDADAS
Una buena forma de comenzar es con el libro de Gregory, The Eye and the Brain : the Psychology of Seeing ( 1 966). Despuésse puede recurrir a LeGrand o a Cornsweet. LeGrand ( 1 957) tratadiversos fenómenos visuales a un nivel más avanzado. El libro de Cornsweet ( 1 970) es magnífico, y cubre muchos de los conceptostratados por nosotros (al igual que otros más avanzados), con un estilo similar. Se pueden encontrar estudios avanzados sobre estos tópicos en la serie de libros editados por Graham ( 1 965) y en el de Pirenne, Vision and the Eye ( 1 967).
Existe una revisión del papel de la corteza visual en el capítulo de Teuber, «Perceptiom> ( 1960). Magníficas fuentes de revisión sonlos Annual Review of Physiology, en los artículos de Bishop ( 1 967), y Creutzfeldt-Sakmann ( 1 969). El artículo de Bishop y Henry, «Spatial Visiom> en el .Annual Review of Psychology ( 1 97 1 ) tambiénes muy útil.
Una estupenda revisión del sistema neurológico para controlar los movimientos del ojo, nos ia proporciona el artículo de Robinsonen la Revista Science ( 1 968).
Las distinciones entre localización y reconocimiento de formas (y la implicación que se hace con el colículo y el resto de la
7 Ver G . E. Schneider ( 1 969), para los detalles del experimento original.
EL SISTEMA VISUAL 1 8 1
corteza visual)°, provienen de diferentes fuentes actuales. E l experimento con el hamster, más una considerable cantidad de datos demostrativos, aparece en el artículo de G. E. Schneider en Science, «Two Visual Systems» ( 1 969). Cierta cantidad de artículos importantes aparecen recogidos en una edición de la revista alemana, Psychologische Forschung ( 1 967 y 1 968, volumen 3 1 ). (Los principales artículos están impresos en inglés). Artículos importantes pueden buscarse en Held (págs. 338-348), Ingle (págs. 44-5 1 ), G. E. Schneider (págs.52-62), y Trevarthen (págs. 299-337). Además, algunos de los artículos de Neurosciences : Second Study Program, Nueva York : Rockefeller University Press, en prensa, prometen ser importantes en la revisión de estas áreas. Algunos de los estudios fisiológicos del colículo, de una manera similar a la utilizada para estudiar células simples, complejas e hipercomplejas de la corteza visual, aparecen en los artículos de Wickelgren y Sterling ( 1 969 ; Sterling y Wickelgren, 1 969). El artículo de Bishop y Henry, en el Annual Review of Psychology, «Spatial Vision» ( 197 1 ) nos ha sido extremadam�nteútil para encontrar referencias sobre estas áreas.
5 LAS DIMENSIONES DE LA VISION
LA PERCEPCIÓN DEL BRILLO : Bandas de Mach.-Contraste de brillo.-Brillo y profundidad.-ADAPTACIÓN : Contornos de igual brillo.-CARACTERÍSTICAS TEMPORALES DE LA VISIÓN: Integración del tiempo.-Cuando los destellos de luz se convierten en continuos.-Fluctuación crítica.-COLOR : COMBINACIÓN DE COLORES.-El disco de colores.-Combinación de dos luces.-Combinación de tres luces.-Pinturas y luces.-Posimágenes.-SENSIBILIDAD DE LOS CONOS AL COLOR : Teoría del proceso contrario sobre el color.-Contraste inducido.-LECTURAS RECOMENDADAS : Visión del color.
LA PERCEPCIÓN DEL BRILLO
La imagen visual que está presente en una parte de la retina afecta a la percepción de una imagen que se ve en un lugar cercano. Las conexiones neurales horizontales (las células horizontales y amacrinas) entrecruzan los receptores retinianos, originando interacciones entre las regiones cercanas a la retina, cuando la información atraviesa el ojo . Esta interacción juega un gran papel en el procesamiento de las entradas visuales y explica algunos fenómenos básicos de la percepción. El mecanismo neural que está implicado en todo esto, ya lo discutimos con cierto detalle en capítulos anteriores. Ahora, nos vamos a centrar en algunas experiencias psicológicas que están producidas por estas retículas de interacción subyacente (Figura 5- 1 ).
Bandas de M ach
Uno de los efectos más importantes de las interaccione� espaciales consiste en un fenómeno de contraste de brillo, conocido a partir del científico austríaco Ernst Mach. En sus primeras investigaciones sobre fisiología sensorial (hacia el 1 860), Mach observó que podía ver bandas de oscuridad y brillo, aunque no existiese ningún cambio fisico correspondiente en la intensidad de la luz.
Fibras del nervio óptit..:o
Células ganglionarc'
Capa sinápticainterna
Células amacrinasCélulas bipolares Células horizontale�Capa sinápticaexterna
Núcleos receptores
Capa de receptores pigmentado, (Células epiteliales)
LAS DIMENSIONES DE LA VISION 1 83
.]
F I G U RA 5-1
El fenómeno se produce de la manera siguiente. La gradación de una imagen visual desde un área pobremente iluminada hasta un área intensamente iluminada (tal como se representa en las Figuras 5-2 y 5-3), se percibe como un cambio mucho más fuerte de intensidad de luz que el que realmente existe. De hecho, se pueden ver la banda oscura y la iluminada a ambos lados de la gradación ; éstas son las bandas de Mach.
1 84 PROCESAMIENTO DE INFORMACION HVMANA
1--------------
-------------
"'
FIGURA 5-2 Disco blanco con sector negro, que cuando gira rápidamente sobre un centro (a una vélocidad superior a 1.800 rpm) . produce ta densidad media de luz que se muestra en el gráfico, y que adquiere la apariencia representada en la Figura 5-4: bandas de Mach. De Ratliff (1965).
·
FIGURA 5-3 Un método simple para producir bandas de Mach. Si la lámpara está a unos 30 crns. por encima del papel blanco, la altura de la tarjeta deberá ser entre 2,5 y 5 cm. Unos pequeños movimientos laterales mejoran la visibilidad de las bandas. El diagrama inferior muestra cómo se ven las bandas, aunque está construido artificialmente. De Ratliff (1965). ·
Las figuras muestran dos formas de producir el gradiente de iluminación. Uno de los métodos consiste en hacer girar un disco, pintado de blanco y negro, lo suficientemente rápido como para que se combinen las porciones blancas y negras, produciendo un gris uniforme. (La velocidad de la rotación tiene que ser superior a 30 revoluciones por segundo, o l . 800 rpm.). Según el otro método, se produce un sombreado difuso colocando un obstáculo cortante en el camino de una fuente de iluminación . En ambos casos, se
LAS DIMENSIONES DE LA VISION 1 85
produce un cambio uniforme ·de iluminación tal como se representa en el diagrama, comenzando desde la región más intensa rotulada como rx, hasta )a región menos intensa rotulada como o, iniciándose las transiciones de intensidad en el punto �' y terminando en el punto y. Esta es una descripción de la luz real reflejada en la superficie. No describimos lo que se ve. La percepción no es la de una transición suave de brillo. Por el contrario, parece que existe una línea brillante en � y una oscura en y. La Figura 5-4muestra la intensidad real (línea discontinua) y la percepción del brillo (línea continua).
a �
FIGURA 5-4
Bríllo percibido
:l.\ / Intensidad real de luz
'\,( . ' '----------
De Ratlij] { 1965 ) .
Lo que ocurre en este experimento es que el efecto de la iluminación en una sección de la imagen visual, interactúa con la percepción de la iluminación de otra sección. Este es exactamente el fenómeno representado en la Figura 5-5 (ver la discusión en el Capítulo 2, alrededor de la página 75).
Estas interacciones también son responsables de la forma en que se perciben las bandas verticales de la Figura 5-6. Aunque cada banda tiene una intensidad constante, no se perciben de esa forma. Por el contrario, la percepción es de un brillo no uniforme o discontinuo.
Es fácil imaginar una buena razón para estas interacciones. Es importante ser capaz de localizar los límites de los objetos, aun cuando no exista mucha diferencia real de intensidad de luz entre el objeto y las cosas que lo rodean. El acrecentamiento de las diferencias en la tasa de disparos neurales de los receptores localizados a ambos lados del borde, sirve de ayuda a los procesos de reconocimiento de formas, que pueden utilizar estos límites para identificar los objetos que se perciben.
186
Intensidad de luz
10
Una conexión típica
Respuesta neural
10
PROCESAMIENTO DE INFORMACION HUMANA
10 10 10 10 10 10
Respuestas
FIGURA 5-5
FIGU RA 5-6
LAS DIMENSIONES DE LA VJSION
Posición
r--
Entrada. intensidad d e luz
r __ J 1r---
' r---1 r---
'
Posición
1 87
La estructura de la salida (línea sólida) prevista para la distribución de intensidad de la entrada de rayas. De Coms weet ( 1970j.
1 88 PROCESAMIENTO DE lNFORMAClON HUMANA
. Las interaccion:s
. neurales responsables de estas experiencias
v1sual�s son muy s1.m1lares a los me�anismos encontrados en otras modalidades sensonales. De hecho, este mismo tipo de reforzamiento
?eu:�l se encuentra en casi todos aquellos receptores sensoriales1�?1v1duales que están colocados junto a otros- en la visión, audi
�10n, gusto, tacto y olfato. Las formas de interacción parecttn ser muyimportante� durante las primeras etapas de análisis en todos los sistemas sensonales.
Contraste de brillo Exa
.minemos los cuadrados internos del ejemplo que se muestra
�n. la
_F
.1�u�a 5-7. Tod�s los cua�rados internos tienen una impresión
1den�1�a . tienen la misma cantidad de luz. Sin embargo, el brillo perc1b1do en los cuadrados internos varía en función de Jo que les
_ rodea. El cuadrado interno más a la izquierda parece más
bnllante que el que está a la derecha. .
FIG U R A 5-7 De Corns>ffel ( 1970).
. Normalmente, se espera que cuando una intensidad fisica se
mcrei_nente, también se incrementará la percepción psicológica. Así el bnl�o de .un objeto debería aumentar cuando incide más Ju� sobre el7 al t�ual que la sonoridad de un ruido aumenta cuandocrece la 1
_ntens1d�d de ese sonido. Pero el brillo de un objeto depende
del medio ai_nb�ente que le rodea. Cuando aumenta la intensidadde luz
.que mc1de sobre una superficie, el cambio de brillo que
se percibe depende de las otras cosas que están presentes. Observe los �uadrados a la izquierda de la Figura 5-7. Llamaremos al cuadrado .mte�no �-1 objeto y al área externa lo circundante. Si aumentaI� 1lummac10n total, la intensidad tanto del objeto como de locircundante au�entará proporcionalmente y el contraste fisico entrelos. dos quedara completamente igual. Sin embargo, el brillo delobjeto no aumenta necesariamente cuando se eleva la iluminación Puede ponerse más brillante o puede permanecer igual, 0 hast�
LAS DIMENSIONES DE LA VlSION 1 89
puede aparentar que disminuye de brillo. Todo depende de la intensi
dad relativa del centro y del medio ambiente.
La forma en que el brillo del objeto cambia con una iluminación
creciente, se representa en la Figura 5-8, para distintas proporciones
de contraste entre el centro y lo que le rodea (la proporción de
contraste se especifica en decibelios) 1 . Cuando el centro es igual
que lo circundante (una diferencia de O dB de contraste), los juicios
sobre el brillo del centro aumentan suave y consistentemente con
la intensidad de luz, como lo muestra la línea gruesa superior.
A medida que crece el contraste entre el centro y el medio, el
brillo del centro no aumenta tan rápidamente como el nivel total
de luz. Con un centro de un gris intermedio (una diferencia de
unos 8 dB de contraste), existe una constancia perfecta de brillo :
el brillo percibido en el centro permanece igual aun cuando se
aumente el nivel de iluminación. Con un contraste superior, se
produce un efecto interesante : cuanta más luz se añade, más oscuro aparece el centro.
100 �50
1 0 5
2 ¡:: o V
-¡;; 1 .0 "" ..s:: =¡: .5 Q:l
.2
.1
.05
.o l 20 40 60
Centro blanco 0-dB contraste con periferia
Centro gris luminoso
Centro gris medio
--0-- Centro gris oscuro
Centro negro grisáceo
80 1 00 1 ntensidad total de luz ( dB)
FIG U RA 5-8 De Stevens ( 196/h ) .
medidas de brillo fueron realizadas utilizando la técnica de estimación
de magnitud, tal como . se describe en el Apéndice A del tercer volumen de este
libro. El experimento fue realizado por S. S. Stevens (1961 b ).
1 90 PROCESAMIENTO DE INFORMACION HUMANA
Es posible intentar este experimento con medios propios, utilizando los cuadrados de la Figura 5-7. Para hacerlo, se necesita una habitación oscura, con algún procedimiento para variar la intensidad de luz sin que varíe también el color de la luz. En las viviendas normales sólo existen dos formas de conseguirlo. Un método consiste en introducirse en un armario, cerrar la puerta, y después abrfr lentamente la puerta. La cantidad de luz que se introduce en el armario puede controlarse en función de la abertura de la puerta. (Tenga en cuenta que, si la habitación da al exterior y está bastante bien iluminada, sólo se necesita abrir la puerta del armario unos pocos centímetros para obtener suficiente luz). Otro método consiste en utilizar una televisión como fuente de luz. Ponga la televisión en un lugar oscuro de la habitación y conéctela en un canal vacío. El control de brillo del aparato actúa como 'un sistema de controlar la luz de la habitación. (Es conveniente tener el control de contraste al mínimo, para evitar los puntos casuales que aparecen normalmente en la pantalla).
Ahora mire los cuadrados. A medida que se aumenta la iluminación de la habitación, a partir de un valor muy bajo, el cuadrado objeto de la derecha se volverá más y más oscuro. Cuando se intenta conseguir lo mismo con el objeto de la izquierda, se volverá más claro a medida que la luz de la habitación es más brillante. Recuerde que todos los cuadrados objeto son idénticos : las diferencias en la forma de percibir su brillo, se producen por las diferencias en lo que les rodea. (Atención : no intente variar la iluminación utilizando un reductor de luz : cambiaría el color de la iluminación).
Aunque al principio parece extraño que un objeto se convierta aparentemente en más oscuro a medida que aumenta la iluminación, es bastante evidente que tiene que ocurrir así. En· condiciones mínimas de iluminación, cuando no existe absolutamente ninguna luz que incida sobre los ojos, la percepción resultante es la de gris, no de negro. El estado neutral de la percepción de brillo parece que está determinado por la tasa fundamental de disparo de las neuronas : así es el gris. Cuando existe alguna luz, entonces somos capaces de ver el negro, pero sólo si existe alguna superficie más para -inhibir las áreas donde aparece el negro.
Consideremos el circuito neural de la Figura 5-9. Cuando no se ha presentado ninguna luz en ninguno de los tres receptores, cada uno responde con su tasa fundamental, 50. Cuando se presenta una luz débil - -dos áreas de intensidad 20 alrededor de una región de intensidad 1 0--, entonces se incrementa la respuesta neural en las dos áreas extremas A y C con una intensidad creciente, mientras
LAS DIMENSIONES DE LA VISION 19 1
FIGURA 5-9
1 92 PROCESAMIENTO DE INFORMACION HUMANA
que se reduce la respuesta en el área central B, aun cuando ahora incida más luz sobre B que antes. (Al realizar los cálculos, suponga que la región de mayor intensidad de luz se extiende indefinidamente a la izquierda y a la derecha). Cuando se aumenta la intensidad de la señal luminosa mediante un factor de 4, de forma que la región externa más intensa lle1'-l a ser 80 y la región interna másdébil aumenta a 40, entonces todavía se produce el fenómeno. Las respuestas neurales de A y B se incrementan con la creciente iluminación, mientras que las respuestas de la región central disminuyen aún más.
Un ejemplo simple de este fenómeno aparece al considerar la pantalla de un aparato de televisión. Cuando el aparato está apagado, la pantalla tiene un gris neutral como brillo. Si se enciende el aparato, algunas áreas de la pantalla muestran un negro intenso, más oscuro que el gris de la pantalla cuando está apagado. Sin embargo, el aparato de televisión sólo puede intensificar la pantalla : el destello electrónico que tropieza con la superficie fosfórica del tubo, sólo puede conseguir que se emita luz, no que se absorba luz. La oscuridad aparente de la pantalla es el resultado del mecanismo de contraste simultáneo del ojo.
BRILLO Y PROFUNDIDAD
Un simple cálculo del brillo no siempre explica nuestras percepciones. Consideremos el siguiente experimento, que demuestra cómo interactúan la información de brilJo y profun!iidad para producir una percepción que explica cierta cantidad de factores (Hochberg y Beck, 1954).
Se arregla una habitación con unos objetos blancos colocados sobre una mesa (ver Figura 5- IO). El observador mira la habitación a través de una pequeña abertura en la pared. Como no puede mover la cabeza, tiene que mirar las eosas desde un ángulo fijo. Se ven cierto número de objetos colocados sobre una mesa iluminada por una luz en lo alto. Algunas superficies están iluminadas directamente, otras están en sombra (ver Figura 5- 1 1).
Aunque es distinta la cantidad de luz reflejada en las diferentes superficies, todas las superficies se perciben con el mismo color : blanco. ¿Por qué? El observador percibe los objetos en tres dimensiones. De esta forma, algunas superficies están directamente bajo la luz, mientras que otras están en sombras. Su orientación en el espacio explica los distintos grados de luz y brillo reflejado, que se perciben cómo constantes.
Supongamos que se coloca de pie el papel marcado con X, frente a la luz de lo alto, como muestra la Figura 5-12. El papel está ahora en sombras y se reduce drásticamente la cantidad de luz que se refleja. Sin embargo, parece aún tan blanco como cualquiera de los otros objetos. De nuevo, la orientación percibida en el espacio es consistente con la luz que refleja.
VIS!ON DEL
OBSERVADOR
V!SION DEL
OBSERVADOR
LAS DIMENSIONES DE LA VISION 193
FIGURA 5-10
VIS ION LATE RAL
FIGU RA 5-1 1
V!Sl01'i LATERAL
F I G U RA 5- 1 2
1 94 PROCESAMIENTO DE INFORMACION HUMANA
Para modificar el brillo percibido, se pueden cortar los bordes del papel en forma semejante a un trapezoide (Figura 5-1 3). Cuando se coloca verticalmente frente a la luz, parece que los lados convergen y el observador percibe el trapezoide vertical como un rectángulo que descansa plano bajo la luz (Figura 5-14). Sin embargo, el papel está realmente en sombras y no refleja la cantidad de luz adecuada a un objeto horizontal. En consecuencia, el brillo que se percibe cambia, y el papel parece mucho más gris que los demás objetos de la mesa. Si después se coloca un palo detrás del papel, la interpretación de profundidad ya no se puede mantener, y de nuevo el objeto se percibe vertical y vuelve a su brillo normal. En la percepción del brillo, la misma escena visual puede interpretarse de formas distintas, en función de la interpretación total de los estímulos visuales.
VISION DEL OBSERVADOR
FIGURA 5- 1 3
FIGURA 5-1 4
VISION LATERAL
Si se lleva a alguien a la calle para medir su sensibilidad visual, el proceso no se manifestaría de una forma tan sencilla. De hecho, probablemente encontraríamos que su conducta era frustrante. Supongamos que se desea determinar su umbral: la mínima intensidad de luz que puede ver. Una forma adecuada de intentarlo consiste en mostrarle una luz razonablemente intensa y después reducir gradualmente la intensidad hasta que diga que ya no la ve. Esto es una aproximación tosca al valor de umbral. Sin embargo, casi cuando se está
LAS D IMENSIONES DE LA VISION 195 registrando el valor del umbral, probablemente le interrumpirá para decirle que ahora puede ver la luz. Intentamos de nuevo reducir la intensidad, y volverá a suceder lo mismo. Primero dirá que la luz ha desaparecido, y unos pocos segundos después cambiará de idea e informará que de nuevo puede verla. Estamos atrapados en el proceso de adaptación visual, -la capacidad del ojo para ajustar su sensibilidad a cambios de iluminación.
Para seguir este proceso con más exactitud, podemos exponer primero al sujeto a una fuente intensa de luz (para asegurarnos donde comienza el sujeto) y después lo encerramos en un cuarto oscuro. La sensibilidad visual se mide presentando al sujeto luces de prueba cada vez más débiles. A medida que pasa el tiempo, el sujeto es cada vez más sensible a la luz. La Figura 5-1 5 muestra los cambios típicos desensibilidad en función del tiempo transcurrido en el cuarto oscuro, la curva de adaptación a la oscuridad.
50 = � "§ iO .o 8 :l
-¡¡ 30 " " N ..= " 20 -o
-o " -o ·;; 1 0" i;
o o 1 0 20
Mi nutos de oscuridad
FIGURA 5- 1 5 De Chapanis ( 1947 ) .
Una simple inspección de esta curva, indica que ocurre algo especial alrededor de los 1 O minutos. Cuando nos enfrentamos a una curva desigual como ésta, se sospecha que más de un mecanismo está produciendo la conducta. En el caso de la visión, naturalmente, existe una sólida base para esta sospecha. Existen dos sistemas receptores distintos que actúan sobre el ojo : bastones y conos. Sería magnífico demostrar que la desigualdad de la curva es el resultado de una interacción en la conducta de estos dos sistemas.
Las diferencias anatómicas y funcionales entre los dos sistemas, pueden utilizarse para analizar la curva de adaptación a la oscuridad
1 96 PROCESAMIENTO .DE INFORMACION HUMANA
en sus distintos componentes. Los bastones son más densos enla periferia, los conos en el centro. Limitando la prueba de luza la periferia, se produciría una curva de adaptación de bastones;limitándola al centro, se produciría una curva basada principalmenteen cambios de la sensibilidad en los conos. Además, bastones yconos son diferencialmente sensibles a luces de diferente longitudde onda (como muestra la Figura 5- 1 6) . Por tanto, la aparienciade la curva de adaptación a la oscuridad dependería de la longitudde onda de la luz de prueba. Así, seríamos capaces de obteneruna curva de adaptación de bastones o de conos, según nuestrodeseo. Experimentando en la periferia o con luz violeta (menosde 450 nm.) conseguiríamos una curva de adaptación de bastonesrelativamente pura. Experimentando en el centro del ojo con luzroja (más de 650 mn.), conseguiríamos una curva de adaptaciónbasada fundamentalmente en la visión de los conos.
$ � -¡¡¡ ..o Ei "
;¡ " " N 2 " "O
"O "' "O ·;¡; " B
30
20
J O
Longitud d e onda (nm)
FIGVRA 5- 1 6 De Hech1 y Hsia (1945).
En realidad, todas estas predicciones son válidas. Por ejemplo, en lá Figura 5- 1 7 se muestra un conjunto de curvas de adaptación a la oscuridad. La única diferencia entre ellas es el color de la luz de prueba. Para luces rojas de longitud de onda muy larga (alrededor de 680 nm,), la curva de adaptación a la oscuridad no muestra ningún signo de distorsión : es una curva pura de sensibilidad de conos. A medida que
LAS DIMENSIONES DE LA VISION 197
la longitud de onda decrece, la desigualdad comienza a manifestarse y la curva para una luz verde ( 485-570 nn_i) �s casi i?é�tica a la curvapara la luz blanca. Finalmente, la sens1b1hdad .max1ma Y el �r�dosuperior de adaptación se encuentra en la longitud de onda :1s1ble más corta. una luz violeta (menos de 485 nm.), donde el sistema de baston�s lleva la principal carga al responder a la señal visual. Un conjunto similar de curvas, aparece cuando la luz se mueve desde el centro del campo visual hacia la periferia :
50
$ � o; 40 ..o Ei "
ü 30 " " "
3 <U 20 "O
"O " � 1 0e <U .§
o o
Adaptación a la luz: 103 dB por 5 min
Longitudes de onda de los destellos experimentales ' .....
\�::-: ___ �.s,.--.------------------------.?-�2:!" ___ _ "-"':':::.::;-· - .;: '----- 620-700 nm \ ·� ', ---------------- ---
\ ·� ............
\.. ·""'·-..-=: ........... ____ 550-620 nm '· -:-..=.-:-..::.-:-.::.. 7.::.. -:=..-:--
1 0
·, •• , 485-570 nm
"-··-··-··-··- ··-.. -.���:.�: . . _
20 30
Minutos de oscuridad
< 48 5 nm
40
FIG U RA 5- 1 7 De Chapanis ( 1947 J.
50
La luz en el centro producirá una curva semejante a la superior de la Figura 5- 1 7 ; la luz en la periferia tendrá como resultado una curva como la inferior.
Contornos de igual brillo
Existe otra forma de comprobar los efectos de adaptación a la oscuridad. A medida que varía la longitud de onda de una luz, también se modificará su brillo. Los contornos de igual br�llo muestran la intensidad de luz necesaria para mantener un bnllo constante cuando la luz varía de longitud de onda. Estas c���asson análogas a los contornos de igual sonoridad en la aud1c10n. El conjunto de contornos de igual brillo de la Figura 5- 1 8 , mues.t:acómo cambian las curvas en las distintas etapas de adaptac10n a la oscuridad. Cuando cambia el nivel de adaptación, las curvas
1 98 PROCESAMIENTO DE INFORMACION HUMANA
de igual brillo modifican la longitud de onda a la que son m�xi?1amente sensibles. Este cambio se produce a causa de la d1stmta cantidad de actividad de los bastones y conos existentes en cada nivel de adaptación. Con poca adaptación (curva superior), la visión del cono juega el papel principal, de forma que a mayor longitud de onda la percepción es más brillante. Con una gran cantidad de adaptación, la visión depende principalmente de los bastones y la sensibilidad máxima cambia hacia longitudes de onda más cortas. ,Esto lo observó por primera vez el fisiólogo bohemio Johannes Purkinje y, de hecho, fue uno de los primeros conjuntos de observaciones de conducta utilizados para establecer la diferencia entre los sistemas de bastones y conos.
90 so Nivel de adaptación
N .a
a la luz " .,, 70
.,, " 60 .,, '<;l " !!:! ., 50 " -·- " .. .:;! "" � " 40 "' o
.::: u
� � 30"" ,.o "' e: :g = 20 e r: " " V o.
lO
o
400 500 600 700 Longitud de onda (nm)
FIGU RA 5- 1 8 De Judd (1951) .
El cambio de sensibilidad tiene un resultado práctico. Con luz brillante, el rojo parece más brillante que el azul. Con luz oscura, ocurre lo contrario. Las señales visuales diseñadas para uso nocturno, deben tener en cuenta este cambio de sensibilidad. (Ver la gama de colores en la hoja de Purkinje, Figura 5- 1 9, en la página 226c).
Si alguien necesita mantener sus ojos adaptados a la oscuridad, pero también trabaja ocasionalmentt< en habitaciones bien ilumina-
LAS DIMENSIONES DE LA VISION 1 99
das, entonces es necesario asegurarse de que no interfiere con el nivel de adaptación de su visión de bastones. Esto se puede conseguir controlando la longitud de onda a la que está expuesto. Llevando gafas que sólo permitan llegar la luz roja a los ojos, se protegerá el sistema de bastones contra la luz brillante. Con gafas rojas, sólo los conos están expuestos a la luz aun en ambientes bien iluminados y no se afecta al nivel de adaptación de los bastones. En ambientes oscuros, cuando se quitan las gafas, se da uno cuenta de que los bastones mantienen una alta sensibilidad ; aun cuando los conos están ahora adaptados a la luz, esto no afecta a la visión. Esta es la razón del uso de gafas rojas o habitaciones exclusivamente iluminadas con luz roja, en .personas como los observadores de radar que necesitan mantener los ojos ' adaptados a la oscuridad, aun cuando desean moverse en habitaciones bie� iluminadas el resto de su tiempo (Figura 5-20).
1 so Zona limíte
del filtro
� 60 1---t��-+-+-�+-1'--�t-�--f'rt�--t��-; .� i 4o l----1-��-JJ..��...J-��+;.�--1--11r---t��-1 .. ·� � 20 1---+��-+�-+-t-��t-�rt-t'.
1.1.l
400 500 600 700 Longitud de onda (nm)
FIGURA 5-20 El área rayada indica la región donde el filtro rojo permite el paso de luz. De esta forma, prácticamente ninguna luz excita los conos. La linea vertical indica el lugar donde corta el
filtro rojo. Transmite J /JO de la luz implicada en la curva de conos, y 1/100 de la curva de bastones. De Hecht y Hsia ( 1945).
¿Cuánto se tarda en estar adaptado a la oscuridad'! La curva de la Figura 5-1 7 muestra que los cambios más rápidos de sensibilidad ocurren durante los primeros 1 0 a 20 minutos. Para la mayor parte de los propósitos prácticos, son suficientes 30 minutos para conseguir el máximo de adaptación, pero una observación minuciosa pone de manifiesto que la sensibilidad continúa cambiando muy lentamente durante unas 6 horas. Sin embargo, debe tenerse en cuenta que los
200 PROCESAMIENTO DE INFORMACION HUMANA
20 ó 30 minutos son para una situación donde primero se expone al sujeto a luces extremadamente brillantes (por ejemplo, un destello de magnesio enfrente de sus ojos). Con iluminac�on�� mucho
_m�s os�uras
-por ejemplo, el nivel que existe en una habitac10n ampha ilu�mada por varias lámparas de 50 watios-, se puede tardar unos 5 mmutos en llegar a estar adaptado a la oscuridad. Sin embargo, �n.a vez queel ojo está adaptado a la oscuridad, encender un� luz debtl dur�?te 1 0 seg. aproximadamente no modifica mucho el mvel d� �dapta�10n ; sólo se necesitan unos 60 seg. para volver al estado ongmal. Si esto no fuese así la conducción nocturna plantearía bastantes dificultades, puesto que
' las luces de otro coche afectarían . a la adaptaci.ón a
la oscuridad, perjudicando gravemente la capacidad de ver obJ�t?�· De hecho, es evidente que tales luces afectan muy poco a la sensibilidad visual.
CARACTERÍSTICAS TEMPORALES DE LA VISIÓN
Integración del tiempo
La visión no es instantánea. Se tarda cierto tiempo en reaccionar a una imagen visual y, en consecuencia, una vez constituida, . la reacción persiste algún tiempo, aunque la imagen haya desaparecido . . Lasreacciones químicas parecen necesitar cierto tiempo para traducir la fuente de luz en respuestas neuro-eléctricas. La imagen retiniana desaparece gradualmente, de forma que puede verse durante varias décimas de segundo (ver la discusión del almacén visual a corto plazo, en el Capítulo 2 del segundo volumen de esta obra).
Es posible establecer una relación entre la intensidad de luz Y laduración de la misma. Dentro de los márgenes del tiempo de respuesta del ojo, todo depende de la energía total presentada. De esta forma si la intensidad de luz se divide y la duración se duplica, la capacid�d de una persona para detectar una señal se mantiene constante.La relación tiempo-intensidad actúa bastante bien durante unos 20
m/seg. Para una luz que dura más de 20 m/seg., la reducción de �ntensidad de luz no se puede compensar suficientemente con un mcremento proporcional de la duración de la señal. Una vez que el dest�llo de luz es superior a un cuarto de segundo (250 m/seg.), la capacidad para detectar la señal se convierte .en totalment� ind�pendientede la duración y solamente está determmada por la mtensidad de laluz.
Este intercambio entre tiempo e intensidad no es, naturalmente,
LAS DIMENSIONES DE LA VISION 201
exclusivo del sistema visual. Es común en los procesos fotoquímicos de todos los tipos. Una exposición adecuada de película fotográfica, por ejemplo, se puede obtener mediante un gran número de combinaciones de integración de tiempos (velocidad del obturador) e intensidades (abertura del diafragma). Las cámaras proporcionan normalmente una integración de tiempos desde 0,00 1 hasta 1 ,0 seg- un recorrido mucho más amplio que en el ojo humano. Pero el sistema visual es bastante más sensible a la luz que el promedio de las películas de fotografia.
Cuando los destellos de luz se convierten en continuos
Una vez que ha comenzado, la percepción visual persiste durante un corto período de tiempo, después de que la luz ya ha desaparecido. La persistencia de la imagen visual la midió por primera vez un ingenioso investigador hacia el 1 700, que ató un ascua incandescente a una cuerda y la hizo girar en la oscuridad. Se puede hacer lo mismo con una linterna eléctrica. La velocidad de rotación de la luz en movimiento, produce la sensación de que forma un círculo continuo y esto proporciona la información necesaria para calcular la persistencia de la imagen. El experimento proporciona el mismo resultado ya se realice con aparatos electrónicos de medida o con una linterna eléctrica o con un ascua incandescente : la estimación es de unos 1 50 mseg.Este valor es muy parecido a la duración de la actividad eléctrica en la retina, que se produce como respuesta a un breve destello de luz. El hecho de que la configuración de luz parece quedar retenida por el sistema visual durante unos 1 50-250 mseg. , es una característica importante para nuestro estudio de la memoria (Capítulos 1 y 2 del segundo volumen de esta obra).
Fluctuación crítica
Utilizando períodos de tiempo adecuados, es posible conseguir que las luces que realmente son intermitentes, produzcan la sensación de una continuidad. Supongamos que se produce un destello de luz. Se origina la respuesta visual y persiste durante unos 1 00 mseg. Si se produce un segundo destello lo suficientemente rápido, se originará otra prespuesta antes de que haya desaparecido la reacción a la primera. Se puede añadir un tercer destello antes de que desaparezca la reacción visual al segundo destello. En consecuencia, los destellos de luz producen una reacción continua en el sistéma visual, que se percibe como una luz continua. La tasa en que una luz que fluctúa
202 PROCESAMIENTO DE INFORMACION HUMANA
aparece como continua, se llama frecuencia de fluctuación crítica (FFC) 2.
Cualquier factor que altere la velocidad de fluctuación y piersistencia en el sistema visual, también altera la tasa en que las fluctuaciones de luz se perciben como continuas. Los destellos intensos producen cortos períodos de integración y, de esta manera, tienen que presentarse con tasas muy superiores antes de que se fundan y se conviertan en continuos. Los destellos débiles se integran en tasas lentas. El sistema de bastones, que trabaj a mejor con niveles bajos de iluminación, tiene una frecuencia de fluctuación crítica menor que la del sistema de conos.
El brillo aparente de una luz fluctuante que se ha fundido, se puede predecir a partir del mecanismo de integración que produce la fusión. Una luz fluctuante, que se apaga y enciende en períodos de tiempos iguales, con una velocidad superior a la de su frecuencia de fusión, parece tener el mismo brillo que una luz que está encendida continuamente, pero que sólo tiene la mitad de intensidad (este fenómeno recibe el nombre de Ley de Talbot). El sistema visual promedia la intensidad a través del periodo de integración, y la percepción se produce en consecuencia.
Estos aspectos de integración del procesamiento de información visual, limitan claramente la velocidad con la que el ojo puede detectar y rastrear las modificaciones de la estimulación que incide sobre la retina. El proceso de promedios combina una imagen con la siguiente, originando una percepción visual que se desarrolla suavemente. Ese proceso convierte una sucesión de dibujos discontinuos que se proyectan en un aparato de televisión o en una pantalla cinematográfica, en la ilusión de un ambiente visual continuo y uniforme.
Las imágenes de un aparato de televisión o de una pantalla cinematográfica fluctuarían algo en realidad, si no se utilizasen unas estrategias inteligentes. Las películas profesionales se proyectan a una velocidad de 24 cuadros por segundo (algunas veces 30). La luz proyectada en la pan.talla se interrumpe durante el tiempo en que tarda en avanzar la película de un cuadro al siguiente, Si se proyectase normalmente, se vería la fluctuación. Para evitarla, se proyecta varias veces cada cuadro de la película sobre la pantalla.
2 Los que estén familiarizados con circuitos electrónicos, observarán que las características temporales del ojo se parecen a las de un filtro de paso de banda con una expansión máxima entre los 10 y 50 Hz, en función de la intensidad y con poca o ninguna respuesta directa. (Ver Cornsweet (1970) para una discusión del método de análisis por filtro de paso de banda).
LAS DIMENSIONES DE . LA VISION 203
Es decir, en lugar de una proyección uniforme de cada cuadro, se interrumpe la luz una o más veces. De esta forma, aunque sólo se muestran 24 cuadros por segundo, el ojo recibe una frecuencia de unos 48 destellos pór segundo, una velocidad suficientemente elevada para evitar la fluctuación. (Algunos proyectores interrumpen el destello de luz dos veces durante cada cuadro, produciendo así una frecuencia de 72 destellos por segundo).
La televisión se enfrenta a un problema similar. Una imagen de televisión se dibuja sobre la pantalla punto por punto, estando compuesta la imagen de unas 525 líneas ; cada línea tiene un promedio teórico de unos 500 puntos. La imagen completa se presenta unas 30 veces por segundo. Si la imagen estuviese dibujada consecutivamente, comenzando . en la esquina superior izquierda, haciendo un recorrido por filas hasta el extremo inferior derecho, se produciría la fluctuación porque el hecho de presentar cada punto exigiría un cierto porcentaje de tiempo que atrasaría la presentación de la imagen completa. Esto no ocurre en el cine, donde cada elemento de la imagen se expone simultáneamente cuando se ilumina la escena.
Para evitar la. fluctuación, se divide la imagen por la mitad presentando una línea sí y otra no de la imagen. Esto tarda 1 /60 seg. en presentarse. Después, el destello electrónico regresa y completa las líneas emitidas. De esta forma, aunque la imagen completa continúa tardando 1 /30 seg. en presentarse, cada área de la pantalla tiene presente alguna parte de la imagen en cada l /60 seg. Este entrecruzamiento elimina eficazmente la fluctuación.
Recientemente, la industria del entretenimiento ha vuelto a introducir deliberadamente la fluctuación proporcionándonos la posibilidad de ver lo que parecería el ambiente si nuestro sistema visual no tuviese estos mecanismos de integración. Las luces estroboscópicas, utilizadas algunas veces en espectáculos de iluminación, producen una serie de fogonazos discretos con tiempo suficiente entre cada uno, como para que la imagen de una luz desaparezca antes de que surja la siguiente. Con intensidades elevadas y baja velocidad de fluctuación, el sistema visual no es capaz ya de combinar una imagen con la siguiente, de forma que la percepción tiene un aspecto irreal y desconexo.
COLOR
El comienzo de las teorías modernas de la v1s1on del color se debe a Isaac Newton y a su descubrimiento de que un prisma
204 PROCESAMIENTO DE INFORJ.tACION HUMANA
puede analizar la luz del sol en un amplio espectro de colores. A partir de ese fenómeno simple surge la primera teoría : el color que se percibe depende de la longitud de onda de la luz que incide sobre el ojo. Como pasa con muchas teorías, los hechos son verdaderos pero no así la teoría (ver el cuadro de color, Figura 4- 1 , página 226b ).
Un prisma (o su equivalente en la naturaleza, el arco iris) separa las diferentes longitudes de onda que contiene la luz blanca y las coloca en fila, desde la longitud de onda más larga hasta la más corta. Percibimos el espectro como colores distintos ordenados claramente en una gama del rojo al violeta. Posiblemente esto es todo lo que existe para la visión del color. Puede ocurrir que exista un tipo distinto de receptor para responder a cada longitud diferente de onda (luz monocromática) , de la misma manera que existen distintas neuronas en el sistema auditivo que responden a diferentes frecuencias de sonido.
Un cuidadoso examen de la percepción del color pone de manifiesto que esta teoría es demasiado simple. En el espectro de luces puras producidas por un prisma, no aparecen algunos colores. No existe el castaño, el morado, ni el rosa. Estos colores deben estar producidos por algo más que una simple luz monocromática.
Cuando se combinan dos luces de distinta longitud de onda, es evidente que no vemos dos colores. Por el contrario, vemos un nuevo color originado por la mezcla. Después de que las luces están combinadas, es totalmente imposible que el hombre determine el conjunto original de colores que componen la mezcla. Esta situación es muy distinta a la de audición, donde Jos que escuchan pueden identificar los tonos individuales que forman una armonía. Por otro lado, en Ja visión del color, ciertas combinaciones de longitud de onda parecen eliminar el color resultante. Por ejemplo, si una luz monocromática verde azulada (con una longitud de onda de 490 nm) se combina con otra luz monocromática rojiza (con una longitud de onda de 600 nm), y se ajustan correctamente las cantidades relativas de las dos luces, los colores se anulan, resultando un gris descolorido. Tales combinaciones de luces se llaman pares complementarios.
Los pares complementarios proporcionan unos indicios útiles para la descripción de la visión humana de colores. Lo primero que se necesita es alguna manera de expresar las relaciones que se producen entre todas las percepciones posibles de luces y colores. Teóricamente, sería posible encontrar un sistema descriptivo que permitiera predecir el color percibido de cualquier combinación
LAS DIMENSIONES DE LA VISION 205
de luces. Esto se intenta normalmente dibujando un diagrama donde están representados los distintos colores posibles y sus combinaciones, al igual que un conjunto de reglas que determinan cómo se pueden predecir los resultados de las combinaciones de luz. Tal diagrama (y su representación matemática equivalente) es un espacio de colores. Los espacios de color pueden presentarse de muchas formas, desde un simple círculo hasta un espacio tridimensional bastante complejo.
COMBINACIÓN DE COLORES
Podemos utilizar el conjunto de colores complementarios para construir el primer sistema de descripción de combinación de colores. La disposición de los colores producidos por un prisma describe bastante bien las percepciones originadas por una luz única, monocromática. Sería útil sacar partido de esta descripción. Para hacerlo, observemos dos cosas : primero, el hecho de que algunos colores son «opuestos» o complementarios entre sí ; segundo, los dos extremos del espectro parecen bastante similares, azul intenso o violeta en el extremo más corto de longitud de onda, morado en el extremo de longitud de onda más largo. La combinación de estas dos observaciones nos conducen a una solución simple : tomar la gama de colores proporcionada por el espectro y dibujarla como un círculo, colocando los colores complementarios diametralmente opuestos en el círculo. Aunque parece sorprendente, este esquema simple de representación de colores funciona adecuadamente. Describe mu�ho más de lo que se podía esperar del simple razonamiento que fundamenta su construcción. Hay que observar que hasta ahora no existe ninguna insinuación de una teoría sobre cómo los humanos perciben los colores, sino sólo un intento de describir las relaciones entre los colores que se perciben.
El disco de colores
La Figura 5-2 1 representa un posible disco de colores . • A lo largo de la circunferencia del círculo están los nombres de los colores y la localización aproximada de la longitud de onda de luz que producen esos colores, cuando se ven en el espectro (ver Figura 4- 1 , para una representación diferente). Los pares de colores complementarios se pueden encontrar determinando las marcas
206 PROCESAMIENTO DE INFORMACION HUMANA
opuestas (la región llamada «morado» no puede estar producida por una luz monocromática. Lo discutiremos posteriormente).
Verde azulado 480
FIGU RA 5-21
Verde
Blanco •
Morado
Los colores de esta región no pueden estar producidos por una luz monocromática.
580 Amarillo-rojizo
Antes de analizar cómo funciona el disco de colores, tenemosque definir la palabra color con un poco más de precisión. Pararepresentar cualquier color, se necesitan tres atributos psicológicosdistintos : matiz, saturación y brillo.
El matiz se corresponde con el significado normal de color :es lo que cambia cuando se modifica la longitud de onda. Losdistintos lugares a Jo largo de la circunferencia representan matices.
La saturación hace referencia a la cantidad relativa de luz monocromática pura que tiene que mezclarse con la luz blanca, paraproducir el color percibido. Todos los puntos sobre la circunferencia son colores altamente saturados. Si nos movemos desde el exterior hacia el centro, se reduce la saturación : el punto llamadoblanco tiene una saturación de cero. Un punto intermedio entreblanco y verde tiene una cantidad media de saturación.
El brillo se utiliza exactamente de la misma manera que enlas secciones anteriores de este capítulo. La dimensión de brillo
LAS DIMENSIONES DE LA VISION 207
no se representa en el círculo de color. El correlato físico más directo del brillo es Ja intensidad de luz (con las mismas limitaciones ya discutidas anteriormente).
Combinación de dos luces. Para observar cómo se combinan dos colores para formar un tercero, el primer paso consiste en localizar Jos colores individuales sobre Ja circunferencia, y después unir Jos dos puntos pot una línea · recta. Cualquier combinación de dos colores individuales producirá un tercer color que está situado en algún lugar de esa línea : la localización exacta depende de las cantidades exactas (intensidades) de los dos colores individuales que están presentes en la combinación.
Vamos a suponer que mezclamos dos colores complementarios monocromáticos : los podemos llamar B y Be. Están representados en el círculo de color de Ja Figura 5-22 por dos puntos de Ja circunferencia que descansan en Jos extremos opuestos de un diámetro. La combinación de B y Be, que se anula completamente, es el punto medio entre los dos : el centro de la circunferencia. De esta manera, el centro representa un punto sin ningún color, el blanco (W). (En este esquema, todas las percepciones que no tienen ningún color (matiz) se llaman blanco, al margen del brillo. Por tanto, el blanco hace referencia a la clase general de percepciones que va desde el negro (muy poco brillo), pasando por los grises (cantidades intermedias de brillo), hasta el blanco (brillo elevado). Para el propósito de describir el color, todos son semejantes).
o
B
F I G U R A 5-22
Supongamos que se mezclan dos colores que no son complementarios, por ejemplo A y B. El resultado es un nuevo color O',como se muestra en la Figura 5-22. ¿Qué color es O'? La forma
208 PROCESAMIENTO DE INFORMACION HUMANA
más fácil de contestar consiste en considerar los cambios de percepción que se producen cuando nos movemos desde el punto B de la circunferencia del disco de color, hacia W. En B, existe un color espectral, producido por una luz monocromática pura. Supongamos que el punto B es azul. Al movernos de B a W, simplemente combinamos dos luces, una de las cuales es blanca, mientras que la otra es azul monocromática. A medida que cambia la proporción relativa de las dos luces, nos desplazamos desde el punto B (todo luz azul, nada blanco), a través de puntos que representan igual cantidad de ambas luces, hasta W (todo luz blanca, nada azul). Desde el punto de vista del resultado de las sensaciones de color, el atributo esencial que la mayor parte de la gente concibe como color, no cambiaría añadiendo blanco, sino que más bien es la saturación -la <<luminosidad» o «blancura>>-- la que cambiaría. Para comprobar este fenómeno, se puede seleccionar cualquier punto de la línea BW (salvo la B y la W) ; después se le pide a un observador que mire los colores espectrales y elija uno que se parezca lo más posible a ese punto : seleccionará el color espectral correspondiente a B.
Pero volvamos al problema original : ¿Qué color representa O' en la Figura 5-22? El matiz queda especificado por el radio dibujado desde el centro del círculo (W), · que atraviesa O' y l lega hasta la circunferencia, en el punto O de la figura. La distancia del radio desde W hasta O', especifica la saturación. Los puntos O y O' tienen el mismo matiz, pero O está más saturado. Observamos que mezclando A y B producimos O', un color con el matiz de O, pero con menos saturación.
Combinación de tres luces. La mezcla de tres colores monocromáticos -que podemos llamar A, B y C- -, pueden producir cualquier color situado en el interior del triángulo formado por los tres puntos. Para comprobarlo, consideremos cómo al combinar A, B y C obtenemos el color Z.
En primer lugar, en la Figura 5-23, es evidente que si se mezclan dos colores cualesquiera (A con B, B con C, o A con C), loscolores resultantes de las combinaciones quedan especificados por la línea recta (discontinua) que une esos colores. El color que tenemos que comparar, Z, no está situado en ninguna de estas líneas. Sin embargo, esto no significa que Z no se pueda comparar. Veamos lo que sucede si se combinan A y B para formar D. Ahora bien, aunque realmente D está producida por una combinación de dos luces monocromáticas, en la medida en que está implica-
LAS DIMENSIONES DE LA VISION 209
do el círculo de color, actúa como si fuese una luz pura. De esta forma, se se combina C con D, el resultado es un color que �stá situado en la línea que conecta C con D. Así , para compararZ, simplemente mezclamos A y B en la cantidad adecuada, de forma que la D producida se sitúa en la línea que conecta C Y �· Por tanto, combinamos C con D hasta que se produzcael col�r que equivale a Z. Mediante este mismo argumento, siemprees posible determinar la combinación correcta de las combinaciones de A, B y C, equivalente a cualquier punto que está situado en el triángulo formado por las Hneas que unen A, B y C.
B ""
,,.., \,,,., ,,,.,"" \
,,.,,.. \ ,,..,,.. \ "" o Z \ A --- - - - - - \
- -e
,,,.,,,. / D, formada por una � mezcla de A y B
A ,,,.,,,..
,,,.,,,.. o Z
D a..,
..... , A /' �
' Combinación de C y -D que es igual a Z
e
e
FI G U R A 5-23
2 1 0 PROCESAMJENTO DE JNFORMACJON HUMANA
¿Existen tres luces monocromáticas que, cuando se combinan, producen todos los colores posibles que pueden percibirse? Llamaremos a estas tres luces básicas, luces primarias o colores primarios. Como muestra la Figura 5-24, para obtener una gran variedad de colores que ·estén situados dentro del triángulo, las primarias deberían estar seleccionadas de forma que no estuviesen demasiado cercanas entre sí. De hecho, para obtener todos los colores, los tres colores primarios A, B y C, deberían estar seleccionados de forma que ninguno fuese complementario del otro. Además, el área ,cubierta por los tres debería ser tan amplia como fuese posible. Si todo el área está a un lado del centro del círculo, entonces no se podrían sintetizar todos los colores. El triángulo debe incluir el centro del círculo en su interior. Una manera formal de establecer este requisito consiste en que los tres primarios deberían seleccionarse de forma en que ninguno fuese complementario del otro y ninguno pudiese compararse con una combinación de los otros dos.
A
Combinaciones posibles
e
FIGURA 5-24
B
En la Figura 5-25 se representa el conjunto ideal de primarios : un gran triángulo equilátero que cubre por completo el círculo. Desgraciadamente, aunque éste es el conjunto de primarios que
LAS DJMENSJONES DE LA VJSJON 2 1 1
se necesitan para producir todos los colores dentro del círculo, los primarios A, B y C están fuera del círculo. Por tanto, no pueden estar producidos por ninguna luz monocromática. Lo máximo que se puede hacer con luces reales es el triángulo equilátero que está contenido dentro del círculo representado en la Figura 5-26.
A e Combinaciones posibles
Combinaciones posibles B
FIGURA 5-25 FIGURA 5-26
El círculo del color resume una primera parte de los fenómenos de la percepción del color. Pero es una descripción, no una explicación. Demuestra cómo estos colores primarios, combinados entre sí, pueden producir todos los matices que percibimos. Sin embargo, en la medida en que el disco de color está implicado, servirían tres colores cualquiera (naturalmente, con las restricciones apuntadas). Aún no hemos discutido cuáles son los colores primarios del sistema visual.
PINTURAS Y LUCES
El círculo del color se aplica a las combinaci,Pnes de luces, pero no a las combinaciones de pinturas. Para poder determinar cómo se combinan las pinturas, es necesario considerar el hecho de que producen su color absorbiendo luz en todas las longitudes de onda, salvo de aquellas que originan el color. Las longitudes de onda que provocan el color son rechazadas. Para observar cómo se combinan dos pinturas, es necesario examinar las longitudes de onda que absorbe la nueva combinación . Cómo la absorción de colores es el atributo más importante de la pintura, estas combinaciones se llaman negativas. La combinación de luces se llama auditiva.
La combinación de luz roja y verde puede producir el amarillo. La combinación de luz azul y amarilla puede producir el gris. (Ver la Figura 5-21). Estos son los hechos de la combinación de colores, pero son contrarios a lo que aprenden
2 1 2 PROCESAMIENTO DE INFORMACION HUMANA
la mayoría de las personas en las clases de arte sobre la combinación de colores. ¿A qué se debe esta diferencia? La respuesta está relacionada con las diferencias entre la forma en que se mezclan dos luces y dos pinturas. Para realizar una predicción del color que resulta de una combinación, no preguntariamos sobre los colores que se han mezclado : eso tiene poco que ver con el problema. Lo importante son los colores que obtiene el ojo.
Reflexión sobre la combinación de luces. Examine la Figura 5-27. Se proyecta una luz azul sobre una hoja de papel : el azul se refleja desde el papel en el ojo y el papel parece azul.
Se proyecta una luz amarílla sobre una hoja de papel. El amarillo se refleja y el papel parece amarillo.
Se proyecta azul y amarillo sobre el papel. Se reflejan tanto el azul como el amarillo, y se puede ver a los dos. El color resultante que se percibe viene determinado por la combinación : gris.
Reflexión sobre la combinación de pinturas. Pinte de azul un papel. Se proyecta luz blanca sobre el papel. La pintura absorbe longitudes de onda largas, y sólo permite la reflexión del verde, azul y violeta. El ojo ve una combinación de verde, azul y violeta. El papel se ve azul.
Pinte de amarillo un papel. Se proyecta luz blanca sobre el papel. La pintura absorbe longitudes de onda cortas, de forma que sólo se refleja el verde. amarillo, naranja y rojo. El ojo percibe esta mezcla. El papel se ve amarillo.
Pinte un papel con una mezcla de azul y amarillo. Se proyecta luz blanca sobre el papel. La pintura azul absorbe largas longitudes de onda (azul y violeta). El resultado es que sólo se permiten longitudes de onda intermedias : verdes. Por tanto, la combinación de pintura azul y pintura amarilla se ve como verde.
Combinación de pinturas y luces
Los principios aprendidos sobre combinación de colores mediante luces también se pueden aplicar a las pinturas. Supongamos que se desea originar un amarillo mediante una combinación de pintura roja y verde. Si nosotros me7..clamos simplemente las pinturas y las aplicamos a un papel, terminaríamos con una combinación oscura, probablemente rojiza. Esto ocurre porque se mezclaron las pinturas, de forma que sus efectos luminosos interfieren entre sí. Pero supongamos que el rojo se pintó mediante muchos puntos pequeños de pintura. A cierta distancia, se percibe como un rojo sólido. De la misma manera, se puede pintar el verde mediante pequeños puntos, cuidadosamente colocados de forma que los puntos verdes y rojos rellenan por completo el papel, sin superponerse entre sí. Desde muy cerca, serian visibles los pequeños puntos rojosy verdes. A cierta distancia, alejándose lo suficiente para que no se vean los puntos individuales, el ojo recibiría una combinación de luz roja y verde. La luz se percibiría como amarilla.
Este es el principio utilízado en los aparatos de televisión en color para combinar los colores. Si se examina la pantalla desde muy cerca, se pueden llegar a ver los puntos individuales de color. Mucho antes de la época de la televisión en
color, el pintor impresionista George Seurat ( 1 859- 1 89 1 ) ya había experimentado con combinaciones aditivas de color, realizando sus cuadros mediante pequeños puntos de color. Cuando se m iraban a cierta distancia, la combinación de luces originaba los colores deseados.
LAS DIMENSIONES DE LA VISION 2 1 3
COMBIN ACION D E LUCES
COMBINACION DE PINTURAS
FIG U RA 5-27
Pos imágenes
Observe fijamente durante un rato el fragmento de color de la Figura 1 .49, en la página 226a, sin mover los ojos hasta que ese fragmento comience a «difuminarse» ligeramente. Después mire
2 1 4 PROCESAMIENTO DE INFORMACION HUMANA
una superficie blanca; de esta forma se podrá ver una posimagen del fragmento de color. El color de una posimagen es casi exactamente el color complementario de la imagen. Por· tanto, el círculo de color describe los colores de las posimágenes : el color de la posimagen se encuentra atravesando en línea recta el círculo, desde el color que se miraba fijamente. (Existe un pequeño error en la predicción del color de una posimagen que todavía no ha sido explicado, pero la mejor hipótesis consiste en afirmar que se debe a un error introducido por la ligera coloración del interior del ojo).
Las posimágenes son recíprocas. Es decir, si el azul produce una posimagen amarilla, entonces una luz de ese mismo color amarillo producirá una posimagen azul. Sin embargo, algunos verdes producen posimágenes moradas, aunque no existe ninguna longitud de onda de luz simple que pueda producir el morado por sí misma. El morado y los colores relacionados son colores no espectrales, porque no pueden ser producidos por una longitud de onda simple desde el espectro visual. Sin embargo, estos colores pueden colocarse en el círculo de color, conociendo sus complementps. Están especificados por las longitudes de onda de sus complementos. Sin embargo, si se mira de nuevo el círculo de color, se puede ver qué combinaciones de luces produciría el morado. Un violeta de 400 nm mezclado con un rojo de 700 nm, producirá un morado intenso. Por tanto, el círculo de color no sólo ayuda a explicar las combinaciones, sino que también sitúa colores no espectrales en su lugar correcto.
La explicación de las posimágenes es simple. La visión prolongada de una escena fatiga los receptores, permitiendo la sustitución del sistema opuesto cuando la mirada cambia a una estimulación neutral. De esta manera, como ocurre con los colores incididos, es posible producir colores «no naturales» mediante este procedimiento. Primero se mira un verde saturado durante cierto tiempo, y después se cambia a un rojo saturado : se percibe un rojo supersaturado. Los receptores verdes están fatigados. No actúan ya al mezclarse con el rojo y restarle saturación. Así, el rojo que resulta es más brillante que cualquiera que pueda producirse por una simple luz monocromática.
Se puede reforzar el efecto añadiendo colores inducidos. Observe un rojo intenso rodeado de un verde intenso. Después cambie a un verde intenso rodeado de un rojo intenso. Esto se puede conseguir fácilmente mediante diapositivas de color que sean tanto positivas como negativas de la escena original (se encuentran fácil-
LAS DIMENSIONES DE LA VISION 2 1 5
mente peliculas de color -como por ejemplo Kodacolor- que proporcionan negativos en colores, que son complementarios al original). Proyéctelos alternativamente sobre una pantalla de forma que se superpongan. La rapidez en los cambios alternativos es muy eficaz.
SENSIBILIDAD AL COLOR DE LOS CONOS
Se han descubierto tres tipos distintos de conos, por medio de una medida directa de la sensibilidad al color de los conos en la retina humana, cada uno de los cuales contiene un pigmento específico que es responsable de su selectividad al color. Los distintos pigmentos absorben diferencialrnente la luz, siendo cada uno selectivo a un conjunto especial de longitudes de onda. Uno absorbe longitudes de onda de 445 a 450 nm como máximo, el segundo tiene una absorción máxima de unos 525 a 535 nm, y el último tiene su máximo en la región de 555 a 570 nm. Las propiedades de absorción total de los distintos pigmentos son muy parecidas a las que se representan en la Figura 5-28. Estos son los tres receptores primarios de color que controlan la visión normal del color.
A partir de la descripción de la sensibilidad de los receptores primarios, se pueden estudiar al máximo los fenómenos de la visión del color. Por ejemplo, el disco de color sugiere que la combinación de un verde (unos 520 nm) y un rojo (unos 620 nm) daría lugar a un amarillo de unos 564 nm. ¿Cómo se relaciona esto con la sensibilidad de los conos de la Figura 5-28 ?
Supongamos que el eje vertical del gráfico representa la cantidad de excitación proporcionada a cada uno de los receptores de color por una luz de intensidad 1 00, con una longitud de onda específica en el eje horizontal. Veamos ahora lo que sucede cuando 1 00 unidades de 620 nm se combinan con l 00 unidades de 520 nm.
Cantidad de excitación de los receptores de color
A B e Rojo (620 mm) J O 2 o.o verde (520 mm) 7 1 5 0,2
Total: 1 7 1 7 0.2
2 1 6 PROCESAMIENTO DE INFORMACJON HUMANA
El total nos proporciona la excitación que recibe cada receptor cuando es excitado por 200 unidades de luz : 1 00 del rojo y 1 00 del verde. Para usar estas curvas, es necesario volver a graduar los valores. Existe un total de 34,2 unidades de excitación neural. Por tanto, A es 1 7/34,2 o el 50 % del total ; B es 1 7/34,2 o el 50 % ; C es 1 %. Volvamos ahora a las curvas de la Figura 5-28
.20
. 18
. 1 6
.04
400 440 480 520 560 600 640 680 Longitud de onda ( nm)
FIG U RA 5-28 De Wald (1964) .
LAS DIMENSIONES DE LA VISION 2 1 7
e intentemos encontrar una longitud de onda que excite A, B y C con estos porcentajes relativos. En este caso, es fácil encontrarla. El único lugar donde se excita el receptor A al igual que el receptor B, mientras que es despreciable la excitación de C, es la región entre 560 y 565 mm. La combinación se percibirá como un amarillo. El círculo del. color proporciona la misma respuesta.
A partir de estas operaciones, es evidente que es fácil, aunque pesado, calcular las cantidades relativas de estimulación para cualquier combinación de luz, que puede ocurrir en los tres receptores de color y determinar así qué otras combinaciones de luz (o iuces monocromáticas) son equiparables a esa excitación relativa. Evidentemente, cuando el círculo del color funciona, proporciona un método de cálculo mucho más razonable en la práctica .
Aun permaneciendo en la descripción del proceso del color, se plantea el problema de cómo se combinan realmente las señales de los receptores primarios por el sistema visual. Existe una larga y fuerte polémica sobre este asunto. La discusión se centra en si la información proporcionada por los receptores básicos se interpreta directamente por los centros cerebrales superiores, o si está implicada alguna etapa intermedia.
Teoría del proceso contrario sobre el color
Cuando un fragmento de gris está rodeado por un rojo, entonces toma el aspecto del color complementario al rojo -verde. El aspecto de los colores está muy afectado por el contexto de los colores cercanos. Estos fenómenos, al igual que los datos sobre colores complementarios y la ceguera al color, sugieren la existencia de procesos opuestos o contrarios que subyacen a la percepción del color. Ya en 1 878, Ewold Hering propuso una teoría del proceso contrario sobre la visión del color. En su sistema, los colores se combinan en pares complementarios : azul con amarillo, rojo converde, y negro con blanco. El juicio sobre el brillo está fundamentadoen la respuesta del mecanismo negro-blanco. Los colores aparecen como una combinación de la actividad del azul-amarillo y del rojo-verde.
En el sistema del proceso contrario, los tres receptores básicos del color, los que llamamos A, B y C en la Figura 5-29, realizan varias combinaciones. Se desconoce cómo ocurre exactamente, pero existen varias posibilidades. Por ejemplo, un esquema para combinar los tres receptores y formar un rojo-verde, un negro-blanco y un
2 18 PROCESAMIENTO DE INFORMACION HUMANA
azul-amarillo, es el que aparece en la figura. Los tres receptores están conectados a tres células neurales. Existen otras posibilidades distintas de interconexión : se supone que las investigaciones fisiológicas de los próximos años decidirán cuál es la correcta.
Aunque se desconocen los detalles exactos, el hecho de que los receptores se combinen de alguna manera similar a la mostrada en la Figura 5-29 está bien fundamentado por otras investigaciones comportamentales y fisiológicas. Por ejemplo, los estudios fisiológicos de las fibras del núcleo geniculado lateral de los monos, ponen de manifiesto que los receptores incrementan su tasa de respuesta para las luces rojas y la disminuyen para las luces verdes : exactamente el tipo de proceso opuesto postulado por la teoría. Otros receptores hacen exactamente lo contrario, incrementando su tasa de respuesta ante el verde y disminuyéndola ante el rojo (Figuras 5-30a, b y c).
Conos receptores
Células del proceso contrario
Luz
a b
a b a
Rojo (+) Verde (- )
e
b a b e a b e e a e
(- ) Negro (- ) (+) Blanco (+)
(+) Azul (+) (- ) Amarillo (-)
FIGURA 5·29 Red fisiológica, basada en De Valois y.Jacobs ( 1968).
a
(- ) (+)
También se han encontrado pares de azul-amarillo, aunque con menos frecuencia que los pares de rojo-verde (al menos en los monos estudiados hasta ahora). Esto es consistente con el hecho de que el sistema azul-amarillo es menos sensible que el rojo-verde.
Luz
Longitud de onda (nm)
LAS DIMENSIONES DE LA VISION
On
ore -------
FIGURA 5-30a
2 1 9
Tiempo -
(a) Respuestas registradas desde un sólo microelectrodo en el núcleo geniculado lateral de un mono, que muestra una célula del proceso contrario ; ( + ) : respuestas de larga longitud de onda (rojo) ; ( - ) : respuestas de longitudes de onda más cortas. (b. e) Respuestas medias de distintas clases de células opuestas en el espectro, del cerebro de un mono. Las tres curvas de cada dibujo son tres niveles de distinta intensidad (energía). en unidades arbitrarias. De datos no publicados de De Valois y DeValoís. Abromov y Jacobs (1966).
220
" .,,,
20
PROCESAMIENTO DE I NFORMACION HUMANA
,g ¡¡ Tasa espontánea 8 e ... -� ! .���§�� z o .'::::--1-
400 440 480 520 560 600 640
5 0
4 5
40
o 35 -g ::l .. 1;l
&. 30
!'6. rJ 25 " .,,, o 'O s 20
t8 '" z 1 5
1 0
680 Longitud de onda (nm)
320
Tasa espontánea
Longitud de onda (nm)
FIGURA 5-30h
LAS DIMENSIONES DE LA VISION 221
2 5
o .,,, e ::l 20 .. :t
8. .. 1 5.. ..
'IS. "' " " .,,, 10 � Tasa espontánea " 8 e " 8 '"' z
o 680 400 440 480 520 600 640 Longitud de onda (nm)
50
45
40
o 1l 35 ;:l .., 1;l ... o Q. "' 30 " .. -� " " 25 .,,, o 'g 8 e 20 " 8 -;:i z
15
1 0
ol--l.�..l-...J.�.J......J.�..1--'-�.J..._.¡�.J--J.�-"---'�-'---" � - - m - 600 � -
Longitud de onda (nm)
FIGURA 5-30c
222 PROCESAMIENTO DE INFORMACION HUMANA
Contraste inducido
Con el color, al igual que con el negro y blanco, lo que se ve en un punto afecta a la percepción de los puntos cercanos. Esto es una consecuencia de la inhibición lateral : el mismo fenómeno responsable del incremento de contraste y de las constancias del brillo. Al mirar un fragmento de azul en un lugar, se reduce la sensibilidad al azul en las áreas cercanas ; por tanto, más sensibilidad al amarillo. Al mirar un fragmento de negro, se incrementa la sensibilidad al blanco en los alrededores. Mirar un rojo aumenta la sensibilidad al verde. Estos efectos de contraste reciben el nombre ·
de contraste espacial o contraste inducido : un color induce su complementario en las regiones cercanas.
Para explicar estos fenómenos, es necesario suponer que una neurona básica, cuando es excitada, inhibe todas las neuronas circundantes de la misma clase. Es decir, cada uno de los tres receptores básicos del color · A, B y C, inhibe a los receptores A, B y C cercanos. Como consecuencia de la · forma en que se emparejan estos receptores para formar el sistema del proceso contrario, la inhibición de un receptor es equivalente a hacer más sensible al receptor contrario. El mayor efecto de contraste ocurrirá con los pares complementarios. De hecho, los pares complementarios de colores pueden modificarse mucho en el proceso de la visión. Entre otras cosas, el color inducido que está provocado por interacción espacial puede hacer que un color parezca más intenso, más estructurado que lo que debería ser (ver Figura 5-31 , pág. 226d).
Examine los corazones verdes de la Figura 1 -49, pág. 226a. Fíjese en el punto negro para conseguir una posimagen �fljese hasta que los colores oscilen un poco. Ahora mire la superficie blanca. Verá una posimagen de corazones rosa, pero ¿por qué está presente el verde? El verde es inducido.
Accidentalmente, ahora ya sabe por qué los colores oscilan cuando se mira fijamente la escena durante largo tiempo. El temblor ocurre en los límites de la pintura. Los pequeños e inevitables movimientos del ojo hacen que esta parte de la pintura oscile hacia los lados, de forma que la imagen no está fija: fluctúa entre los dos colores a ambos lados de los límites. De esta forma, cuando se fatigan algunos receptores por la fijación de la mirada, los receptores correspondientes a los límites no están fatigados y están sujetos a los efectos del contraste. El resultado es que los límites se adaptan diferencialmente, produciendo percepciones temblorosas.
El color inducido es tan poderoso que al menos un experimenta-
LAS DIMENSIONES DE LA VISION 223
dor, Edwin Land de la Polaroid Corporation, ha demostrado que casi la totalidad de los colores percibidos puede originarse por medio de la combinación de dos colores. Durante cierto tiempo, las demostraciones de Land sobre la visión del color, creados por sólo dos primarios, atrajo la atención de los que mantenían teorías de tres colores. Pero actualmente parece que los efectos son el resultado de complicadas aplicaciones de los principios del sistema del color contrario y de los efectos del contraste espacial. Los dos colores que usa Land no tienen longitudes de onda monocromáticas ; por el contrario, son bandas de larga longitud de onda. Con dos luces monocromáticas, no se percibe el espectro total del color. Más importante aún, los colores de Land necesitan una gran combinación de objetos, un requisito diseñado para resaltar el efecto de colores inducidos. Con proyecciones simples y homogéneas de luces, los colores de Land son idénticos a los esperados por el disco de colores.
LECTURAS RECOMENDADAS
La parte inicial de este capítulo se centró sobre el papel de la inhibición lateral y las interacciones resultantes de excitación en diferentes puntos del campo visual. Para esta materia, es crucial la lectura de tres libros. Uno, el libro de Ratlíff Mach Bands
• ( 1 965) es una introducción excelente a la inhibición lateral; a la obt�nción de datos psicológicos relevantes para su análisis, y a una amplia serie de enunciados de interés psicológico y fisiológico, que resultan del estudio de este fenómeno. El segundo, el libro de Georg von Békésy Sensory /nhibition ( 1 967) amplía los fenómenos de inhibición lateral para cubrir una gran cantidad de sistemas sensoriales, incluyendo el gusto y el olfato. Este es un libro fascinante, intercalado con observaciones sobre la forma en que un científico debe actuar en el estudio de este campo. Si le parece que vamos muy lejos en nuestras recomendaciones de los libros de Ratliff y Békésy, probablemente acierta, pero lo hacemos por buenas razones.
Finalmente, el libro de Comsweet Visual Perception ( 1970) muestra cómo aplicar los mecanismos de inhibición lateral a los fenómenos que se encuentran en la percepción visual. El libro de Cornsweet es el mejor tratado que hemos visto sobre la conducta del ojo a nivel de procesos retinianos. Además, presenta en una forma
224 PROCESAMIENTO DE INFORMACION HUMANA
muy completa e inteligible los resultados de los conceptos más recientes sobre el análisis espacial Fourier, para la comprensión de materias como la constancia del brillo y la fluctuación crítica. Estas son hipótesis importantes, y el estudiante avanzado hará bien en estudiar con cuidado las últimas secciones del libro de Cornsweet. (Cornsweet también proporciona un tratamiento único y muy inteligible sobre la visión del color. Sin embargo, es mejor no intentar leerlo a él y a nosotros al mismo tiempo. Utilizamos sistemas distintos para discutir este fenómeno. Aunque el lector experimentado sería capaz de seguir ambas discusiones, el lector principiante probablemente se confundiría).
Las referencias básicas sobre discusiones técnicas y completas sobre la visión y la percepción visual a un nivel avanzado, aparecen en varios capítulos de The Handbook of Experimental Psychology, editado por Stevens ( 1 951 ) , y en el libro Experimental Psychology de Woodworth y Schlosberg ( 1954). Todo el libro editado por Graham ( 1 965) es importante para la visión. Estos son libros avanzados, un poco antiguos, pero muy completos.
El experimento sobre los efectos de los indicios dt- profundidad en el brillo fueron realizados originalmente por Hochberg y Beck ( 1954). Un análisis más reciente de este fenómeno, se puede encontrar en el artículo de Flock y Freedberg ( 1 970), y aunque el trabajo es bastante técnico, merece la pena el esfuerzo, puesto que presenta diversas teorías alternativas (al mismo tiempo que muchas referencias).
Existe cierta cantidad de interesantes estudios sobre el contraste del brillo. Un resultado particularmente interesante lo proporciona Coren ( 1 969), que muestra cómo puede cambiar el contraste de brillo en función de como se mire una figura : es decir, si se proporciona otra interpretación a una figura ambigua, se puede alterar el contraste de brillo. Existe una revisión de este fenómeno en el artículo de Festinger, Coreo y Rivers ( 1 970). Otro artículo importante sobre el fenómeno conocido como el Efecto Gelb, es el análisis de Mershon y Gogel ( 1 970). Un libro excelente sobre la constancia del brillo es el de Hurvich y Jameson ( 1966).
Algunos fenómenos visuales importantes, que no están tratados en este libro, se discuten en el de Hochberg, Perception ( 1 964). Además, el artículo de Harris ( 1965) discute la recuperación de la visión después de mirar el mundo a través de prismas de distorsión. Esta es una materia muy sugestiva, y Harris no solo proporciona una buena revisión, sino que también ofrece referencias bibliográficas. El trabajo de Julesz ( 1 960, 1 964) proporciona una introducción
LAS DIMENSIONES DE LA VISION 225 particularmente nueva e importante a algunos de los problemas de percepción espacial tridimensional. Su libro es especialmente importante (Julesz, 1971 ) y, además, es muy agradable, principalmente cuando se ven sus imágenes tridimensionales a través de los lentes coloreados que vienen con el libro. El artículo de Enright ( 1 970) sobre la ilusión conocida como el «Péndulo Pulfrich» también es importante, combinando la discusión de una ilusión visual, la discusión de la percepción de profundidad y el cálculo de la tasa de respuesta de la retina ante señales visuales. Como siempre, el Annual Rewiew of Psychology proporciona una buena introducción sobre esta materia : es interesante el artículo de Bishop y Henry sobre «Spatial Vision» ( 1 97 1 ).
Visión del color
La visión del color es un enigma. Aunque es evidente la importancia de la materia, es dificil o imposible encontrar libros que traten este asunto de una manera inteligible. Comsweet ( 1 970) se acerca bastante, pero su tratamiento no es compatible con el nuestro, como ya lo mencionamos. El libro de Graham ( 1 965) contiene la mayor parte de la información importante, pero es bastante dificil de comprender. Quizá el mejor tratado sea el de LeGrand ( 1957) . Desgraciadamente, no incluye una gran parte del trabajo actual. Pero es posible que lo mejor sea comenzar con LeGrand y después estudiar la bibliografia que proporciona.
Se puede encontrar una buena revisión de la literatura en el Annual Review of Psychology, en el artículo de Ripps y Weale ( 1969) «Color Visión». El libro de Wyszeckí y Stiles ( 1 967) contiene una buena compilación de los hechos sobre la visión del color. Algunos trabajos representativos son el de DeValois y Jacobs sobre la visión del color en primates ( 1 968), y el de Jameson y Hurvich sobre los procesos del color contrario ( 1 962).
226 PROCESAMIENTO DE INFORMACION HUMANA
FIGURA 1-46
Si se mira fijamente el centro de esta pintura, a una distancia aproximada de 15 cm. sin mover los ojos, los círculos llegan a desvanecerse. Para una explicación ver Figura 1-47. ( Peter Sedgley, Looking Glass Suite, No. 9, Litografia. Colección: D. A. Norman.
FIGURA 1 �49
Mire el punto negro del recuadro izquierdo, con la cabeza y los ojos fijos, hasta que la figura completa comience a difuminarse. Después, mire el punto negro de la derecha, el que está en el área blanca. VeFá corazones rosas sobre un fondo verdoso. (Pestañear unas cuantas veces, ayuda a obtener la posimagen) . El rosa es una posimagen. El verde es «inducido». (Modificación de The Color Tree, lnterchemical Corp. , Nueva York, 1965) .
226 a
•
' � � ·
226 b
Longitud de onda t mi
EL ESPECTRO ELECTROMAGNETICO 100 Íl l it .01 ít
h \1 J!1 J ( \ \1!( l{I) <>'-])\'-,
- - - - -
.0001 ft l nm .001 nm .00001 nm
- - - - - - --- - - - - - - ---- ..... ..... ..... ..... . - - -
1 1 ! 1 , 1 1 . o o e( � < o:: u. :z 1
IJI... TRA VIOLETA ..........
600 500 fOO 300 Longi1ud de- ·onda tnan6metrbs> /
/ /
// /
I / / / /
/ "'"?:" N'<;
.:..'º .._<i;
/ /
/ /
/
FIGU RA 4- 1
226 e
F I G U RA 5-19
Hoja de Purkinje : Diferencia entre la sensibilidad visual nocturna y diurna (visión de bastones y conos) . Normalmente, las flores rojas y azules son visibles por igual, aunque el rojo aparece más brillante q�� el a;u/. Las dos se ven con visión de cono. Después de mirar ·la pintura durante unos 5 min. con luz muy oscura, la flor roja ya no será visible: sólo se verá la azul. Si la luz es suficientemente oscura, sólo actúa ta visión de bastones. Se puede. acelerar el efecto mirando las flores fuera del ángulo del campo visual, fijándose en el centro de la flor roja. De esta forma. el rojo cae dentro del área de la retÚ10 que tiene una creciente densidad de conos y el azul cae · dentro del área que tiene creciente densidad de bastones. (Modificación de The Color · Tree; lnterchemical Corp. , Nueva York, 1965) .
226 d
•
FIGURA 5-31
Mire atentamente el punto de .fijación en el medio de la pintura inferior. La figura se dif�minará y desaparecerá parcialmente. Ahora mire el punto de.fijación del rectángulo superwr. los anillos Y el fondo se verán con los colores complementarios. (Modificación _ de The Color Tree, lnterchemica/ Corp. , Nueva York, 1965) .
6 EL SISTEMA AUDITIVO
LA FÍSICA DEL SONIDO : La frecuencia del sooido.-La intensidad del sonido.-Decibelios.-LA MECÁNICA DEL OÍDO : El oído interno.-Los movimientos de la membrana· basilar.-Las células ciliares.-REsPUESTAS ELÉCTRICAS AL SONIDO: Curvas de sintonizacion.-Codificación temporal de respuestas neurales.-Codificación de la intensidad de información.-Procesamiento de la información acústica.-Detectores de frecuencia de barrido.-LECTIJRAS RECOMENDADAS .
El oído humano es terriblemente complicado. Por su apariencia externa, está compuesto de un conducto que comunica el mundo externo con una pequeña membrana interna, el tímpano. Las vibraciones del aire hacen que el tímpano vibre. Sin embargo, estas partes externas del oído, la oreja, el canal auditivo y el tímpano, son los componentes menos importantes de la operación auditiva. La vibración del tímpano en respuesta a los cambios de las presiones del aire, sólo es el comienzo de una larga cadena de acontecimientos, que en última instancia producen nuestra percepción del sonido.
El proceso de obtención del sonido a través del oído, para crear señales neurológicas, entraña un detallado conjunto de pasos bastante complicados. Examinemos las Figuras 6-1 y 6-2. En primer lugar, Ja onda sonora que llega al oído atraviesa el canal auditivo y provoca la vibración de la membrana final -el tímpano. Esta vibración se transmite a través de los tres pequeños huesos del oído medio a otra membrana, la ventana oval. Esta ventana es una abertura ósea en forma de espiral del oído interno, la cóclea. Los líquidos de Ja cóclea se ponen en actividad por los movimientos de la ventana oval que, a su vez, provoca Ja vibración de una membrana que descansa a lo largo de la espiral interna de la cóclea. La vibración de esta última membrana, la membrana basilar, es recogida por las distintas filas que están a lo largo de la membrana, provocando la creación de impulsos neurales en la'S células a las que están conectadas, transmitiendo la información acústica al cerebro. Cada componente de esta extraña vía tiene una buena razón de existencia. Nuestra tarea consiste en descubrir cómo contribuye
228 PROCESAMIENTO DE INFORMACION HUMANA
-----
FIGURA 6-1
cad� uno de estos componentes al desarrollo del mensaje neural e�viado a lo
_ largo del nei:io auditivo hasta el cerebro y después'.
como,s� descifra ese mensaje en la experiencia psicológica de sonido,
de mus1ca y de lenguaje.
EL SISTEMA AUDITIVO 229
FIGURA 6-2
LA FÍSICA DEL SONIDO
El sonido está compuesto de variaciones de pres10n. Cuando un objeto «hace ruido», provoca ondas de presión que se propagan a través del medio ambiente. Las presiones del sonido medidas a ciert;=t distancia de la fuente del sonido, crean una imagen imperfecta de las presiones del sonido originadas inicialmente. En parte, esto ocurre porque las ondas han sido atenuadas en su viaje por el aire y, en parte, por los distintos tipos de reflexiones y refracciones provocadas por los objetos encontrados en el recorrido de las ondas.
La frecuencia del sonido
En el tipo más simple de sonido, las variaciones de pres10n del aire producen unas formas similares a las de la Figura 6-3.Se tienen que especificar tres cosas para describir estas formas ondulatorias (ondas sinusoides) : la rapidez con la que varían (su frecuencia) ; la magnitud de la presión que producen (su amplitud) ; cuándo se inician (su fase). En general (con las excepciones que mencionaremos más adelante), a mayor amplitud de la onda sinusoide, más fuerte es el sonido ; cuanto mayor es la frecuencia, más alto es el tono. Una onda sinusoide con una frecuencia de 261 ,63
230 PROCESAMIENTO DE INFORMACION HUMANA
ciclos por segundo, por ejemplo, tiene un tono de media e en la escala musical. Un ciclo por segundo recibe el nombre de un Hertz (Hz) 1 •
A sen(27t//)
La frecuencia es igual al número de periodos por segundo t = Tiempo (seg) A Amplitud f = Frecuencia en ciclos por segundo (H7}
FIGURA 6-3
Aunque la descripción de las variaciones temporales en la presión del sonido, producen un panorama completo del sonido, a menudo es más conveniente describir las ondas de una manera completamente distinta. Observe las presiones del sonido representadas en las Figuras 6-4 y 6-5. Estas complejas ondas temporales son dificiles demanejar. Se pueden tratar más fácilmente analizando la onda compleja en simples componentes elementales, es decir, las ondas sinusoides ya mencionadas. Su fundamentación está basada en un teorema del matemático Fourier ( l 768-1 830), que demostró que cualquierforma ondulatoria compleja (con ciertas limitaciones) puede representarse mediante una combinación de ondas sinusoides de frecuencias e intensidades específicas : la descompo.'lición de una forma ondulatoria en sus frecuencias componentes indiviquales recibe el nombre de análisis Fourier (Figura 6-6).
La representación de las ondas complejas mediante sus componentes sinusoides, parece que también es más compatible con la manera en que el oído elabora realmente los sonidos. De hecho, parece que el oído realiza un burdo análisis Fourier consigo mismo. Si un tono de 440 Hz (alrededor de media C) se produce juntocon un tono de 698 Hz (una F), la combinación se escucha como
1 La unidad de frecuencia viene del nombre del fisico alemán Heinrich R.
Hertz ( 1857- 1 894). La frecuencia se específica normalmente en kilohertz (kHz) donde un kHz es igual a I OOO Hz.
'
FIGURA 6-4
De Denes y Pinson (1963).
FIGURA 6-5
De Denes y Pinson (1963).
EL SISTEMA AUDITIVO
~ Frecuencia -(kHz)
J� Frecuencia -(kHz)
l 2 3 .¡ Frecuencia (kHz)
23 1
dos notas: tocadas juntas, como un acorde, no como un sonido único. ESte hecho impresionó al físico alemán Georg Ohm ( 1 787- 1854), de forma que la correspondencia entre lo que se escuchay la representación de los sonidos en términos de sus distintos componentes de frecuencia, se ha llegado a conocer como la Ley de Ohm. (Este es el Ohm que proclamó la Ley de Ohm de electricidad ; el mismo Ohm, pero distinta ley.) Las cosas son bastante distintas con la luz. Cuando una luz de una frecuencia que se ve toja (una longitud de onda de 671 nm) se combina con una luz que se ve verde (una longitud de onda de 536 nm), la combinaciónresultante es una luz que se ve amarilla (una longitud de onda de 589 nm). A diferencia del sistema auditivo, el sistema visual no mantiene separadas las distintas frecuencias que inciden sobre él : las formas ondulatorias visuales se combinan en el ojo, sin dejar ninguna huella de los componentes individuales.
232
A
8
e
o
E
F
G
H
PROCESAMIENTO DE INFORMACION HUMANA
Ondas sinusoides individuales
Suma de las seis ondas sinusoides anteriores
Suma de un númeroinfinito de ondas sinusoides, como las seis primeras· mostradasmás arribe
La intensidad del sonido
Como ocurre con las intensidades de luz, la diferencia de intensidad de sonido entre el más débil que puede escucharse y el que produce dolor fisico, es terriblemente grande. Con 2000 Hz, porejemplo, el sonido más intenso que se puede tolerar es alrededor de mil billones más intenso que el sonido más débil detectable. Este enorme recorrido de intensidades dificulta la descripción directa de las intensidades de sonido. Normalmente, esta amplitud se comprime describiendo las intensidades del sonido en decibelios.
DECIBELIOS
EL SISTEMA AUDITIVO
Sonido
Lanzamiento espacial tripulado (a 30 metros)
Umbral de dolor
Sonidos fuertes : banda de rock
Vocerío
Conversación
Susurrar
Umbral auditivo, con 1000 Hz
Sonido
Nota inferior del piano Nota inrerior de un bajo Nota inferior de un clarinete Media C de un piano Tono típico para afinar A anterior a media C Rango superior de soprano Nota superior del piano Armónicos de instrumentos musicales Límite de audición de personas maduras Límite de audición
TABLA 6-1
Intensidad (dB)
200 • 1 80
160•
140•
1 20 • 100• 80
60 40
• 20
• o
Frecuencia (Hz)
27.5 100 1 04,8 261,6 440
1 .000 4. 1 80
10.000 1 2.000
16.000-20.000
233
l . Al duplicar (o dividir por dos) la razón de intensidades de señal, sumar (o restar) 3 dB.
2. Al multiplicar (o dividir) la razón de intensidades de señal por 1 0, sumar (o restar) 1 O dB.
3. Si dos sonidos se diferencian en 10 dB, su razón de intensidades es 1 0n. Por ejemplo, una diferencia de 60 dB en las intensidades de dos sonidos, significa que un sonido es 1 06 ( 1 millón) veces más intenso que el otro.
4. Puesto que los decibelios hacen referencia a la razón de dos intensidades, decir que una señal tiene un nivel de 65 dB, carece por completo de significado a no ser que se conozca el sonido de comparación. En general, cuando aparece un enunciado de esta forma, significa que el sonido es 65 dB más intenso que el nivel de referencia típico internacional de 0,0002 dinas cm - 2• Este nivel
234 PROCESAMIENTO DE INFORMACION HUMANA
es una intensidad muy baja de sonido. Aproximadamente, es la intensidad mínima de sonido que puede detectar un observador humano con un sonido de 1 000
Hz.
Decibelios
Cantidad de dB IO log (1/1,)
111. dB /fl. dB
0,0001 -40 1 0000,0 40
0,001 -30 1 000.0 30
0,01 0 -20 1 00,0 20
0,032 - I S 3 1 ,6 1 5
0, 1 0 --10 1 0,0 1 0
0,1 3 -9 7,9 9
0, 1 6 -8 6,3 8 0,20 -7 s,o 7
0,2S -6 4,0 6
0,32 -S 3,2 5
0,40 -4 2,5 4
0,50 -3 2,0 3
0,63 -2 1 ,6 2
0,79 -1 1 ,3 l
1 ,00 o 1 ,0 o
LA MECÁNICA DEL OÍDO
El oído interno
Para el psicólogo, la parte más importante del oído es una pequeña estructura ósea en forma de caracol, localizada en el oído interno, llamada cóclea. La cóclea es un conducto, enroscado 2! veces (en e l hombre) y relleno de una solución salina. En el hombre, la cóclea tiene aproximadamente el tamaño de un terrón de azúcar -unos 0,50 cm. de largo por 1 cm. de ancho.
Existen dos aberturas en el hueso que rodea la cóclea. La primera, una pequeña membrana llamada ventana oval, está conectada al último hueso del oído medio. Las vibraciones del tímpano pasan desde los huesos del oído medio a la cóclea, a través de esta membrana. Como la cóclea está rellena de un líquido que no se puede comprimir, se tienen que utilizar otros medios para amplificar las presiones originadas en la ventana oval. Esto se consigue por medio de otra pequeña abertura en la estructura ósea, cubierta
EL SISTEMA AUDITIVO 235
también por una delicada membrana. Esta es la abertura que se encuentra en la parte posterior de la cóclea -la ventana redonda.
.. .. ..
FIGURA 6-7
FIGURA 6-8
236 PROCESAMIENTO DE INFORMACION HUMANA
Membrana basilar
F I G U RA 6-9
El interior de la cóclea es un mecanismo muy complicado, cuya finalidad es convertir las variaciones de presión de entrada, en señales eléctricas del nervio auditivo. Es muy fácil examinar este mecanismo si desenrollamos la cóclea (lo que es posible gráficamente, pero no fisicamente), de forma que se pueda ver el interior, como en la Figura 6-9.
Las dos membranas que aparecen a lo largo de la cóclea, la dividen en tres regiones distintas, cada una de las cuales está rellena de un líquido. La membrana que tiene más importancia para nuestra discusión es la membrana basilar. (Figura 6-1 0). Esta membrana se extiende desde el comienzo de la cóclea (la base) , donde los huesos del oído medio hacen vibrar la ventana oval, hasta muy cerca del final del extremo interno (el ápice) de la espiral. En el ápice existe un pequeño espacio entre la membrana y las paredes de la cóclea. Cuando se despliega, la membrana basilar tiene unos 3,5 cm. de largo, con un ancho que se incrementa desde la ventana oval hasta el ápice. Este incremento en el ancho juega un importante papel en su funcionamiento.
Los movimientos de la membrana basilar
La presión ejercida hacia el interior de la ,.ntana oval, produce una presión en los líquidos de la membrana basilar, que se extiende instantáneamente por toda la membrana. (La onda de presión sólo necesita unas 20 millonésimas de segundo para recorrer toda la cóclea). De esta forma, la actividad producida en la �embrana basilar no depende del extremo de la cóclea que se estimula. Si el sistema se pusiera en actividad en el ápice, en lugar de hacerlo en la ventana oval, funcionaría de la misma manera.
EL SISTEMA AUDITIVO 237
FIGURA 6- 1 0
La misma membrana basilar no reacciona inmediatamente a la presión que se le aplica. Cuando se observa la membrana donde la ventana oval comienza a vibrar, produce la sensación del recorrido de una ola que se desplaza : primero se encorva en el extremo de la ventana oval, después la onda recorre gradualmente la membrana hacia el ápice. La onda tarda varios milisegundos en ir de un extremo a otro de la membrana basilar. La distancia que recorre y la velocidad con la que se mueve, dependen de la frecuencia de la onda sonora.
La onda que se desplaza es el resultado de las propiedades elásticas de la membrana. Recuerde que la membrana incrementa su grosor a medida que va de la ventana oval hasta el ápice. También incrementa su rigidez, siendo unas 1 00 veces más dura en el ápice que en la ventana oval. Estos factores, combinados con la geometría de la cóclea, hacen que el tamaño de la onda producida por un sonido se incremente gradualmente, a medida que se aleja de la ventana redonda. El punto donde alcanza su má-
238 PROCESAMIENTO DE INFORMACION HUMANA
ximo tamaño depende de la frecuencia del sonido. El desplazamiento desciende rápidamente a medida que la onda continúa hacia el final de la !llembrana. En tonos de alta frecuencia, el �esplazamiento máximo de la membrana basilar se produce cerca de la ventana oval, y a partir de aquí existe ya muy poca actividad en el resto de la membrana. En tonos de baja frecuencia, la onda recorre todo el camino hasta el ápice, alcanzando su cima justo antes del final de la membrana (Figuras 6- 1 1 y 6- 1 2).
FIGURA 6- 1 1 De Rasmussen y Windle (1960) .
La vibración convierte las distintas frecuencias de sonido en actividad de determinados lugares de la membrana basilar. Esta recodificación de la frecuencia de una señal acústica en un lugar determinado de vibración a lo largo de la membrana basilar, es lo que se intenta señalar mediante el enunciado «El oído realiza un análisis Fourier de la señal de entrada».
Las células ciliares
En realidad, la membrana basilar es un fragmento de piel y, como piel, tiene células cifü,res. Estas células ciliares son parte de una compleja estructura llamada órgano de Corti (Figura 6- 1 3), localizada en la cúspide de la membrana. En los humanos, existen aproximadamente unas 25.000 de estas células, ordenadas en dos subdivisiones y divididas por un arco. Las células del lado del arco más cercanas al exterior de la cóclea, se llaman células ciliares externas y están ordenadas en tres filas a cinco cada una. Las células ciliares del otro lado del arco se llaman células ciliares internas. Normalmente, aparecen en una única fila. Existen unas 25.000 células externas y cualquiera de ellas puede tener hasta unos cien filamentos sobresaliendo. Sólo existen unas 3.50Ó células internas.
EL SISTEMA AUDITIVO 239
FIGURA 6-12
Como se puede suponer por la forma en que están emparedadas entre las dos membranas del órgano de Corti·, cualquier movimiento de la membrana basilar hace que las células ciliares se doblen y retuer.ian. Además, puesto que las membranas están aseguradas, habrá más movimiento asociado con las células ciliares externas que con las células internas. La tensión y la fuerza ejercidas sobre las células ciliares, tí1Ícia la actividad neural en las fibras que están conectadas a �'tías, comenzando el flujo de impulsos eléctricos hacia d nervi.0 auditivo.
240
FI G U RA 6-13
PROCESAMIENTO DE INFORMACION HUMANA
Cóclea humana (seccionada)
Ampliación de la sección de la cóclea, que muestra la c��-��.::::;;;_ __ .J posición del órgano de Corti y la salida del nervio au
-�-�.tit':v
Registro fotográfico con microscopio electrónico del órgano de Corti. x . 370. Fotograjia de Bredberg, Linderman, A des, West Y Engstrom ( 1970).
REsPUEST AS ELÉCTRICAS AL SONIDO
Por muy elegantes que sean las respuestas mecánicas del oído,
no tendrían ningún valor si no existiese alguna forma de convertir
esta actividad en señales que puedan usarse por el sistema nervioso.
Las respuestas mecánicas convierten la frecuencia e intensidad auditi
va en formas de vibración a lo largo de la membrana basilar.
De esta forma, las células nerviosas pueden analizar esta informa
ción, transmitiendo la señal hacia el cerebro.
Curvas de sintonización
Mediante una cuidadosa operación quirúrgica, se puede . insertar
un pequeño electrodo en el nervio .auditivo, de forma que registre
EL SISTEMA AUDITIVO 241
los impulsos que tluyen hacia una fibra auditiva única. Lo primero que se observa es que la fibra no está en descanso. Aun cuando no se le presente ningún sonido, responde espontáneamente con unos 1 50 impulsos por segundo. Esta actividad fundamental o espontánea en ausencia de cualquier señal externa es una característica de casi todos los tipos de neuronas sensoriales.
El primer paso en la investigación de la neurona consiste en determinar a qué tipo de señales responde. Comenzamos presentándole un tono puro de intensidad moderada y frecuencia alta, por ejemplo l 0.000 Hz, y después disminuimos lentamente la frecuencia. Al principio, la neurona no parece observar el tono ; continúa actuando con su tasa espontánea. Cuando la frecuencia alcanza determinado rango crítico, la respuesta de la neurona se incrementará, alcanzando su techo en una frecuencia específica llamada frecuencia crítica. A medida que continuamos disminuyendo la frecuencia, la actividad de la neurona se convierte de nuevo en menos fuerte, hasta que finalmente regresa a su tasa fundamental espontánea. La respuesta de la unidad a las distintas frecuencias se parece al siguiente gráfico :
1 50
� 1 20 o "" e
� Sli � � 90 ::i -o. o � o." - V) 60 �.� .. o. � E
1- '=- 30
25 1 00 400 Frecuencia (Hz)
F I G U R A 6- 1 4
Tasa fundamental espontánea
1 600
Esta unidad particular parece que es más sensible a un tono cuya frecuencia es de 400 Hz. En las frecuencias superiores a 400 Hz, su tasa de respuesta disminuye rápidamente. En las frecuencias inferiores, la tasa de respuesta cambia más lentamente con la modificación de frecuencias.
Esta es exactamente la forma de respuesta que esperamos, cuando la neurona que estamos registrando reacciona directamente a la
242 PROCESAMIBNTO DE INFORMACION HUMANA
cantidad de actividad de una determinada región de la membrana basilar. Supongamos que la neurona está registrando las respuestas de células ciliares de una región a unos 24 mm. de la ventana oval. La vibración máxima de la membrana se produce en este punto, donde se presenta un tono de 400 Hz. Pero se producirá cierta actividad en este ,punto, cuando se presentan frecuencias distintas de 400 Hz. Presentamos aquí un diagrama de la amplitud de la vibración de frecuencias, que van desde 25 hasta 1 600 Hz. A la derecha, se representa la amplitud de la membrana en función de la frecuencia.
25 Hz
/ Cantidad de vibración
_¡__ / Membrana basilar
•• --, --_..../Células ciliares a lo largo de la membrana
L----- Localización del electrodo de registro
50 Hz .......... �--__,.. •• �.--.-.·
100 Hz
200 Hz
400 Hz
800 Hz
........... •• -----.L..-----................. , .-- .'-_) __
_
... -, _ ... \ ,,- t ... _'
_
• __ _ .......... -, ........ tL'•----
25 1 00 400 1 600 frecuencia (Hz)
1 600 Hz .......... "'·\ .. Ó I 1b :zlf
'-_
J_
o
_
m
_
m
_
a_
lo
-
largo de la membrana
Ventana oval
Codificación temporal de las respuestas neurales
FIGURA 6- 1 5
Hasta ahora sólo nos hemos interesado por e l número de impulsos neurales producidos por una señal determinada. Pero también son importantes las formas temporales de la actividad de neuronas
EL SISTEMA AUDITIVO 243
individuales. Consideremos una célula neural, con una frecuencia crítica de 500 Hz. Esta señal realiza un ciclo completo de presiones de sonido en 2 mseg. Los impulsos de la célula reflejan las propiedades temporales de la frecuencia crítica : et intervalo entre impulsos es aproximadamente de 2 mseg : la célula dispara en sincronía con su señal. Algunas veces, no aparecerá un impulso en el momento adecuado, pero cuando reaparece, de nuevo estará sincronizado con los ciclos respectivos de la señal externa. En resumen, un tono de 500 Hz tiende a producir una respuesta regular de 500 impulsos por segundo.
Aun cuando la célula no pueda disparar tan rápidamente como su frecuencia crítica, todavía se mantiene la sincronía. Supongamos que una célula ton una fre<,:uencia crítica de 500 Hz sólo puede emitir un máximo de 250 ó 1 25 impulsos por segundo. Responderá con una frecuencia que es un divisor de la frecuencia de la señal, digamos 250, 1 25 o hasta 67,5 impulsos por segundo. Ante un tono de 500 Hz no responderá con 73 ó 1 8 7 impulsos por segundo.
Esta actividad sincronizada es previsible si consideramos la forma de vibración de la membrana basilar. Cuando la membrana se mueve hacia adelante en respuesta a un cambio de presión, empujará las células ciliares emparedadas entre ella y la membrana anterior, iniciando el impulso neural. No se produce ninguna respuesta cuando la membrana retrocede. El movimiento hacia adelante se produce cuando se reduce la presión en los líquidos anteriores a la membrana, lo que sucede cuando la ventana oval se retira en la fase de baja presión de las señales (rarefacción) .
La capacidad de las neuronas individuales para seguir los cambios de presión de una señal de entrada, sugieren la existencia de una forma de frecuencia de codificación. La frecuencia de la señal puede estar directamente determinada a partir de la tasa de impulsos o desde el intervalo medio entre impulsos. El hecho de que las fibras individuales no sean capaces de ir paralelas a los cambios de presión en una señal determinada (principalmente en las frecuencias altas) no es ningún problema. Una gran cantidad de fibras están implicadas en el registro de cualquier región determinada de la membrana basilar, un nervio aislado puede pasar por alto unos cuantos ciclos, pero los nervios cercanos que están respondiendo con la misma frecuencia solucionarán probablemente estos errores. Cuando se consideran en conjunto las respuestas de todas las unidades, parece existir una sucesión ininterrumpida de impulsos en cada una de las fases de rarefacción de la señal.
Esto es precisamente lo que se ve en los registro$ fisiológicos..
244 PROCESAMIENTO DE INFORMACION HUMANA
La actividad aumenta y disminuye regularmente y al mismo t iempo que los cambios de presión de la señal. El nervio auditivo parece que es capaz de seguir señales con frecuencias tan elevadas como 3.000-4.000 Hz; tales frecuencias son bastante superiores a la tasa de respuestas que puede alcanzar una unidad aislada. Más allá de 4.000 Hz, la respuesta cíclica regular del nervio auditivo se convierte en un impulso continuo y desorganizado (Figura 6- 1 6).
Fibra e
Fibra d
Fibra e
Fibras a-f
FIGURA 6-1 6 Teoría de la «descarga». Cada ciclo de la onda sonora provoca
una respuesta al menos en una fibra del conjunto. de forma que la frecuencia del
estímulo está representada en Ja forma combinada. Con intensidades superiores del
Pstímulo (debajo) . responde más de una fibra en un ciclo determinado. De Wever
( 1970) .
EL SISTEMA AUDITIVO
Codificación de la información de intensidad
245
Las respuestas neurales del nervio acústico son mucho menos complejas ante los cambios de intensidad que ante los cambios de frecuencia. Básicamente, sí la frecuencia se mantiene constante mientras que la intensidad incrementa, entonces sube la tasa de respuestas de las unidades. Naturalmente, no pueden subir indefinidamente. De hecho, una célula aislada puede comenzar con un nivel espontáneo de unas 200 respuestas por segundo, y después incrementar su tasa hasta, por ejemplo, 300 respuestas por segundo cuando la intensidad se modifica en 1 O dB, pero no se produce ya ningún incremento en la tasa pór más que se eleve la intensidad. De esta (orma, el rango �n que las células codifican la intensidad de la señal es relativamente pequeño en comparación con el rango total de la audición . . Por otra parte, existe una gran variabilidad tanto en las tasas fundamentales como en las reacciones de las células individuales ante el incremento de intensidad de la señal.
Naturalmente, el incremento en la tasa de actividad de una célula todavía puede mantenerse sincrónicamente a las ondas sonoras. Así, si una célula individual tiene una tasa espontánea de disparos de 200 impulsos por segundo, reaccionará a un sonido, en primer lugar, cambiando la actividad espontánea y aleatoria en otra sincronizada con la señal, y después incrementando el número de impulsos neurales que produce ante el sonido -sin embargo, siempre mantiene la sincronía.
Cuando los nervios auditivos han codificado la frecuencia básica y la intensidad de información, la señal se encuentra ya en el camino hacia el cerebro. Ocurren una serie de cosas cuando la señal realiza su recorrido. Se extrae la información auditiva específica, se produce la localización de la fuente de sonido y se realiza una tosca determinación de la fuerza y componentes armónicos del sonido (Figuras 6- 1 7 a y b ) .
Procesamiento de la información acústica
Como hemos visto en los capítulos anteriores, las neuronas del sistema visual reaccionan ante características significativas .de la señal visual. Existe una jerarquía de detectores neurales especializados, desde unidades centrales-periféricas, hasta células simples, complejas e hipercomplejas. Pero ¿qué sucede en el sistema auditivo?
246 PROCESAMIENTO DE INFORMACION HUMANA
Señal en el oído ·izquierdo
--1-- Corteza auditivaCuerpo geniculadomedial Colículoinferior
-+-��- Señal en el oído derecho
Núcleo coclear
Oliva superior
FIGURA 6- 1 7 (a) Superior : Vía hacia la corteza auditiva del oído. Sección
posterior del cerebro.
¿Qué le ocurre al mensaje auditivo cuando recorre el camino desde el oído hasta el cerebro ?
La respuesta es decepcionante, porque conocemos muy poco sobre la naturaleza del procesamiento neural auditivo. En cierto sentido, nuestra carencia de conocimientos refleja nuestra incapacidad de comprensión del análisis del reconocimiento de formas. En las señales visuales, es bastante evidente que las líneas y contornos: ánguios y movimientos, deben jugar un papel importante en el reconocimiento de formas. Pero ¿cuáles son las características análogas del reconocimiento auditivo ? ¿Son los tonos puros o los oomplejo:s., los estables o los que cambian ? No lo sabemos.
iJa 111n11:turaleza del lenguaje humano apunta razonablemente hacia la :exiiSl:.encia de detedores de sonido especializados para tratar con
EL SISTEMA AUDITIVO
FIGURA 6-1 7 (b} Derecha: Visión del tronco cerebral, mostrando las
localizaciones de los núcleos descritos en (a).
247
él. La naturaleza completa del habla parece conformada por las peculiaridades del aparato vocal y auditivo, pero se desconoce cómo los mecanismos auditivos pueden extraer las características del habla . .Verdaderamente, la mayoría de los experimentos fisiológicos de la audición se realizan en gatos y monos, pero aun cuando estos animales no tienen habla, se supone que sus mecanismos auditivos deben mostrar alguna característica única de su sistema de reconocimiento de formas.
Es bastante evidente que tiene que ocurrir algun tipo de análisis complejo en las neuronas de la corteza auditiva. La evidencia proviene del hecho de que alrededor del 40 % de las neuronas no responden a los tonos puros, sino a sonidos más complejos tales como series de ruidos o golpes (Whitfield, 1967). Puede ocurrir que estas unidades neurales estén diseñadas realmente para responder sólo a sonidos
248 PROCESAMIENTO DE INFORMACION HUMANA
especiales, únicos, pero lo más cerca que hemos podido llegar del sonido adecuado es un golpe o una serie de ruidos.
Incluso el 60% de las unidades neurales que responden a los tonos puros, no lo hacen de una forma simple. Algunas incrementan su tasa de actividad cuando se presenta un tono (una respuesta excitadora) . Otras disminuyen la tasa de actividad (una respuesta inhibidora) . Unas sólo responden cuando se presenta el tono (una respuesta on), mientras que otras sólo lo hacen cuando el tono desaparece (una respuesta ofO, y hasta existen otras que responden cuando el tono se presenta y después desaparece (una respuesta on-om (ver Figura 6- 1 8). Naturalmente, estas respuestas son similares a las encontradas en el sistema visual.
Respuesta �!Hlf� llf. il ' .. Una respuesta excitadora
Tono On
Respuesta H 11+1!11 1 1 I ·I 1 ·1111��� m Una respuesta inhíbidora
Tono On
Respuesta •=--+l----.¡..----.¡...--• Una respuesta on
Tono 011 On 011
Respuesta 11 111 111 1� 111 U na res puesta off
Tono On
Respuesta 1 - 111 1 ... Una respuesta on-off
Tono On
FIGURA 6- 1 8 Diferentes tipos de respuesta total a1Jte estímulos sonoros, obtenidos de /a corteza ;uditiva primaria del gato. De Whi�field ( 1967) .
EL SISTEMA AUDITIVO 249
Algunas unidades neurales de la corteza auditiva mantienen curvas de sintonización aguda, mientras que otras no lo hacen. l!nas sólo r�sponden a cambios de frecuencia (detectores de frecuencia de barrido), otrás tienen regiones donde un tono de cierta frecuenci� provocará la respuesta ante un tono de otra frecuencia que finaliza (células interactivas) .
Detectores de frecuencia modulada. Cierto número de células de la corteza auditiva (al menos, en el gato) sólo parecen sensibles a cambios de frecuencias. No responden a un tono puro de frecuencia con�tante: al margen de su intensidad o frecuencia. Un tono establede mtens1dad constante y frecuencia variable se llama señal de frecuencia modulada o señal de frecuencia barrida. Esta es una respues
.ta de formas específicas de neuronas a una señal de frecuencia
barrida (la frecuencia se eleva y desciende en forma sinusoide).
ONDA DE LA SEÑAL
MODULACION DE LA FRECUENCIA S I N USOIDAL
f Respuesta neural
j 1 2.570 ±�-:-I� 1 1 1 1 ! 1 1 � ii:��AAAAAAAAAA Tiempo
FIGURA 6- 1 9 De Whitfield y Evans (1965).
Los cambios lineales en la frecuencia de una señal producen algo que se parece a una rampa : una señal modulada de rampa.
250 PROCESAMIENTO DE INFORMACION HUMANA
Una señal típica con su correspondiente respuesta neural, aparece
representada en la Figura 6-20. , Observe que las unidades neuronales que �e r�presentan aqm
solo cambian de frecuencia en direccione¡¡, determmadas. Con la
modulación sinusoide, la unidad representada sólo parece respon?;r
a incrementos de la frecuencia de la señal. Con la modulac1on
de rampa, se representan dos tipos distintos de unida�es, una que
sólo responde a incrementos de frecuencia, y otra que solo responde
a disminuciones. ·
Tiempo
MODlJLACJON DE FRECUENCIA DE RAMPA
(a) Respuesta neural
ONDA DE LA SEi'lAL
11 •• M':•VMi ....
(b) Respuesta neural ----,,.J,�IAoA ... , __ _
i 1 i.:..
.___T-ie_
m_
p_o __
FIGURA 6-20 (a) La unidad dispara en respuesta a un cono ascendente, pero no a
un tono descendente con la misma amplitud de frecuencia, (b) la
unidad dispara en respuesta a un tono descendente, pero no ante
un tono ascendente. De Whitfieid y Evans ( 1965 ) .
¿Qué aspecto puede tener el circuito neural d e estos detectores de frecuencia 'barrida? Considerando la estructura que produce un cambio de frecuencia en la membrana basilar, vemos que un cambio de frecuencia provoca un movimiento en la localización de estimulación máxima a lo largo de la membrana. Por tanto,
EL SISTEMA AUDITIVO 25 1
si construyésemos un detectOr de movimiento para la actividad a lo largo de la membrana, conectando las células de frecuencia característica básica exactamente de la misma manera que conectamos las unidades central-periféricas en el Capítulo 2, obtendríamos un detector de frecuencia barrida. Al igual que los detectores de movimiento sólo eran �ensibles a movimientos en una dirección única, asi los detectores de frecuencia barrida sólo son sensibles a incrementos o a disminuciones d_e frecuencia, pero no a ambas cosas.
V V \JBajo Alto Bajo Alto Bajo Alto
Frecuencia
FIGURA 6-2 1
Izquierda : unidades de respuesta que sólo responden a tonos dondequiera que estén
en su área de respuesta. Centro : unidades que sólo responden a tonos descendentes dondequiera que estén en su área de respuesta. Derecha: unidades que responden a tonos ascendentes en la mitad del área de respuesta de baja frecuencia y a tonos
descendentes en la mitad de alta frecuencia. De Whitfield y Evans ( 1965 ) .
Se han encontrado en el gato tres tipos distintos de unidades de frecuencia modulada (Whitfield, 1 967). Todas parece que son sensibles a frecuencias de una determinada región, muy parecidas a las características de las curvas de sintonización discutidas anteriormente. Pero en lugar de responder a cualquier tono dentro de una curva de sintonización, sólo responden a tonos donde la dirección del cambio de frecuencias es : 1 . un incremento de frecuencia2. una disminución de frecuencia3. un aumento en la parte de frecuencia baja de la respuesta y
un descenso de la parte de frecuencia alta.¿Qué es lo que hace el gato con estos detectores de frecuencia
barrida? No lo sabemos. Se ha descubierto que los murciélagos tienen una cantidad extraordinaria de detectores de frecuencia barrida. Parece que son esenciales para la capacidad del murciélago de volar mediante localización de eco : enviando señales acústicas y analizando los ecos para determinar la distancia y dirección de
252 PROCESAMIENTO DE INFORMACION HUMANA
los objetos del ambiente. ¿Tienen y utilizan los humanos detectores de frecuencia barrida? Una vez más, no lo sabemos. Es posible que tal información fuese útil para las formas sonoras muy complejas que tienen que utilizarse para analizar el lenguaje.
LECTURAS RECOMENDADAS
La referencia más moderna para la operac1on fisiológica delsistema auditivo es The Auditory Pathway ( 1 967) de Whitfield. Ellibro de Kiang ( l 965) también es bueno, pero solo es recomendablea estudiantes avanzados en procesos fisiológicos. Una buena introducción a la audición es el texto de Stevens y Davis ( 1 938). Auncuando este libro es muy antiguo, todavía tiene validez e informade una gran parte de los fenómenos básicos. De la misma manera,el Handbook of Experimental Psychology editado por Stevens ( 1 9 5 1 )e s excelente, pero antiguo y más avanzado. U na gran parte deeste capítulo surge del trabajo de Whitfield y de los capítulosdel manual editado por Stevens. Un resumen, con énfasis en elprocesamiento fisiológico, lo proporciona el libro de Gulick ( 1 97 1 ).
Los trabajos de Georg von Békésy le hicieron ganar el PremioNobel por sus estudios sobre el funcionamiento del oído externo.Cualquiera que intente trabajar en el campo de la audición tendráque recurrir más pronto o más tarde a su material. La mayorparte de sus importantes artículos sobre la audición están reimpresosen Experiments in Hearing ( 1 960) de Békésy. Los escritos de Békésyson muy agradables de leer porque nunca se encierra en un simpletópico, sino que le gusta mucho demostrar cómo el tópico quediscute se relaciona con una gran cantidad de diversos fenómenos.Su segundo libro, Sensor y Inhibition ( 1 967), ya lo hemos recomendado como una referencia esencial para los que están interesadosen el fenómeno de la inhibición lateral.
Se deben ver también las Lecturas Recomendadas del Capí-tulo 7 .
7 LAS DIMENSIONES DEL SONIDO
SONIDO: Contornos equisonoros.- Escuchando música.-Compcnsadores de sonido.- En mascaramiento.---EI experimento de enmascaramiento.-El mecanismo de enmascaramiento.---Enmascaramiento de música.-La medida del sonido.- Fonos.-TOSO '. La escala musical.-La escala mel.-La teoría del lugar'. posición de la memhrnna basilar.--Períodícidad del tono.-Sonído y tono. --El caso de la equivocación fundamental.-Evidencia contra la no linealídad.�-Enmascaramiento de la equ ivocación fundamental.-La explicación de la teoría del lugar.--La explicación de la periodicidad del tono.-Discriminacíón del tono sin membrana basilar.-Evidencia contra la teoría de la periodicidad del tono.--La duplicidad <le la teoría de la percepción del tono.-LA BAl\'DA CRÍTICA : PERCEPCIÓN ESPACIAL AlJl)lTIVA. -- Localizacíón.-�Interacción binaural.-�I mportancia de la audición binaural. Localización.-· En mascaramiento de la diferencia de nivel.- -Enmascaramiento.-Grabaciones.-El efecto de prioridad.-LECTURAS RECOMENDADAS : Visión del color.
Una orquesta origina una rica experiencia auditiva. Los grupos de rock, las síntesis musicales, los sonidos electrónicos, se combinan en trabajos experimentales que estimulan al oyente. Las nuevas técnicas de grabación proporcionan medios para ofrecer al oyente las experiencias del acontecimiento general, ya sea una conferencia, un discurso, una audición musical, o hasta efectos especiales que no pueden existir salvo en las grabaciones, imaginados por compositores creativos.
M ientras tanto, las fuentes de ruido contaminan el ambiente. El ruido de los aviones nos molesta y nos perturba, algunas veces produciendo una molestia tolerable, otras desorganizando la estimulación y hasta provocando daño flsico y fatiga mental.
Todas estas características del sonido están dentro del dominio del psicólogo. Desde el conocimiento de los mecanismos del oído, de la comprensión de las dimensiones psicológicas del tono y del sonido, y del estudio de los fenómenos de enmascaramiento y percepción espacial auditiva, puede hablar, explicar y predecir muchos atributos de la experiencia auditiva.
En este capítulo, analizamos algunas experiencias auditivas producidas por el sonido. Exploramos principalmente cuatro tópicos :
254 PROCESAMIENTO DE INFORMACION HUMANA
sonido, tono, la banda crítica y la percepción espacial auditiva. En cada tópico, introduciremos lo que se ha descubierto mediante la ciencia, y después deduciremos las implicaciones prácticas. Examinaremos el papel de los cuatro factores en la percepción de la música, el habla y el ruido. Además, se describen en el Apéndice A del tercer volumen de esta obra, los aspectos más técnicos de la medida del sonido.
SONIDO
La sonoridad de un ruido depende tanto de su intensidad como de su frecuencia. Cuando la frecuencia es constante, los sonidos intensos parecen más ruidosos que los sonidos débiles. Pero cuando la intensidad se mantiene constante, los sonidos con frecuencias muy altas o muy bajas parecen más débiles que los sonidos de frecuencia intermedia. En los casos extremos, es evidente que tiene que ocurrir esto. Consideremos un silbato de frecuencia intermedia con un nivel medio de _intensidad. Supongamos que mantenemos la intensidad del silbato constante pero que cambiamos la frecuencia, de forma que esté por debajo de 20 Hz o sea superior a 20.000 Hz (esto sólo se consigue electrónicamente -no se puede conseguir silbando). Con estas frecuencias extremas, los sonidos se convierten en inaudibles. Por tanto, el sonido depende de la frecuencia, no por una razón especial sino por el simple hecho de que existen límites en la amplitud de las frecuencias a las que puede responder el oído. Pero el sonido también depende de 1a frecuencia dentro del rango normal de audición.
Contornos equisonoros
La interacción entre frecuencia e intensidad en la percepción
del sonido se puede determinar pidiendo a unos sujetos que compa
ren dos tonos que tienen distintas frecuencias e intensidades. Supon
gamos un tono típico y démosle una frecuencia, intensidad y duración
fijas : por ejemplo, ·el típico que tenga 1 .000 Hz con una intensidad
de 40 dB, presentado durante 0,5 seg. Llamemos a un segundo
tono el de comparación. Lo fijamos también para 0,5 seg, pero
con una frecuencia distinta de la del típico, por ejemplo, 3.000 Hz. Ahora, la tarea del sujeto consiste en escuchar alternativamente
el tono típico y el de comparación, ajustando la intensidad del
LA.S DIMENSIONES DEL SONIDO 255
de comparación hasta que sea tan fuerte como el típico. Cuando se consigue, ponemos el tono de comparación con una frecuencia distinta y repetimos todo el procedimiento. El resultado normal se ofrece en la Figura 7- 1 : una curva que describe la intensidad en la que los tonos de distintas frecuencias tienen la misma sonoridad percibida que el típico. Esta curva se llama ·un contorno equisonoro. El nivel del tono típico puede llamarse nivel de sonoridad de fa curva total, porque se ha construido variando sistemáticamente la frecuencia del tono de comparación, mientras se mantenía la sonoridad de la comparación igual a la sonoridad del típico.
"r-.. � _sensación 120 Nivel de ruido� J 120 0.: !'. .... .. 11;;'°'.. I �
. \'-. .......... � 10.0 ........ i-1.1' I ,, .../ 100 \'\'. , ......... •o' - I ; ...... ..... . $' � :"-. ......... -... .......... - I � 80 ...... 80
o � :\ ......... ........... .... ......... 1,� ..... "O 70 \ ·a \�� ... , '� ............. ........ 1/ V 5l 60 60 " \ ''� ............... ' i... ;
V "O 'º .... \ I ;¡ ' �� �� r.... .... "� r-.."' I ;> 40 .... i 40
� !"......'""- � r.... ....... � r\. 30
� r--..� 20 r.... ....... � 1\. 20
Umbral de audición' e:::--.... 10 r.... ........... ��· "�' 1 1 1 1 1 -... -- .. ......... .... "' o 1 1 1 1 1 - •'
� 100 1000 5000 10,000 Frecuencia (Hz)
r-
FIGURA 7-1 Contornos equisonoros, según datos de Robinson y Dadson ( 1956) .
La Figura 7- 1 muestra los resultados de un experimynto utilizando estímulos típicos muy distintos. En cada curva, el tono típico tuvo siempre una frecuencia de 1 .000 Hz, pero intensidades distintas. La curva etiquetada con 40 corresponde al ejemplo que hemos discutido : el tono típico tiene una intensidad de . 40 dB y una frecuencia de 1 .000 Hz. La curva etiquetada con 1 00 es un contorno equisonoro obtenido cuando se comparan frecuencias distintas contra un tono típico de una intensidad de 100 dB, pero también con una frecuencia de 1 .000 Hz.
256 PROCESAMIENTO DE INFORMACION HUMANA
El contorno inferior (la línea discontinua) muestra la sensibilidad absoluta del oído a las distintas frecuencias. Los sonidos inferiores a esta línea no pueden oírse. Los sonidos sobre esa línea son escasamente detectables (y se supone también que son de igual sonoridad). En el otro extremo, el contorno superior, los sonidos muy intensos producen, en principio, una sensación de «cosquillea>: en el oído y después, a medida que aumenta la intensidad, una sensaéión de dolor. Los sonidos de estas regiones pueden conducir a una lesión auditiva. (La lesión también puede producirse con sonidos de intensidad más débil si son de exposición prolongada). Observe que el contorno equisonoro del umbral del dolor es mucho más plano que el contorno del umbral de la audición. Si los sonidos son lo suficientemente intensos, tienden a sonar con igual fuerza, al margen de la frecuencia.
Escuchando música
Puede ser sorprendente ver en qué lugar de los contornos equisonoros descansan los instrumentos de una orquesta. El pia!lo tiene el más amplio rango de frecuencias, que van desde 30 hasta 4.000 Hz. La media C (C4) 1 del piano tiene casi 260 Hz (26 1, 63, para ser exactos).
Para ayudar a ver en qué lugar de los contornos equisonoros descansan estas frecuencias, representamos un teclado de piano en la Figura 7- 1 e indicamos qué región cubre en las curvas. La Fígura 7-2 muestra el rango de frecuencias de algunos instrumentos musicales distintos. Así, la mayoría de los sonidos de los instrumentos musicales descansan en la región donde la percepción del sonido es más sensible a los cambios de frecuencia. Esto tiene dos consecuencias : por un lado, a menos que se escuche la orquesta con unos niveles razonables de intensidad, no se oirán muchas de las frecuencias emitidas por los instrumentos ; en segundo lugar, las relaciones sonoras entre los instrumentos, tan cuidadosamente elaboradas y
1 Los subíndices indican a qué octava de nota se refiere. La notación es la que normalmente utilizan en acústica, pero no siempre en música. La primera
C del teclado del piano se llama CI. Todas las notas dentro de la octava inmediatamente anteriores a ella reciben el subíndice 1 : D l , El, .. .,B l . La segunda C del teclado, y todas las notas dentro de la octava anteriores a ella, tienen subíndice 2: C2, . . . ,B2. Mediante este esquema, la media C del piano es la C4 ; la nota para entonar los instrumentos de una orquesta es la A4. La nota más alta del piano es la
C8 ; la más baja es Ja AO (ver Backus, 1 968). ·
.s ·i s o "' "'
LAS DIMENSIONES DEL SONIDO
e:
íl� ��LW� �+il=R���Htl-ª-+-H+1--1-++-�¡.._¡_¡..¡... _ __.¡...f..1--W"---
--'-'" ......... '-'---"'"" .....¡+¡.¡..¡... __ ;,¡;
� fil E-B·s <<O
FIGURA 7-2
De C. G. Conn, Lid.
257
controladas por el director, dependen de que se escuche la música con la misma intensidad que el director espera para su audiencia. Cuando escuchamos en casa las grabaciones de música sinfónica, probablemente no se eleva el nivel del aparato para recrear las intensidades originalmente presentes en el momento de la grabación. Se escucha la música en un conjunto distinto de contornos sonoros que los planificados por el director, de forma que se escucha una pieza distinta de música que la que pretendía el director.
258 PROCESAMIENTO DE INFORMACION HUMANA
Son muy conocidos los problemas de la música grabada para que suene igual en casa que cuando se realizó la grabación. Consideremos un segmento de una pieza sinfónica que se está interpretando, de forma que la intensidad sonora total es aproximadamente la misma con distintas frecuencias, como muestra la Figura 7-3. Cuando se escucha la grabación en casa, el panorama parece similar en conjunto, pero la intensidad está reducida. Ahora bien, algunos de los niveles sonoros caen por debajo del umbral de audición. Las frecuencias bajas que eran perfectamente audibles en el concierto ya no pueden escucharse. Además, cuando los niveles cambian, la sonoridad relativa en diferentes frecuencias también cambia. Si un órgano toca una escala con una intensidad muy elevada, desde las no�as bajas hasta las altas, se percibirán en el auditorio real todas las notas que tengan aproximadamente la misma sonoridad (con intensidades altas, los contornos equisonoros son relativamente planos). Sin embargo, en casa, cuando se reproduce la escala a un nivel razonablemente audible, no sólo serían inaudibles algunas de las frecuencias más bajas, sino que no estarían localizadas en la región donde la frecuencia afecta a la sonoridad : las notas parecerían cada vez más y más fuertes hasta dos o tres octavas por encima de la media C, donde comenzarían a descender en sonoridad. (Observe en la Figura 7- 1 que cuando las frecuencias descienden por debajo de 1 .000 Hz, tienen que aumentar la intensidad para
100
o
20
' '
Intensidad de sonido en la sinfonía
' , I ntensidad de sonido ' , , / en casa
��WlfllllNllflllllJM\WmftN--� ' '
'
100
..... '
' '
' '
'
1 000 Frecuencia (Hz)
FIGURA 7-3
_ _ ,, '-........_ Umbral de audición
10,000
LAS DIMENSIONES DEL SONIDO 2S9 poder percibirlas con igual fuerza ; así, cuando la intensidad es constante, a medida que la frecuencia desciende se perciben las notas como más suaves.
Compensadores de sonido. En la actualidad, la mayoría de los amplificadores de buena calidad se construyen con circuitos que compensan estos mecanismos psicológicos. El control llamado compensador de sonido, o a veces simplemente sonido, hace que el aparato acentúe los sonidos de frecuencia muy baja o muy alta cuando está tocando con niveles bajos de sonido. A niveles altos de sonido, el compensador se desconectará automáticamente de forma que ya no produce ningún efecto. En los buenos equipos de reproducción, el efecto de compensación de sonido es similar al que se ofrece en la Figura 7-4.
100
o .,, ·a � 60 Ol .,, .,, " �" " :s
20
o
- /
Con compensación
/ /
I I
l
···· --��·"'� .....
100 1000
Frecuencia (Hz)
FIGURA 7-4
' Sin compensación
1 0,000
Este proceso tiene como resultado una sonoridad percibida semejante a la representada en la Figura 7-5. Realmente, esta compensación funciona sólo si todo se hace correctamente. El mecanismo compensador debe de tener en cuenta las peculiaridades de la acústica de la habitación donde están colocados los altavoces, así como el equipo de sonido que se utiliza.
260
¡¡ "' ·;::: o " o
1 00
"' 20
o
20
PROCESAMIENTO DE INFORMACION HUMANA
Sonoridad en la sinfonía
Con compensación,
Sin compensación
1 00 1000 10,000 Frecuencia (Hz)
FIG U RA 7-5
Enmascaramiento
La sonoridad de un ruido no sólo depende de su propia intensidad sino también de los demás ruidos que se producen al mismo tiempo. Los sonidos se enmascaran entre sí : la presencia de un sonido hace más dificil la audición de otro. Arrugar un papel, aplaudir, toser -todas estas cosas tienden a enmascarar la conversación o la música. Para determinar el efecto del enmascaramiento, es necesario medir cuánta intensidad debe tener un sonido de prueba para poder oírlo en presencia de un sonido de enmascaramiento. El procedimiento es básicamente similar al utilizado para obtener contornos equisonoros.
El experimento de enmascaramiento. Una forma de realizar el experimento, consiste en hacer lo siguiente : se presentan dos tonos a un observador ; uno se llama tono de prueba, el otro la máscara. La máscara se coloca a una intensidad y frecuencia fija. Después se pone el tono de prueba en una frecuencia fija y se ajusta el valor de intensidad hasta que se pueda detectar el tono de prueba. Este procedimiento se repite para distintos valores de frecuencia del tono de prueba hasta que se traza una curva de enmascaramiento, que muestra con exactitud la intensidad que debe tener el tono de prueba en las distintas frecuencias para que pueda ser detectado en presencia de la máscara. Una vez que se ha determinado la
LAS DIMENSIONES DEL SONIDO 261 curva de enmascaramiento para una máscara determinada, se puede cambiar la máscara a otra frecuencia o intensidad y se determina una nueva curva de enmascaramiento.
Un resultado típico de este experimento, está representado en la Figura 7-6. En este caso, la frecuencia de la máscara 2 se mantuvo fija en 1 .200 Hz y la intensidad se varió desde 20 hasta 1 10 dB, en saltos de 1 O dB para obtener 1 O curvas distintas de enmascaramiento.
-¡;¡ e " E l = >< "'... � o ..!:! e: ,O 2 j"il "'"' o "' t; " ::l"' ·� ·� ¡¡" " e; ::l � O'
1 10
1 00
90
80
70
60 50
40
30
20
1 0
o 20 50 1 00
Intensidad de la máscara
200 500 1 000 t 2000 4000 8000 1 6,000Frecuencia de la máscara
Frecuencia del tono experimental (Hz)
FIGURA 7-6 De Zwicker y Scharf ( 1965).
La característica más sorprendente de estos datos es la asimetría. La máscara tiene un efecto relativamente pequeño en tonos inferiores de unos l. 200 Hz, pero los tonos superiores a esta frecuencia seconvierten en mucho más dificiles de escuchar por la presencia de la máscara.
El mecanismo de enmascaramiento. Una de las explicaciones de esta asimetría, proviene de las formas de vibración de la membra-
2 En realidad, la máscara no tiene un tono puro, sino más bien una bandalimitada de ruido. El ruido proporciona resultados más suaves que los de un tono. Al margen de esto. las diferencias entre el enmascaramiento producido por un tono puro y por un ruido de banda limitada son muy pequeñas, y sólo tienen importancia técnica.
262 PROCESAMIENTO DE INFORMACION HUMANA
na basilar. Fíjese en las formas representadas en la Figura 7-7 : los sonidos de baja frecuencia tienden a producir actividad en· gran parte de la membrana, mientras que las frecuencias altas afectan a una región más limitada. Si examinamos estos efectos con más detalle, como en la Figura 7-8, podemos comparar las formas de vibración de la membrana basilar producidas por la máscara con las producidas por los tonos de prueba. Cuando el tono es débil y ligeramente superior en frecuencia al de la máscara,
Frecuencia A 1. "d d 1 d t
e 1v1 a en a CH�l� membrana basilar
,, E --- --<: l 50
100
400
o __ .... j
1600 : L=-<7\ . ¡ o 1 0 20 'º
Distancia de la ventana oval (mm)
FIGURA 7-8
De Zwicker y Scharf ( 1965).
FIGURA 7-7
De Békésy ( 1949).
TO NO DEBIL
"O "'
Tono a 900 Hz ] so Ruido
fi 30 Tono 'E V - "O o '-----1-'1---
900 1200
Tono a 1 500 Hz 50 Ruido
Tono
� ] LL_Frecuencia LLFreéuencia
¡::;: ¡g �9 � s s 5 8 Distancia a l o largo de la membrana basilar
Hacia la -+ Hacia la -.. TONO MEDIO ventana oval ventana oval � !� LL_ :§ @ � i � IU
> E Distancia a lo largo de la membrana basilar Hacia la -.. Hacia l a -+
TONO INTENSO ventana oval ventana oval
Distancia a lo largo de la membrana basilar Hacia la venta na oval
Hacia la -+ ventana oval
LAS DIMENSIONES DEL SONIDO 263
ninguna parte de la actividad producida por el tono se hace sentir por encima de la forma ya originada por el ruido de enmascaramiento. Pero el mismo tono débil con una frecuencia inferior al de la máscara, produce una nueva actividad en una región distinta y no superpuesta. Entonces se puede escuchar. Observe que cuando se incrementa el nivel de la señal, se invierten los papeles de la señal de prueba y de la máscara. Un tono de prueba de frecuencia baja, de intensidad rélativamente elevada ensombrece la máscara.
Enmascaramiento de música. El enmascaramiento añade otro factor a la percepción del sonido y de la música. Los instrumentos intensos, de baja frecuencia enmascaran los sonidos de instrumentos débiles, de alta frecuencia. Las violas enmascaran a los violines ; los timbales enmascaran a las violas ; los instrumentos de metal
. enmascaran a los de madera. Pero cuando se reproducen los sonidos en casa, la intensidad es menor que cuando fueron grabados. En con·secuencia, las formas de enmascaramiento también cambian. De pronto, se pueden seguir las finas pulsaciones del violín o la guitarra, porque los sonidos de los bajos están muy reducidos de nivel. ¿Es bueno esto ? No necesariamente. El compositor, el director y los músicos no pueden tener en cuenta este fenómeno ; sus intuiciones musicales tienen en cuenta el efecto de enmascara� miento y lo utilizan suponiendo que se producirá en el auditorio. Eliminar el efecto de enmascaramiento es eliminar el equilibrio sonoro entre los instrumentos, tan cuidadosamente planificado en función del conjunto.
La medida del sonido
La medida del sonido es de gran importancia para muchos problemas prácticos. Puesto que nuestra percepción psicológica del sonido no se corresponde directamente con las medidas de intensidad fisica, es esencial tener métodos que tomen en cuenta estas diferencias.
Fanos. Un procedimiento de ese tipo se basa en el método de estimación de magnitud. Se presentan dos tonos a una persona, ambos de 1 .000 Hz, por ejemplo, y se le pregunta cuantas veces le parece superior un sonido en comparación con el otro. La pregunta es peculiar, pero las personas pueden hacerlo y responden con bastant!'! sensibilidad. (Para mayor información y algunos ejemplos
264 PROCESAMIENTO DE INFORMACION HUMANA
que se pueden intentar personalmente, véase el Apéndice A del tercer volumen de esta obra).
Los resultados del procedimiento de estimación de magnitud muestran que el sonido crece en función de la raíz cúbica de la intensidad del sonido. Es decir, el Juicio de sonoridad, J, está relacionado con la Intensidad flsica del sonido, I, por medio de la ley exponencial siguiente :
J kI0 ·3
El valor del exponente (0,3) es muy adecuado. Si al investigar se especifica la intensidad del sonido en decibelios, un incremento de 1 O dB modifica siempre el sonido en un factor de 2. Cada vez que la intensidad fisica se multiplica pof 1 O, el sonido psicológico se multiplica por 2, como se representa en la Figura 7-9.
� "@, -o "' :g o " o "'
1 0,000 5000
2000 1000 500
200 1 00 50
20 1 0 5
2
.5
11 Lanzamiento espacial tripulado (desde 46 m)
Dolor!IJ Sensación;l
P Orquesta de rock
11 Conversación en voz baja
f Habitacíón silenciosa
. 2 t1 Susurro de las hojas
O . 20 40 60 80 100 120 140 1 60 I SO 200 Intensidad del sonido (dB)
F I G U RA 7-9
LAS DIMENSIONES DEL SONIDO 265 Este procedimiento de medida se ha tipificado por la Internatio
nal Standards Organization. La unidad del sonido es el fon. Por definición, el sonido de un tono de 1 .000 Hz con una intensidad de 40 dB es igual a 1 fon.
Para obtener la sonoridad de un tono en otras frecuencias, se pueden utilizar los contornos equisonoros. Todos los tonos del contorno equisonoro de la Figura 7- 1 , marcado con 40, tienen una sonoridad de 1 fon. Los del contorno marcado con 50 tienen una sonoridad de 2 fonos, y los del contorno marcado con 60 tienen una sonoridad de 4 fonos. Cada incremento en 1 0 dB del contorno, duplica el valor de fonos : cada descenso en 1 0 dB divide por la mitad del número de fonos.
La medida del fon describe la sonoridad percibida de tonos puros. Con sonidos complejos que tienen muchos componentes de frecuencia, tales como voces, orquestas o sonidos de aviones y automóviles, la sonoridad se determina comparándolos con una norma típica de 1 .000 Hz. El valor del fon donde el tono de 1 .000 Hz parece tan fuerte como el sonido complejo es el nivel de fonos para ese sonido complejo. En la Figura 7-9 se muestran algunos valores fon de sonidos típicos.
TONO
La escala musical
La escala musical de tonos está logarítmicamente relacionada con la frecuencia de sonido. Cada octava en la escala musical típica tiene exactamente el doble de frecuencia que la octava anterior. La nota que las orquestas utilizan para entonar sus instrumentos, A4 (la A superior a la media C), tiene una frecuencia de 440 Hz. Las A una y dos octavas superiores a esa, As y A6, tienen frecuencias de 880 y 1 . 760 Hz, respectivamente. De la misma manera, las A una y dos octavas inferiores tienen frecuencias de 220 y 1 1 O Hz, respectivamente. Por tanto, en una escala musical bien templada, aumentar una nota en una octava duplica su frecuencia . Por otra parte, existen 1 2 notas igualmente espaciadas en una octava (contando las notas completas y medías). Para dividir el rango de frecuencia cubierto por una octava en 1 2 intervalos iguales, cada nota tiene que ser exactamente 2 1 /1 2 veces la frecuencia dela anterior.
266 PROCESAMIENTO DE INFORMACION HUMANA
La escala me!
¿Se percibe la nota de una octava como si tuviese el doble de tono de la misma nota en la octava anterior? Intuitivamente parece que sí, pero los datos experimentales indican que la respuesta es no. Cuando se les presenta a los sujetos notas distintas y se les pide que juzguen sus relaciones tonales, el tono percibido no sigue la escala musical. Duplicando o dividiendo por la mitad la frecuencia de la nota, no se multiplica ni se divide un tono percibido. (Este resultado proviene del procedimiento de estimación de magnitud, descrito en el Apéndice A del tercer volumen de esta obra). La auténtica relación se representa en la Figura 7- 10. La unidad de tono en este diagrama se llama mel. Por definición, un tono de 1 .000 Hz (a 60 dB) tiene un tono de 1 .000 mels.
A,
A,
10 IOO lOOO Frecuencia (Hz)
FIGU RA 7- 1 0
I0,000
3000
� 2000 " 5 o ]"ü � o 1000 "' o
,...
o l::=::::=::::.::::.__,_���'--��� 10,000 w 100 tOOO Frecuencia (Hz)
Aunque este resultado puede ser incompatible con nuestra intuición sobre el tono, es muy compatible con alguno de los conceptos de composición musical. Los músicos discuten frecuentemente las
LAS DIMENSIONES DEL SONIDO 267 consecuencias de transformar Úna pieza de una clave a otra. Si una pieza se escribe en C mayor y después se transforma a A mayor, ¿qué ocurre ? Si el cambio de una nota a otra tiene siempre la misma magnitud psicológica, al margen de la nota implicada, entonces ¿qué importancia tiene el que se transforme la pieza? La distancia psicológica entre las notas será la misma, al margen de la clave en que se toque la pieza. Pero la mayoría de los músicos argumentan que la transformación modifica el carácter de la pieza. El efecto es sutil, pero existe. Este argumento es compatible con los juicios psicológicos sobre las relaciones tonales. El cambio en el tono percibido implicado al pasar de una C4 a una 04 es distinto que el implicado en el que se produce de una F4 a una G4 o, de la misma manera, del que va de C5 a 05, una octava más.
La teoría del lugar : posición en la membrana basilar
Para analizar el problema de qué es lo que determina nuestra percepción del tono, regresemos de nuevo a la vibración a lo largo de la membrana basilar. Las distintas frecuencias producen diferentes formas de actividad en la membrana. El lugar de máxima vibración se mueve sistemáticamente desde el final de la ventana oval de la membrana hacia el ápice, cuando la frecuencia va de lo superior a lo inferior. Ya en 1 863, el físico alemán Helmholtz mantuvo que el tono está determinado por la posición de la vibración máxima a lo largo de la membrana. Aunque las razones de Helmholtz eran inexactas, su conclusión fue buena. La distancia psicológica entre los tonos de dos sonidos parece estar relacionada con la distancia física entre la posición de la actividad máxima producida por los tonos. Las dos funciones están representadas en la Figura 7- 1 1 . Por tanto, la localización del máximo de vibración producida por tonos de distintas frecuencias, se representa en términos de su distancia desde el extremo (el ápice) de la membrana. También se muestra el tono percibido, medido en la escala mel. Las dos funciones son similares, aunque no idénticas.
¿Por qué la distancia es una característica crítica ? No es ningún valor intrínseco para el sistema nervioso, a menos que existan mecanismos neurales que la utilicen. La forma en que están distribuidas las 30.000 fibras del nervio acústico a lo largo de la membrana, sugieren tal mecanismo. Cerca de la ventana oval y al principio
268
.!!l " 5 o = ¡3:
PROCESAMIENTO DE INFORMACION HUMANA
4000
3200
2400
1600
800
-- Escala de tono -- Lugar de vibración máxima
40
c_�---1..�L-.L.JLL.LLJ...L�___JL-...i_...i_.._._._,...u O 1000
Frecuencia (Hz)
FIGURA 7-1 1 De Zwislocki (1965).
10,000
de la cóclea, la densidad de neuronas parece constante, aproximadamente 1 . 1 50 neuronas de célula ganglionar por milímetro. Pero la densidad de neuronas decrece a medida que nos acercamos al ápice. Si la densidad elevada de neuronas proporciona una información más precisa de la posición, entonces esta distribución sugiere que sería menos sensible a los cambios de actividad en la región de baja frecuencia -los puntos cercanos al ápice. Cuando la curva se modifica por la densidad relativa de las neuronas, existe una buena concordancia : cada unidad de cambio de tono en la escala mel es aproximadamente igual a un movimiento de la vibración a lo largo de la membrana estimada en 12 neuronas.
La sensibilidad exacta del oído a los cambios de frecuencia, puede medirse directamente mediante la presentación sucesiva de tonos a un sujeto y la petición de que decida si tienen el mismo o distinto tono. Obtenemos así una medida de la diferencia mínimaperceptible (la d.m.p.) entre tonos. La capacidad para realizar tales discriminaciones varía con la frecuencia. Con 1 00 Hz, se necesita un cambio del 3 % en frt¡,cuencia (3 Hz) antes de que el tono sea una diferencia perceptible. Este porcentaje decrece progresivamente hasta que alcanza Un mínimo de unos 0,2% ó 0,3% en 1 .000 Hz. En las frecuencias bajas, la d.m. p. para el tono es aproximadamente constante en valor absoluto. El porcentaje de cambio necesario para realiza� la discriminación, permanece bastante constante alrededor del 0,3 % 3 .
3 Esta forma d e cambio de discriminación e s común a cierta cantidad de distintas señales en los diferentes sistemas sensoriales. La discriminación entre intensidades de una señal auditiva, por ejemplo, manifiesta una forma similar a la d.m.p.,
LAS DIMENSIONES DEL SONIDO 269
Si se compara la d.m. p. del tono con la distancia entre los máximos de actividad a lo largo de la membrana basilar, producidos por las dos frecuencias que se intetita diferenciar, existe una buena consonancia en las regiones de alta frecuencia, pero no ocurre lo mismo en las de baja frecuencia (Figura 7- 1 2) . Sin embargo, como anteriormente, deberíamos tener en cuenta la forma en que las células ciliares se reparten a lo largo de la membrana. Cuando se modifica la curva por la densidad relativa de neuronas, la comparación es más exacta : podemos discriminar la diferencia entre dos frecuencias, cuando su actividad máxima está separada a lo largo de la membrana por unas 52 neuronas.
23 ci. e "° "' ·¡¡=" "" �
�
3
2
/ Número constante de neuronas �'< / La escala d.m.p. para frecuencias
'\.�,/ Distancia constante a lo largo de la membrana basilar
�' � ..... :--:::::� ::...
--
O'------'--'---'---'--'-L-'-L..L..----'---L--'---'--'--'-L...LJ 100 500 1000 5000 1 0,000
Frecuencia (Hz)
FIGURA 7- 1 2 D e Zwis/ocki (1965).
que es aproximadamente constante en valor absoluto en las señales de baja intensidad y que tiene un porcentaje aproximadamente constante cuando las intensidades se dirigen hacia las regiones medias del rango de audición. Un porcentaje constante asociado con la discriminación es típico de muchos tipos de instrumentos de medida. Esto es una consecuencia del hecho de que la variabilidad en las medidas que se obtienen con frecuencia depende del nivel que se está midiendo, e incrementa en los niveles superiores. En consecuencia, la magnitud absoluta del cambio de señal necesaria para una discriminación fiable también aumenta. Cuando estas magnitudes aumentan, el resultado es un porcentaje de cambio constante, y se dice que el sistema sigue la Ley de Weber, nombre del psicólogo Weber ( 1 795- 1 8 78), un contemporáneo de Helmholtz. Si denominamos 8I al tamaño de la d.m.p., el cambio de intensidad que una señal tiene que sufrir para que el cambio sea perceptible, y llamamos I a la intensidad de la señal, la Ley de Weber establece que
M = kI,
donde k es el cambio relativo ( 100 k es el porcentaje de cambio).
270 PROCESAMIENTO DE 1NFORMACION HUMANA
Un examen de la localización de la vibración máxima a lo largo de la membrana, unido a una consideración de la distribución neural, describe tanto la percepción subjetiva del tono como la sensibilidad auditiva a los cambios de frecuencia :
• l d.m.p. implica aproximadamente 52 neuronas ;• 1 mel implica aproximadamente 1 2 neuronas.
Observe que el cambio tonal de 1 mel es menor que una d.m. p. : por tanto, no se puede detectar. Un tono tiene que cambiar 4 o 5 mels antes de que un observador pueda detectar el cambio.En frecuencias elevadas (alrededor de 500 o 1 .000 Hz), cuando la densidad de neuronas es razonablemente constante a lo largo de la membrana, la d.m. p. representa una distancia constante -unos 0.05 mm- a lo largo de la membrana.
Periodicidad del tono
El análisis de las formas de vibración a lo lárgo de la membrana basilar explica cierta cantidad de fenómenos asociados con nuestra percepción del tono. Pero otros continúan siendo un enigma.
Sonido y tono. El oído no es muy sensible a sonidos de baja frecuencia, aunque muchos instrumentos musicales producen frecuencias sonoras en esta región insensible. Así, una nota tocada suavemente tendrá una gran parte de su energía descansando por de�ajo del umbral de audición. ¿Qué sucede con nuestra percepción?Evidentemente, una nota interpretada más y más suavemente sonará casi igual, pero ¿por qué? ¿No cambiará de tono una nota tocada en el mismo piano, cuando se hace más y más suave y cuando sus componentes de baja frecuencia llegan a ser inaudibles ?
Analicemos la nota C3 del piano, la C anterior a la media C -no es una nota especialmente baja. Tiene el mismo tono que un sonido de 1 3 1 Hz (en realídad, 1 30 , 9 Hz). Pero la nota del piano no es un tono simple. Observe el espectro que aparece en la Figura 7- 1 3 . Aunque existe más energía en 1 3 1 Hz que en otras frecuencias, realmente la energía se produce sobre un amplio rango de frecuencias. A medida que la nota se interpreta más suavemente, estos. componentes de baja frecuencia descienden de intensidad pordebajo del nivel de audición. Así, la frecuencia más baja cambiará de 1 3 1 Hz, cuando la nota se interpreta a un nivel confortable,
Amplitud de sonido
131 500
LAS DIMENSIONES DEL SONIDO
1000
Frecuencia (Hz)
FIGURA 7-1 3
Espectro de C, tocado en el piano
2000
271
3000
a 262, 393 y finalmente a 524 Hz, cuando la nota se toca con bastante suavidad. Un tono puro con una frecuencia de 524 Hz es equiparable a Cs en el tono. Esta es una nota bastante alta -es una octava superior a la media C. Pero es evidente que existe algo peculiar aquí. Una nota musical no parece que cambie de tono de esta forma, cuando se interpreta suavemente. Si el tono está determinado por la localización a lo largo de la membrana basilar, ¿por qué el tono de un sonido complejo, como una nota de piano, parece permanecer constante aun cuando esté cambiando su frecuencia? ¿Cómo puede una nota de piano continuar teniendo el tono de su frecuencia fundamental de 1 3 1 Hz, cuando la frecuencia más baja que se puede oír es de 524 Hz? ¿Cómo podemos escuchar esta equivocación fundamental ? (Figura 7- 14).
El caso de la equivocación fundamental. Para responder a esta pregunta, consideremos una situación simple, que aparece en la Figura 7- 1 5. Dos tonos puros, l .000 Hz (fila superior) y 1 . 100 Hz (fila intermedia), se réunen para producir una forma compleja (fila inferior). Observe que aunque la única energía sonora existente en el sistema tiene las dos frecuencias de l .OOÓ y l . l 00 Hz, la onda resultante parece variar en una tasa total de 1 00 Hz. El fenómeno del diagrama recibe el nombre de pulsación. Dos ondas sinusoides reunidas producen una pulsación, una elevación y descenso regular en la energía sonora con una tasa igual a la diferencia de las frecuencias de las ondas sinusoides que la componen. Sin embargo, en la membrana basilar, este componente de pulsación no se presentará. No existen frecuencias físicas en la onda correspondiente a la frecuencia de la pulsación. Los máximos de actividad sólo se producirán en las localizaciones correspondientes a los com-
272
Sonido percibido
Sonido percibido
Sonido percibido
PROCESAMIENTO DE INFORMACION HUMANA
500
NOTA INTENSA (80 dB)
2000 Frecuencia (Hz)
NOTA MEDIA (50 dB)
1000 2000 Frecuencia (Hz)
NOTA DEBIL (20 dB)
2000 Frecuencia (Hz)
EIGURA 7-1 4
3000
3000
3000
ponentes fisicos reales del sonido � 1 . 000 y 1 . 1 00 Hz. Así, si percibimos el tono observando los puntos de máxima víbración, percibiremos los componentes 1 .000 y 1 . 100, pero no la frecuencia de 1 00 Hz de la pulsación. De hecho, oímos la pulsación.
Una onda sinusoide de 1000 Hz
Una onda sinusoide de 1 100 Hz
Las dos señales anteriores, combinadas
LAS DIMENSIONES DEL SONIDO
Tiempo -3 mseg
FIGURA 7- 1 5
273
Pulsaciones. La fluctuación de la presión del sonido total, que resulta cuando dos ondas sinusoides de diferentes frecuencias se colocan juntas. La estructura resultante fluctúa ( Kpulsación») con una frecuencia determinada por la diferencia entre las frecuencias de las componentes. En este ejempla, la onda sinusoide de 1000 Hz se combina con otra de 1100 Hz, para dar una frecuencia de pulsación de 100 Hz. Asi, la pulsación se repite cada 10 mseg. Observe que no existe enagla sonora en una frecuencia de 100 Hz. No provocamos una nueva onda sinusoide juntando las señales de 1000 y 1 100 Hz: Simplemente, la curva total de las presiones de sonido varían en una frecuencia de pulsación.
Existen dos teorías posibles para explicar este fenómeno. Una mantiene que la percepción de la · frecuencia de pulsación resulta del hecho de que el oído es un transmisor imperfecto del sonido : no tiene linealidad: La estructura mecánica del oído (principalmente, el oído medio) añade realmente frecuencias extra a las señales acústicas de entrada. En particular, se añade la frecuencia de pulsación, y así se activa la membrana basilar en esta región de frecuencia. Esta explicación es compatible con la noción de que un tono particular solo se percibe cuando existe una correspondencia máxima en la forma de vibración de la membrana : la teoría del lugar de la percepción del tono.
La segunda teoría resalta la importancia de la actividad sincronizada de las neuronas ante los cambios de presión de la onda acústica. Las células nerviosas reaccionan a las formas de actividad de la membrana basilar mediante disparos sincronizados, con la elevación y descenso regular de la frecuencia de pulsación. Esta sincronización de las respuestas neurales es la base del tono percibí-
274 PROCESAMIENTO DE INFORMACION HUMANA
do : la teoría de la periodicidad de la percepción del tono. Existen dos grandes explicaciones de la percepción del tono y el estudio del error o equivocación fundamental es la clave para valorarlas.
Evidencia contra la no linealidad. La introducción de no linealidades durante la transmisión de sonidos es típica de la mayoría de los sistemas mecánicos, y el oído no es una excepción. Pero existen dos fuentes de evidencia contra·esta teoría como explicación completa de la equivocación fundamental. En primer lugar, el oído es realmente bastante lineal, especialmente en sonidos de baja intensidad. En intensidades elevadas -niveles de sonido superiores a 80 dB--, el oído es realmente no lineal, y desde luego son correctas las razones descritas anteriormente para oír las frecuencias de pulsación. En los niveles elevados de intensidad, los huesos y músculos del oído medio actúan para proteger el oído interno, reduciendo la señal que lo atraviesa. Este mecanismo protector también introduce una distorsión en la señal que se está transmitiendo. Numerosos estudios han confirmado que las señales de alta intensidad tienen como resultado no linealidades y la aportación de aquellos tonos que predice la teoría.
Pero ¿qué sucede con la nota de piano, que tiene una intensidad de solo 30 dB? Las no linealidades no aportan mucha evidencia con estas intensidades bajas, al menos no en la medida suficiente para explicar por qué el tono de la G1 es el tono del fundamental, aunque éste sea inferior al umbral de audición.
Enmascaramiento de la equivocación fundamental
Consideremos un sonido complejo, compuesto de las siguientes frecuencias :
1 .000 Hz 1 .200 Hz 1 .400 Hz 1 .600 Hz 1 . 800 Hz 2.000 Hz 2 .200 Hz
Se le pide a un sujeto que ajuste un oscilador, de forma que su tono sea el mismo que el del sonido complejo4. Pondría el oscilador a 200 Hz. Ambas teorías de la percepción del tono pueden
· explicar este fenómeno simple.
4 El experiment'o descrito en esta sección fue realizado por Patterson ( 1 969).
LAS DIMENSIONES DEL SONIDO 275
La explicación de la teoría del lugar. El oído es no lineal. Produce diferencia de frecuencias·: los siete tonos presentados, proporcionan seis oportunidades para que una diferencia de frecuencia de 200 Hz sea añadida por la distorsión introducida durante la transmisión. Esta diferencia de frecuencia, por tanto, es una contribución impor• tante a la percepción del tono del sonido.
La explicación de la periodicidad del tono. El impulso que discurre por el nervio auditivo va siguiendo la forma de la pulsación de los sonidos. Existen no linealidades. Pero la actividad neural se eleva y desciende regularmente 200 veces por segundo, y es esta actividad la que está en la base del tono percibido del sonido.
Por tanto, la diferencia crítica radica en si la membrana se activa realmente en la región de 200 Hz. El teórico del lugar piensa que la membrana basilar vibra en el lugar de 200 Hz, y el sujeto lo percibe. El teórico de la periodicidad del tono piensa que la membrana sólo vibra en la región de alta frecuencia entre 1 .000 y 2.200Hz, pero los disparos neurales de estos lugares están sincronizados a 200 Hz. ¿En qué puede consistir el experimento crítico? Anular la membrana en el lugar de los 200 Hz y descubrir después si el sujeto aún puede oir el tono asociado.
Es bastante fácil anular la membrana. Un sistema consiste en añadir ruido de baja frecuencia a la señal -un sonido que contenga energía en todas las frecuencias anteriores a algún valor determinado. Para asegurarse que el ruido enmascara cualquier actividad de baja frecuencia, se añade ruido que contenga todos los componentes de frecuencia hasta 500 Hz. ¿Cuánta intensidad debe tener el ruido? -la intensidad suficiente para anular un tono real, si es que existe. Para determinar este valor, primero se presenta un tono real de 200 Hz al sujeto, y éste tiene que ajustar su intensidad de forma que suene exactamente tan fuerte como el tono de 200 Hz que escucha en el sonido complejo. Después se añade el ruido de baja frecuencia en cantidad suficiente para enmascarar por completo el tono real de 200 Hz. Este nivel de ruido será suficiente para enmascarar cualquier actividad producida por no linealidades. Una vez más, se produce el tono complejo. Esta vez se añade el ruido de enmascaramiento. ¿Se puede oir todavía el componente de 200 Hz?
La teoría de la periodicidad es correcta : el error fundamental aún se escucha cuando toda la actividad en su región de frecuencia está fisicamente enmascarado por el ruido. Además, para demostrar que en ruido tiene el efecto de enmascaramiento adecuado, si se
276 PROCESAMIENTO DE INFORMACION HUMANA
ha producido adecuadamente, se puede probar un ruido de alta frecuencia- un ruido que contenga todas las frecuencias anteriores a 500 Hz. Ahora bien, el teórico del lugar dirá que el tono de 200 Hz aún se puede escuchar, puesto que la localización asociada a la membrana no está anulada por medio de ruido de alta frecuencia. El teórico de la periodicidad argumenta lo contrario : la respuesta neural será anulada por el ruido de alta frecuencia, y el error fundamental ya no se oirá. ¿Cuál es el resultado? Presentando ruido de alta frecuencia, ya no se oye el error fundamental.
Intensidad 1 ;L SONmo COMeLEJO -
del sonido 1 1 1 1 1 1 1 200 500 1 000 2200
Frecuencia (H,) EL RUIDO
Intensidad 1 r=·�·· �,.1 del sonido 1 1 1 1 1 1 1 200 500 1000 2200
Frecuencia (H,) EL RUIDO
Frecuencia alta
Intensidad t 1 1 1 1 1 1 1 del sonido
200 500 1000 2200 FIGU RA 7- 1 6
Frecuencia (Hz)
DISCRIMINACIÓN DE TONO SIN MEMBRANA BASILAR '
Una forma de comprobar la utilidad de la teoría de la periodicidad, consiste en estudiar un animal que no tenga membrana basilar : ¿puede discriminar diferentes frecuencias acústicas, en esas condiciones? De acuerdo con la teoría del lugar, si no existe membrana basilar, no se puede codificar un tono. De acuerdo con la teoría de la periodicidad, la discriminación de tono será bastante buena, al menos hasta el punto donde el disparo neural ya no puede ir al mismo tiempo que la señal.
El pez dorado es un animal de este tipo. Tiene células ciliares, pero no membrana. El oído de la mayoría de los peces es bastante distinto al de los mamíferos -y por una buena razón. No solo están evolutivamente menos avanzados, sino que el agua es un medio peculiar para el sonido. El agua es más densa que el aire : el sonido viaja cinco veces más rápido en el agua que en el aire. Además, la densidad del agua no difiere mucho de la densidad de los tejidos y líquidos corporales. Esto significa que el oído externo y el oído medio son innecesarios, quizá hasta
El experimento sobre el pez dorado aparece en Fay ( 1 970) y Fay y MacKinnon
( 1 %9).
LAS DIMENSIONES DEL SONIDO 277
perjudiciales. El sonido tiende a viajar intacto a través del pez, sin disminuir su intensidad. Los oídos del pez están colocados en las vesículas de aire, y las diferencias encontradas entre los oídos de los peces parecen estar relacionadas con las diferencias en la forma en que están colocadas sus vesículas de aire. Lo más importante es que el pez -y el pez dorado en particular- tiene células ciliares y nervios acústicos, pero no membrana basilar. ¿Cómo puede entonces discriminar la frecuencia? (Figura 7-1 7).
. Cápsula de fonógrafo para medir los movimientos de la boca.
FIGU RA 7- 1 7
De Fay y MacKinnon ( 1969 ) .
278 PROCESAMIENTO DE INFORMACION HUMANA
Cuando el pez dorado está entrenado adecuadamente, puede decidir realmente entre unas frecuencias y otras. La comprobación se realiza asegurando al pez entre cojines de algodón y emparejando continuamente la presentación de un tono con un choque eléctrico. Se le presenta al pez una serie de tonos de la misma frecuencia. Después se cambia un tono de frecuencia, y se administra un choque eléctrico. El pez aprende pronto a anticipar el choque cuando cambia la frecuencia: manifiesta esta anticipación paralizando momentáneamente su respiración.
Los datos que se obtienen de esta forma se muestran en la Figura 7- 18 . Observe que el cambio mínimo de frecuencia que puede detectar el pez dorado es diez veces mayor que la cantidad mínima que pueden detectar los humanos. Aunque el pez es mucho menos sensible en términos absolutos, la forma en que su sensibilidad varía con la frecuencia es similar a la función de discriminación correspondiente al hombre. La capacidad del pez dorado para discriminar entre frecuencias desaparece alrededor de los 1 .000 a 2.000 Hz, exactamente lo que se podía sospechar a partir d� la teoria de la periodicidad : en estos niveles, el nervio ya no es capaz dedisparar en sincronía con la señal auditiva.
... <I
25 50 100 500 1000 2000 Frecuencia (Hz)
FIGURA 7- 1 8 D e Fay ( 1970)
Evidencia contra la teoría de la periodicidad del tono
4000
Aunque parece que la teoría de la periodicidad sale bien parada de estos experimentos de enmascaramiento, existen dos fenómenos que perturban la explicación de periodicidad de la percepción del tono. Uno consiste en que un nervio individual no puede responder
LAS DIMENSIONES DEL SONIDO 279
más rápidamente que 300 ó 400 veces por segundo. ¿Cómo puede entonces servir de base para percibir tonos que corresponden a señales de 4.000 Hz? Un sengundo problema consiste en la interesante anomalía de la audición llamada diplacusis, que hace percibir el mismo sonido con un tono distinto en cada oído. ¿Cómo puede ocurrir esto si los nervios disparan con la tasa de vibración de la membrana ?
Para responder a la primera crítica, los teóricos de la periodicidad se atienen en gran medida al principio de la descarga (ver página 243). Las neuronas disparan en conjunto, siendo capaz un grupo de fibras nerviosas de seguir una frecuencia que ninguna podría seguir aisladamente. Si un nervio dispara con una tasa de solo 300 Hz, un grupo de cuatro neuronas es capaz de disparar con una tasa combinada de 1 .200 Hz, puesto que todas están adecuadamente sincronizadas. Aún así, no existe ninguna evidencia de que los nervios, aisladamente o en grupo, puedan seguir estructuras de frecuencias auditivas superiores a 2.000 o quizá 3 .000 Hz.
Una de las evidencias más definitivas contra la teoría de la periodicidad como explicación completa, es la anomalía de la diplacusis, una dolencia que concede credulidad a la teoría de que el tono está determinado por la localización de la vibración máxima de la membrana. Los que sufren de un caso severo de diplacusis, oirán dos tonos distintos cuando se escucha el mismo sonido en cada oído. En realidad, todos percibimos una pequeña diferencia en el sonido escuchado en los dos oídos, especialmente en frecuencias elevadas. La explícación más simple es que no existe un paralelo perfecto de posiciones a lo largo de la membrana basilar. De hecho, si se considera la precisión de actividad neural que sería necesaria para conseguir que cada par de localizaciones en las dos membranas se correspondan exactamente, resulta sorprendente que el fenómeno no sea más acusado. Sería sorprendente aun cuando las dos membranas tuviesen exactamente el mismo tamño, al margen de la parificación neurona a neurona. Además, cuando se continúa el procesamiento neural hacia el cerebro, es evidente que existen muchos lugares donde puede producirse un ligero desajuste entre las localizaciones de las fibras neurales y las frecuencias críticas para las que son más sensibles (ver van den Brink, 1 970).
La duplicidad de la teoría de la percepción del tono
La explicación correcta de la percepción del tono parece necesitar una amalgama de las dos posiciones teóricas. Desde luego, el lugar
280 PROCESAMIENTO DE INFORMACION HUMANA
de la membrana basilar es una parte extremadamente importante para la extracción de información tonal de una señal : la evidencia en favor de este punto de vista es abrumadora. Pero también parece que la forma de disparar de las neuronas proporciona información adicional del tono, particularmente en las frecuencias inferiores a 1 . 000-2.000 Hz. El caso de la equivocación o error fundamental es dificil de explicar de otra manera. Pero no existe ninguna razón por la que ambas teorías no puedan ser correctas : se complementan muy bien entre sí.
La localización donde la vibración máxima ocurre en la membrana basilar, parece que es un determinante primario del tono, complementado por la información prestada por la tasa de respuesta de las fibras del nervio acústico. Si las fibras localizadas en el lugar de 1 .000 Hz responden con una tasa de disparo de 1 .000 Hz, todo es consistente. La percepción es de un tono producido por un sonido de 1 . 000 Hz. Si las fibras en el lugar de 1 .000 Hz responden en forma de 1 00 Hz, entonces la percepción es de un sonido complejo, con un tono fundamental igual al de un sonido de 100 Hz, pero con una estructura armónica en la región de 1 .000 Hz. En este caso, la tasa de disparo ayuda a determinar el tono : el lugar donde la membrana responde, determina la cualidad del sonido o timbre. La estimulación de un lugar en la membrana basilarsiempre va acompañada de una tasa de disparo adecuada a ese lugar. Sin embargo, las tasas de disparo no siempre van acompañadas por estimulación de la localización adecuada de la membrana.
Esta duplicidad de operación se supone que actúa solo en frecuencias inferiores a 1 .000 ó 2.000 Hz. Por encima de ese punto, · es improbable que los disparos neurales puedan estar sincronizados con las tasas de vibración. (Observe que algunos investigadores piensan que la periodicidad del tono, provocada por la tasa de disparo, puede llegar hasta 4.000 Hz.) De esta manera, para frecuencias entre 1 . 000 ó 4.000 Hz y 20.000 Hz, el mecanismo del lugar debe ser �l Ímico responsable de la percepción del tono. Pero la mayoría de los sonidos naturales utilizados por los humanos para la comunicación o para la creación, ocurren en frecuencias más bajas, donde pueden actuar ambos mecanismos. La nota más alta de una soprano tiene una frecuencia fundamental de unos 1 .400 Hz.
LA BANDA CRÍTICA
Supongamos que se le presentan dos tonos puros a un sujeto, que tiene que juzgar la sonoridad del sonido resultante. A medida
LAS DIMENSIONES DEL SONIDO 28 1
que los dos tonos se distancian más en frecuencia (manteniendo_ constante el promedio de su frecuencia), el sonido combinado no cambia de sonoridad hasta que se excede una separación crítica de frecuencia. Más allá de esta, la sonoridad del par de sonidos incrementa con la creciente separación de frecuencias.
1 5
1 00 200 500 1 000 2000 6Hz
5000
6 Hz = � - /L .• /H +/L Media = -- = 2000 Hz
2
FIGURA 7- 19 De Scharf (1970) .
De una manera similar, un sonido que contiene componentes de todas las frecuencias entre una frecuencia inferior f¡ y una superior ftt. parece que tiene una sonoridad constante a medida que la distancia entre fi y ftt incrementa, hasta que de nuevo se alcanza un valor crítico de separación. A partir de este punto, la sonoridad incrementa a medida que se añade frecuencia 6 .
6 Observe que debe mantenerse constante l a energía del sonido (llamado ruido de paso de banda, donde el paso de banda hace referencia a las frecuencias entre fi y fH). Para ver como se realiza esto, consideremos un caso simple que consiste en presentar un sonido compuesto de tonos separados a un sujeto. Si se añaden más sonidos, es importante para la tarea que se mantenga constante la energía total. De esta manera, si se duplica el número de sonidos, la energía de cada sonido presentado tiene que dividirse por la mitad para mantener constante la energía total. Así .ocurre con el ruido : el nivel de energía de cada frecuencia se mantiene proporcional a l /(fH - Íi).
282 PROCESAMIENTO DE INFORMACION HUMANA
Consideremos un tercer ejemplo, un sujeto que intenta detectar un tono puro que está enmascarado por un ruido de paso de banda centrado alrededor de la frecuencia de tono. A medida que se incrementa la distancia entre fi y fH, la detección se hace más dificil hasta que se alcanza una separación crítica. Más allá de ese punto, la detección ya no se ve afectada por los posteriores incrementos en la amplitud de la banda de ruido.
Los tres ejemplos indican que dentro de una región crítica de frecuencia, las energías sonoras interactúan entre sí . A medida que nos desplazamos fuera de esa región crítica, las energías sonoras ya no interactúan, aunque se añadan atributos psicológicos. La región crítica se llama la banda crítica. Su tamaño depende de su centro de frecuencia.
5000
2000
'N ; 1000 " .. g ·5 500" 2l 2 � 200
� � 100 t:--------� <
50
20 LJ...LJ...uJL__.1.__L_J_.L..1..J...LLI----'---1---L.-'-........, ........ � 50 1 00 200 500 1000 2000 5000 10,000
Frecuencia (Hz)
FIGURA 7-20 De Scharf ( 1970 ) .
Si nos fijamos en la forma de excitación a Jo largo de la membrana basilar, .es muy simple encontrar un correlato de la banda crítica, similar a los correlatos encontrados para la escala de d.m. p. y de mel en los tonos. Ofrecemos un diagrama de las formas de actividad producidas por dos tonos separados por 300 Hz.
Una d.p.m. de las diferencias de frecuencia en esta región sería de J /50 de la separación representada aquí. Así , aunque exista
LAS DIMENSIONES DEL SONIDO 283
una gran superposición en las formas producidas por los tonos, los sonidos se discriminan fácilmente en el hombre. De hecho, estos tonos están separados por dos bandas críticas, colocadas más allá de la región donde aún interactúan en nuestras percepciones psicol
1ógicas. Comparando la Figura 7-21 con las propiedad:s de
la membrana basilar con las escalas mel y de d.m.p., las relaciones entre estos factores pueden resumirse de la siguiente manera :
• 1 mel es equivalente a 1 2 neuronas, 0,23 d.m.p. y 0,009 bandascríticas ;
• 1 d.m.p. es equivalente a 52 neuronas, 4,3 mels y 0,04 bandascríticas ;
• 1 banda crítica es equivalente a 1 300 neuronas, 108 melsy 25 d.m.p.
o 10 20 Distancia de la ventana oval (mm)
30
FIGURA 7-21 De Zwislocki ( 1965).
La banda crítica tiene muchas propiedades importantes. Las pulsaciones entre distintos sonidos parece que sólo son detectables si los sonidos implicados caen dentro de la misma banda crítica. Así, el fenómeno de periodicidad del tono requiere que los componentes que producen un error fundamental deben estar suficientemente justos -es decir, dentro de una amplitud de banda crítica. También se ha sugerido que la banda crítica es el mecanismo responsable de la disonancia asociada con alguna combinación de sonidos. Se argumenta que la disonancia es el resultado de pulsaciones provocadas por dos sonidos cuyas frecuencias descansan dentro de una amplitud de banda crítica de otro sonido. Los instrumentos musicales producen tonos complejo�:, que contienen muchas frecuencias armónicas. Dos sonidos pueden ser disonantes si un par de
284 PROCESAMIENTO DE INFORMACION HUMANA
sus tonos armónicos caen dentro de la misma banda crítica. Cuanto más audibles son estos armónicos, más disonante es el sonido.
PERCEPCIQN ESPACIAL AUDITIVA
Tenemos dos oídos, pero solo oímos un solo mundo acústico. Gracias a las diferencias de información recibidas al escuchar con dos oídos ( binaural) en lugar de hacerlo con uno ( monaural) ,podemos determinar la localización de las fuentes de sonido, un factor importante tanto para la utilización de nuestras percepciones como para hacer más inteligibles los mensajes acústicos. Es díficil darse cuenta de la importancia de la localización del sohido porque raramente carecemos de ella : es un fenómeno tan común que se da por sentado.
Sin embargo, con los modernos aparatos auditivos es fácil demostrar la importancia de la localización del sonido. Escuche una buena grabación estereofónica de alta calidad con auriculares 7 •
Después cambie alternativamente entre la reproducción monofónica y estereofónica. Fíjese en la diferencia. La reproducción estereofónica no solo permite percibir los sonidos como si se produjesen en distintos lugares del imaginario espacio que le rodea, sino que también proporciona una sensación más rica de sonidos -una sensación donde los distintos sonidos ·sop más característicos y más fáciles de escuchar.
Localización
Los indicios utilizados para localizar una fuente de sonido son el tiempo y la intensidad exacta en que los sonidos llegan a los dos oídos. Los sonidos llegan primero al oído más cercano a la fuente y llegan con mayor intensidad. La cabeza tiende a producir una sombra acústica entre la fuente y el oído más lejano (Figuras 7-22).
Mediante un simple cálculo, es posible determinar el tiempo máximo de retraso entre las señales que llegan a los dos oídos.
7 Los altavoces no tienen un efecto tan drástico, a menos que los sitúe de forma que un altavoz esté directamente a su izquierda y el otro directamente a su derecha. La grabación debe estar realizada en un estudio de reproducción estereofónica -las grabaciones antiguas no son muy útiles para este propósito. La mayoría de las grabaciones de los buenos grupos de rock o de las sinfónicas actuales son magníficas.
LAS DIMENSIONES DEL SONIDO 28S El ancho de la cabeza humana es aproximadamente de 18 cm. Si una fuente de sonido está directamente localizada a un lado, el sonido llega también directamente a un lado, pero tiene que recorrer la circunferencia de la cabeza para alcanzar el otro oído. Si se supone que la cabeza es una esfera con un radio de unos 9 cm, la longitud del recorrido extra es de 9n, o de 28 cm. Puesto que el sonido viaja aproximadamente a 335,5 m seg·1 en el aire, tarda unos 76 µseg en recorrer 2,5 cm. En consecuencia, un sonido que recorre la distancia entre los oídos tarda unos 840 µseg.
Sonido «Sombreado» que se produce cuando Ja cabeza bloquea todas las ondas sonoras y no existe defracción o «cimbreo» de las ondas sonoras
FIGURA 7-22
Camino del sonido
hasta el oido (derecho)
Camino del sonido hasta
cerca del oido (izquierdo)
286 PROCESAMIENTO DE INFORMACION HUMANA
Como es lógico, esta diferencia de tiempo depende de donde esté situada la fuente de ruido. Cuando el sonido está frente a la cabeza, alcanza ambos oídos al mismo tiempo. Cuando el sonido está a 3º a la derecha, llega al oído derecho 30 µseg antes que al izquierdo. Este pequeño cambio -30 µseg de diferencia de tiemp(}----- se puede detectar. Es todo lo que necesita un observador para detectar un cambio en la localización de la fuente de sonido. Es una actividad asombrosa, especialmente porque las señales de los dos oídos tienen que compararse entre sí para poder localizar el sonido. El sistema nervioso tiene que conservar la información sobre el tiempo que tardan las señales en llegar a un oído con una exactitud de 30 µseg.
La diferencia de tiempo en la llegada de una señal a los dos oídos tiene como resultado una diferencia de fase entre las señales : una se retrasa con respecto a la otra. En señales de alta frecuencia, este retraso es ambiguo y no puede utilizarse como un indicio de localización. Para entenderlo, veamos lo que ocurre con una señal de 1 0.000 Hz. Realiza un ciclo de variación de presión de sonido cada 1 00 µseg. Cuando una señal de 1 0.000 Hz está delante y hacia la derecha en un ángulo de 55º, el sonido llegará al oído izquierdo unos 450 µseg después de que llegue al derecho. La onda escuchada a la derecha va, por tanto, 4 t ciclos por delante de la onda de la izquierda. Pero, ¿cómo se puede saber si dos tonos difieren en 4! ciclos, 3t, 2t o hasta t ciclos ? De igual forma, ¿cómo se puede saber si la fuente está a 55º a la derecha o está a 40º, 27º, 1 7º ó 6º ? No hay manera. El mayor retraso de tiempo entre los oídos es de unos 840 µseg, y cualquier frecuencia sonora que tarde menos tiempo en completar un ciclo proporciona una información ambigua sobre la localización. Las diferencias de tiempo solo proporcionan buenos indicios en la localización de sonidos cuyos componentes de frecuencia sean menores a unos 1 . 300 Hz.
En realidad, la localización es ambigua aun en las frecuencias bajas, puesto que si la cabeza está completamente quieta, la diferencia de tiempo no puede distinguir por sí solo si un sonido viene de arriba o de abajo, ni de frente o de atrás. Un sonido de frente y otro lateral tienen el mismo retraso que uno a la espalda en la misma posición relativa. En las situaciones reales, estas ambigüedades pueden eliminarse mediante los movimientos de cabeza, indicios visuales y por diferencias en la calidad del sonido provocadas por la forma en que son reflejadas y refrectadas las distintas frecuencias en la cabeza y el oído externo.
LAS DIMENSIONES DEL SONIDO 287 l-r -1-r -I 1 • 1 1 1 1 1 1 1 d= diferencia .en la longitud del caminor= radio de la cabeza (alrededor de 9 cms.)
0= ángulo de la fuente sonora en radianes
ld=r0 + r sen 0 j IF 0= 30" =8,52 radianes d= 3,5 x 0.5 + 3,5 sen 30º d= l ,75+ l ,75 =3,5 pulgadas Diferencia de tiempo= 76 x d
msec = 270 msec
FIGU RA 7-23 Cálculo aproximado de la diferencia binaural en la longitud del camino de una fuente sonora distante.
Un segundo indicio para la localización del sonido es la sombra sonora causada por la cabeza. En los sonidos de baja frecuencia, la onda sonora se difracta y «rodea» la cabeza, provbcando poca o ninguna sombra. Pero con frecuencias altas -cuando la longitudde onda es corta en comparación con las dimensiones de la cabezano existe difracción en un grado significativo. Por ejemplo, un sonido de 1 00 Hz tiene una longitud de onda de unos 335 cm. Por tanto, rodea fácilmente la cabeza. Pero un sonido de 1 0.000 Hz tiene
288 PROCESAMIENTO DE INFORMACION HUMANA
una longitud de onda de solo 3,30 cms. de forma que se refleja en la cabeza, provocando así una sombra. Con una fuente de sonido de un ángulo �e 1 5º, se pueden medir los efectos de la sombra sonora :
Frecuencia
300 Hz 1 . 100 Hz 4.200 Hz 10.000 Hz 1 5.000 Hz
Razón de intensidades sonoras en los dos oídos
l dB 4 dB 5 dB 6 dB
10 dB
A partir de 3.000-4.000 Hz, la diferencia de intensidad es lo suficientemente grande como para que se pueda discriminar con seguridad, y proporcionar así un índice útil de localización.
La localización sonora se realiza mediante un sistema dual : diferencias de tiempo para las frecuencias bajas y diferencias de intensidad para frecuencias altas. El cambio de un sistema a otro se produce en la amplitud de frecuencia · de 1 .000-5.000 Hz -el rango de frecuencias sonoras caracterizadas por la cantidad máxima de error en la localización.
Interacciones binaurales
Para explicar la precisión con que se localizan los sonidos, el sistema auditivo tiene que poder detectar diferencias de tiempo del orden de unos 1 0 ó 20 µseg. Su diseño anatómico parece ser útil para conservar la información temporal contenida en las neuronas auditivas primarias 8 .
Anteriormente, observamos que las señales neurales que salen del oído recorren una distancia muy corta antes de que lleguen al punto donde se combinan los mensajes de los dos oídos : la
8 Un hecho curioso : puesto que la resolución temporal para precisar la localización es igual para todos los animales, ¿qué ocurre con los grandes animales? El elefante tiene quizá la cabeza más grande de todos los mamíferos terrestres. Pero los distintos componentes de su sistema auditivo no están graduados proporcionalmente a su tamaño. Por el contrario, tiene un canal auditivo extraordinariamente largo ----<:asi unos 1 1 ,5 cm. de longitud. Esto hace que los oídos internos estén 23 ó 25 cm más cerca entre sí que lo que sugiere el tamaño de la cabeza. Sin estos grandes canales auditivos, el elefante necesitaría fibras nerviosas relativamente largas para conectar los dos oídos, lo que podría incrementar el riesgo de perder la información temporal precisa que se necesita para la localización.
LAS DIMENSIONES DEL SONIDO 289
oliva superior. En la oliva superior, ocurren las interacciones excitadoras e inhibidoras entre las señales que llegan a ambos oídos --el tipo de mecanismo necesario para la localización binaural. En la Figura 7-24, por ejemplo, existe un esquema del tipo general de interconexiones que ocurren en la oliva superior (se representan los excitadores por E y los inhibidores por 1). (La anatomía exacta aún no la hemos desarrollado por completo). Muchas neuronas individuales de la oliva superior responden diferencialmente, en función del oído que responde primero a la señal. Si la señal se produce primero en un oído, la tasa de respuesta de la unidad es superior que si la señal ocurre antes en el otro oído. Las distintas neuronas parecen tener preferencia por diferentes lados. Además, en el gato, la amplitud de las diferencias de tiempo donde se observa este efecto es de unos 250 µseg, aproximadamente el tiempo que tarda un sonido en ir de un lado a otro de la cabeza del gato. Existe una relación similar en las diferencias de intensidad de sonido. Los resultados de ambas variables combinadas proporcionan una fuerte evidencia de que la estación nerviosa suministra la información importante para la localización de sonidos en el ambiente.
.
Hacia los centros auditivos superiores
Oliva superior
Del oído izquierdo Del oído derecho
F I GURA 7-24 De van Bergeijk ( 1962).
290 PROCESAMIENTO DE INFORMACION HUMANA
Parece que también están implicados algunos niveles superiores del sistema auditivo en la comparación de señales que llegan a los dos oídos -por ejemplo, el colículo inferior. Muchas unidades del colículo inferior pueden activarse por sonidos de ambos oídos. Algunas unidades son excitadoras, otras inhibidoras, y aun otras producen el tipo de interacciones necesarias para la localización. Las respuestas son similares a las encontradas en la oliva superior. Al mismo tiempo, el colículo está organizado de forma que las distintas frecuencias auditivas estén representadas de una manera muy ordenada. Esto es una ayuda tanto para los juicios de tono como para la separación y localización de las distintas frecuencias sonoras.
Aunque estamos comenzando a descubrir algunos mecanismos nerviosos implicados en la comparación y combinación de señales de ambos oídos, el problema de explicar la localización está lejos de estar resuelto. ¿Cuáles son los mecanismos neurales que nos dicen que algo está a 37° a la derecha y ligeramente hacia arriba? ¿Cómo se distinguen y localizan las formas sonoras complejas, como cuando hablan varias personas al mismo tiempo? ¿Estos problemas están más allá de nuestro actual estado de conocimiento ?
Importancia de la audición binaural
Además de añadir una dimensión espacial a la percepción del sonido, la presentación binaural también proporciona claridad. Esto es una consecuencia de tres mecanismos distintos : la localización, una reducción evidente de interferencia y la minimización del enmascaramiento.
Localización. La localización nos permite extender en el espacio una gran cantidad de los sonidos que escuchamos. Vamos a suponer que estamos rodeados de personas aburridas en una reunión. Podemos mover la cabeza y asentir, cuando en realidad atendemos a una conversación cercana. Esto es posible gracias a la localización. Podemos seleccionar la frecuencia, intensidad o localización especial en la que deseamos escuchar.
Cuando se graba una conversación, es dificil a veces entenderla cuando se reproduce. Aparecen ecos y ruidos. Los sonidos de la gente tosiendo y moviéndose, oscurecen la voz deseada. En la situación real, no nos damos cuenta de estos ruidos, aun cuando se producen de hecho. Los indicios de localización nos permiten atender
LAS DIMENSIONES DEL SONIDO 29 1
selectivamente a las señales auditivas de interés. Se produce una drástica mejoría cuando se añade un segundo micrófono -realizando una grabación estereofónica. De este modo, podemos escuchar dónde se produce la voz, eliminando las distorsiones. Todo lo que se necesita son dos micrófonos diferencialmente sensibles a la dirección del sonido. Se tienen que situar adecuadamente, siendo uno principalmente sensible a los sonidos que llegan de la derecha, mientras que el otro recoge los sonidos de la izquierda. Cuando una persona habla entre los dos micrófonos, ambos realizan la grabación de la voz. Si la persona se coloca hacia un lado, entonces su voz alcanzaría más a uno que a otro.
Los problemas que se plantean al escuchar un canal único, una grabación monaural, ilustran perfectamente los problemas que tienen los individuos que son sordos de un oído. La dificultad no se produce tanto por la disminución de sensibilidad al sonido, como por la reducción de capacidad para localizar sonidos. Si se utiliza un aparato auditivo, ¿donde debe colocarse el micrófono ? Si se pone el micrófono en un bolsillo de la camisa, no es posible conseguir una localización normal. El micrófono debe estar tan cerca como sea posible del oído. De hecho, lo mejor es utilizar dos aparatos, uno para cada Gído (aun cuando un oído sea normal), para recuperar la capacidad de localizar sonidos.
Enmascaramiento de la diferencia de nivel. La segunda manera de mejorar la claridad de recepción binaural, se produce mediante el fenómeno llamado enmascaramiento de la diferencia de nivel. Cuando intentamos oir una voz débil mezclada con ruido en un solo oído, la producción del mismo ruido en el otro oído mejorará mucho la claridad. Un oído escucha la señal y el ruido ; el otro solamente el ruido. Una forma de comprender esto, consiste en imaginar que las entradas a los dos oídos se restan entre sí, consiguiendo la anulación del ruido. Por tanto, no sería útil producir tanto la señal como el ruido en ambos oídos : se anularían entre sí las entradas de los dos oídos. Una forma alternativa de concebir este fenómeno, es observar que el ruido que se presenta en ambos oídos se lateraliza en el centro de la cabeza, mientras que la señal se escucha en un solo oído. La diferencia de localización especial provoca una mejoría de claridad.
Enmascaramiento. Existe una tercera forma de mejorar la claridad de la recepción binaural. Imagínese escuchando una orquesta con un bombo percutiendo, mientras que un clarinete toca registros
292 PROCESAMIENTO DE INFORMACION HUMANA
bajos. Si esto se graba por un solo canal, las frecuencias muy bajas del bombo enmascaran las frecuencias bajas del clarinete. Esto se produce por la superposición de la excitación a lo largo de la membrana basilar. Sin embargo, si el clarinete y el bombo . se escuchan en oídos opuestos, no se produce ninguna interacción en la membrana : no existe enmascaramiento. Evidentemente, en condiciones reales, los sonidos del clarinete y del bombo llegarán a ambos oídos, pero si el oyente mueve la cabeza, puede ajustar los elementos de forma que la mayor parte del sonido de un instrumento llegue a un oído y el del otro instrumento alcance el otro. Esta eliminación del enmascaramiento hace que los sonidos se escuchen con más claridad y diferenciación en una grabación binaural que en una monaural.
Grabaciones
Para conseguir la grabación de un acontecimiento que suene realmente como si estuviese situado en el auditorio, se necesita realizar una grabación binaural. Para conseguir esto adecuadamente, se necesita colocar la reproducción de una cabeza en un asiento del auditorio, con micrófonos en cada uno de los falsos oídos. Cuando se escucha la reproducción con auriculares, la grabación binaural presenta una magnífica fidelidad.
Las grabaciones binaurales son muy distint(.l.s de las estereofónicas, que se utilizan en la mayoría de los discos y cintas. En la grabación estereofónica, el objetivo es intentar introducirse en las ondas frontales cuando atraviesan algún punto del auditorio, y reproducirlas en casa del que quiere escucharlas. No existe forma de conseguir esto con exactitud con sólo dos micrófonos y dos altavoces. Por esta razón, se están probando actualmente grabaciones de tres y cuatro canales. Teóricamente, con dos altavoces deberían existir dos micrófonos separados por la misma distancia que la que tendrán los altavoces. Esto no es muy útil, puesto que exige demasiado control de las condiciones de reproducción. En consecuencia, los ingenieros de grabación han aprendido a combinar muchos micrófonos, prirn::ipalmente por ensayo y error. Se pueden obtener buenos resultados de esta manera, hasta el punto de que es la manera usual de realizar las grabaciones actuales. En general, cuando alguien desea conseguir una buena grabación, utiliza muchos micrófonos desperdigados por el auditorio : los ingenieros de grabación determinan cómo hay que combinarlos en dos canales para
Cinta o disco de dos canales
Cinta o disco de dos canales
LAS DIMENSIONES DEL SONIDO 293
GRABAClON BlNAURAL
Cinta de .. grabación de .dos canales
��::;----i:l�I l�l1--REPRo
-
oucc10N-BtNAuRA
-
L--,J
. � Oyente
FIGURA 7-25
Auriculares
GRABAClON ESTEREOFONICA
Cinta de dos canales M
REPRODUCCION ESTEREOFONICA
294 PROCESAMIENTO DE INFORMACION HUMANA
,I \ /
I /\ I / \
/ / I I
/ // /
I 1 1 I
I I /
I 11 / / ,,, / /'
\ \
\ \
\
Caminos indirectos
al oído _ ,.. I / / /\ / /
\ //
/' \ \ / / /,,,,, /
- .-
/ Caminos directos _. _... .- _. _. al oído - - _ _.
/ \y. /,,,, \\ ,. , � -.... ", � ............ �
sonido
//¡ / / - - -// / I _... ---;_.--;:,.. .--
'I' / - _¿::-- -.¡' -1
�,.... .,,.r/' -/ I
I I
� ' 11 \ / \, t I \\ I / \ Y. I
FIGU RA 7-26
conseguir el efecto adecuado. La acústica psicológica no es de gran ayuda en este proceso. La mejor forma de combinar canales probablemente difiere en función de cada auditorio, de cada persona de la audiencia y posiblemente en función de cada forma de vestir de la audiencia.
El efecto de prioridad
En teoría, la localización se realiza utilizando simplemente las diferencias en el sonido que llega a los dos oídos. Sin embargo, la señal inicial va seguida inmediatamente de numerosos ecos. Si se tienen en cuenta todos los ecos, hasta un simple golpe puede ser muy complicado. En primer lugar, el golpe llega a un oído, después al otro, y después comienzan a llegar a los dos oídos
' 1
' .. 1,,t ' ' �·
LAS DIMENSIONES DEL SONIDO 295
fragmentos que rebotan en las paredes y en el techo de la habitación. ¿Cómo se puede utilizar todo en el proceso de localización?
Afortunadamente, parece que sólo se utiliza el primer sonido que llega. Esto es lo que se llama el efecto de prioridad. Todavía no se comprende por completo. Los ecos no juegan casi ningún papel en la interpretación psicológica del sonido. Prácticamente, no se oyen. Si grabamos varios sonidos, unos seguidos de eco y otros sin eco, es fácil apreciar la diferencia entre ellos. De esta forma, se escucha la i nformación sonora, pero afortunadamente se ignora por los mecanismos responsables de la localización.
LECTURAS RECOMENDADAS
Además de las lecturas recomendadas en el Capítulo 6, no existe realmente demasiado material de fácil utilización, para estudiar las dimensiones de la audición. El capítulo de Zwislocki ( 1 965) en el Handbook .of Mathematical Psychology (volumen 111) es magnífico, aunque un poco avanzado. No se debe desesperar demasiado por las ecuaciones de la primera parte del capítulo. Hemos visto que los estudiantes de introducción pueden obtener buenos resultad0s de este capítulo, si pasan un poco rápidamente estas primeras secciones. La última parte del capítulo es especialmente valiosa, por la discusión de las relaciones entre la anatomía y fisiología del oído y de la percepción del sonido, tono y enmascaramiento.
El libro editado por Tobías ( 1970, en preparación), Foundations of Modern A uditory Theory, incluye varios capítulos importantes, especialmente sobre la medida del sonido y sobre las distintas teorías de la percepción del tono.
El libro de Kryter ( 1970) cubre con detalle The Effect of Noise on Man (el efecto del ruido en el hombre, que también es su título). Desgraciadamente, aunque el material tratado en el libro es muy importante, el nivel del desarrollo lo convierte en dificil para el lector.
REFERENCIAS
ARNHEIM, R. Art and visual perception. Berkeley : Univ. of California Press, 1969. (a)
ARNHEIM, R. Visual thinking. Berkeley : Unív. of Calífornía Press, 1 969. (b). BARLOW, H. B., HlLL, R. M . , & LEVICK, W. R. Retina! ganglion cells responding
selectively to direction and speed of image motion in the rabbit. Journal of Physiology, 1 964, 173, 377-407.
BÉKÉSY, G. von. On the resonance curve and decay períod at various points on
the cochlear partition. Journal of the Acoustical Society of America, 1 949, 21, 245-254.
BÉKÉSY, G. von. Experiments in hearing. New York : McGraw-Hill, 1 960. BÉKÉSY, G. von Sensory inhibition. Princeton, N.J. : Princeton University Press,
1 967. BISHOP, P. O. Central nervous system : AITerent mechanisms and perception. Annual
Review of Physiology, 1 967, 29, 427-484. BISHOP, P. O., & HENRY, G. H. Spatial vision. Annual Review of Psychology, 1 97 1 ,
22, 1 1 9- 1 60. BOLT, R. H., COOPER, F. S . , DAVID, E. E., JR., DENES, P. B., PICKETT, J. M . ,
& STEVENS, K. N . Identification o f a speaker b y speech spectrograms. Science, 1969, 166, 398-342.
BUCHER, F. Joseph Albers. Despite straight fines. New Haven : Y ale University Press, 1 9 6 1 .
CARRAHER, R . G . , & THURSTON, J . B . Optical illu:stions and the visual arts. Princeton, N. J. : Van Nost:and-Reinhold, 1 968.
CHAPANIS, A. The dark adaptation of the color anomalous measured with lights of different bues. Journal of General Physiology, 1 947, 30, 423-437.
CHOMSKY, N . , & HALLE, M. The sound pattern of English. New York : Harper, 1 968.
COREN, S. Brightness contrast as a function of figure-ground relations. Jaurnal af Experimental Psychology, 1 969, 80, 5 1 7-524.
CoRNSWEET, T. N. Information processing in human visual systems. Standord Research lnstitute Journal. 1 969, Feature issue No. 5.
CORNSWEET, T. N. Visual perceptian. New York : Academic Press, 1 970. CREUTZFELDT, O., & SAKMANN, B. Neurophysiology of vision, Annual Review of
Physio/ogy, 1 969, 31, 499-544. DAVSON, H. (Ed) The eye. New York: Academic Press, 1 962. DENES, P. B., & PlNsON, E. N. The speech chain. Murray Hill, N. J. : Bell Telephone
Laboratories, Inc., 1 963. (Available from the business office of the local Bell System Telephone Company.)
DEUTSCH, S. Models of the nervous syslem. New York : Wiley, 1 967. DEV ALOIS, R. L., & lAcoBs , G. H. Primate color vision. Science, 1 968, 162, 533-540. DooWELL, P. C. Visual pattern recognition. New York : Holt, 1970. EccLES, J. C. The neurophysialogical basis of mind. London and New York: Oxford
University Press, 1 953. EccLES, J. C. The physiology of synapses. Berlín and New York : Springer-Verlag,
1 964.
298 PROCESAMIENTO DE INFORMACION HUMANA
EccLES, J. C. Possible ways in which synaptic mechanisms participate in learning, remembering and forgetting. In D. P. Kimble (Ed.), The anatomy of memory. Vol. l. Palo Alto, Calif. : Science and Behavior Books, 1 965.
ENRIGHT, J. T. Stereopsis, visual latency and three-dimensional moving pictures. American Scientl�t. 1 970, 58(5), 536-545.
ESCHER, M. C. The graphíc work of M. C. Escher. New York: Meredith Press, 1 967. (lst ed. 1 96 1).
FAY, R. R. Auditory frequency stimulation in the goldfish (carassius auratus) . Journal of Comparative & Physiological Psycho/ogy, 1 970, 73(2), 1 75-1 80.
FAY, R. R., & MAcKINNON, J. R. A simplified technique for conditioning respiratory mouth movements in fish. Behavioral Research Methods and Instrumentation, 1 969, 1, 3 .
FESTINGER, L . , COREN, s., & RIVERS, G . The effect o f attention o n brightness contras! and assimilation. Amerícan Journal of Psychology, 1 970, 83, 1 89-207.
FLOCK, H. R., & FREEDBERG, E. Perceived angle of incídence and achromatic surface color. Perception & Psychophysícs, 1 970, 8, 2 5 1 -256.
GIBSON, A. R., & HARRIS, C. S. The McCollough effect : Color adaptation of edge-detectors or negative afterimages? Paper presented at the annual meeting of the Eastern Psychological Association, Washington, D. C., April 1 968.
GIBSON, J. J. The perception of the visual world. Boston : Houghton, 1 950. GIBSON, J. J . The senses considered as perceptual systems. Bosto n : Houghton, 1 966.
GOMBRICH, E. H. Art and illusion. New York : Pantheon, 1 960. GRAHAM, C. H. (Ed.) Vision and visual perception. New York : Wiley, 1 965.
GRASSELLI, A. (Ed) Automatic interpretation and classiflcation of images. New York : Academic Press, 1 969.
GREEFF, Z. Graefe-Saemisch Hb. ges, augenheilk, I l , Kap. 5, 1 900, l. GREGORY. R. L. Eye and braín : The psycho/ogy of seeing. New York : McGraw-HilL
1 966. GREGORY, R. L. The intelligen t eye. New York : McGraw-Hill. 1 970.
GRoss. C. G. A comparison of the effects of partía! and total lateral frontal lesions on test performance by monkcys. Journal of Comparative & Physiological Psychology, 1 963. 56, 4 1 -47.
GuucK. W. L. Hearing : Physio/ogy and psychophysics. London and New York : Oxford University Press. 1 971 .
GUZMÁN, A. Decomposition of a visual scene into three-dimensional bodies. In A. Grasselli (Ed.), Automatic interpretation and classification of images. New York : Academic Press. 1 969.
HABER, R. N. (Ed.) Contemporary theory and rescarch in visual perception. New York : Holt. 1 968.
HABER. R. N . Eidetic images. Scient!fic American, 1 969, 220, 36-44. (a) HARRIS, C. S. Perceptual adaptation to inverted, reversed, and displaced vison.
Psycho/ogical Review, 1 965. 72, 4 1 9-444.
HARRIS, C. S . . & GrnsoN, A. R. Is orientation-specific color adaptation in human vision due to edge detectors, afterimages or «dipoles?» Science, 1 968, 162, 1 506-1 507. (a)
HARRIS, C. S., & GIBSON, A. R. A minimal model for McCollough's orientation-specific color aftereffect. Paper presented ac t_he annual meeting of the Psychonomic Society, St. Louis. November 1 968. (b)
HARTLINE, H. K . . & RATLIFF, F. l nhibitory ínteraction of receptor units in the eye of Iimulus. Journal of General Physiology, 1 957. 40, 357-376.
REFERENCIAS 299 HECHT, S., & Hs1A, Y. Dark adaptatíon following light adaptation to red and
white lights. Journal of the Optical Society of America, 1 945, 35, 261 -267. HELD, R. Dissociation of visual functions by deprivation and rearrangement. Psycho
logische Forschung, 1 968, 31, 338-348. HOCHBERG, J . Perception. Englewood Cliffs, N. J. : Prentice-Hall, 1 964. HOCHBERG. J. In the mind's eye. In R. N. Haber (Ed.), Contemporary theory and
research in visual perception. New York : Holt, 1 968. HocnBERG, J., & BEcK, J. Apparent spatial arrangement and perceived brightness.
Journal of Experimental Psychology, 1 954, 47, 263-266. HUBEL, D. H., & WIBSEL, T. N. Receptive fields, binocular interaction and functional
architectttre in the cat's visual cortex. Journal of Physiology ( London) 1 962, 160, 1 06- 1 54.
HUBEL, D. G., & WrnsEL, T. N. Shape and arrangement of columns in cat's striate cortex. Journa/ of Physiology ( London) 1963, 165, 559-568.
HUBEL, D. H., & WIESEL, T. N. Receptive fields and functional architecture in two nonstriate visual areas ( 1 8 and 1 9) of the cat. Journal of Neurophysiology, 1 965, 28, 229-289.
HuBEL, D. H., & WIESEL, T. N. Receptive fields and functional architecture of monkey striate cortex. Journal of Physiology (London), 1 968, 195, 2 1 5-243.
HuEY, E. B. The psychology and pedagogy of reading. Cambridge, Mass. : M.I . T. Press, 1 968. Originally published 1 908.
HURVICH, L. M., & JAMESON, D. The perception aj brightness and darkness. Rockleigh, New Jersey : Allyn & Bacon, 1 966.
INGLE, D. Two visual mechanisms underlying the behavior of fish. Psycholog�che Forschung, 1 967, 31, 44-51 .
JAKOBSON, R., FANT, G. M., & HALLE, M. Preliminaries to speech analysis. Cambridge, Mass. : M.I.T. Press, 1 95 1 .
JAMESON, D., & HuRVICH, L . M . Opponent chromatic induction : Experimental evaluation and theoretical account. Journal of the Optical Society of America, 1 962, 51, 46-57.
Juno, D. B. Basic correlates of the visual stimulus. In S. S. Stevens (Ed.), Handbook of experimental psychology. New York : Wiley, 195 1 .
JuLESZ, B. Binocular depth perception o f computer-generated patters. Bel/ System Technical Journal, 1 960, 39, 1 1 25-1 1 62.
JULESZ, B. Binocular depth perception without familiary cues. Science, 1 964, 145, 356-362.
JULESZ, B. Foundations of cyclopean perception. Chicago : University of Chicago Press, 1 9 7 1 .
JuNG, R . Allgemeine neurophysiologie. I n H.andbuch der inneren medizen. E d . V/ ! . Berlín and New York : Springer-Verlag, 1953.
KEPES, G. (Ed.) V�ion and value series : J. Education of vision ; 2. Structure in art and in science ; 3. The nature and art of motion ; 4. Module, proportion, symmetry, rhythm: 5. The man-'!lade object ; 6. Sign, image, symbol. New York : Braziller, 1 965, 1 966.
KlANG, N. Discharge patterns of single fibers in the cat's auditory nerve. Cambridge, Mass. : M. I.T. Press, 1 965. (Res. Monogr. No. 35.)
KINNEY, G. C., MARSETTA. M .. & SHOWMAN, D. J. Studies in display symbol legihility, part XII. The legihility of alphanumeric symbols for digitalized television. Bedford, Mass. : The Mitre Corporation, November 1 966, ESD-TR-66- 1 1 7 .
KOLERS, P. A. , & EDEN, M. (Eds.), Recognizíng patterns: Studies in living and autvmatic systems. Cambridge, Mass. : M.I .T. Press, 1 968.
300 PROCESAMIENTO DE I NFORMACION HUMANA
KRYTER, K. D. The effect of noise on m;n. New York: Academic Press, 1 9 70.
KuFFLER, S. w. Discharge patterns and functional organization of mammalian retina. Journal of Neurophysio/ogy, 1 953, 16, 37-68.
LEGRAND, Y. Light, colour, and vision. Lcindon : Chapman & Hall, 1 957. LETTVIN, J. Y., MATURANA, H. R., McCULLOCH, W. S. , & PITTs, W. H. WHAT
the frog's eye tells the frog's brain . Proceedings of the /RE, 1959, 47 ( 1 1),
1 940- 1 95 1 .
LETTVIN, J . Y., M ATURANA, H. R . , PITTS, w . H . , & M cCuLLOCH, w . s . Two
remarks on the visual system of the frog. In W. A. Rosenblith (Ed), Sensory communication. Cambridge, Mass. : M.I .T. Press, 1 96 1 .
LIBERMAN, A . M. The grammars o f speech and language. Cognitive Psyc�ology, 1 970, 1 ( 4), 301 -323.
LINDGREN, N. Machine recognition of human languaje. /nstitute of Electrical and Electronics Engineers Spectrum. Part l . Automatic speech recognition, March 1965, 2, 1 1 4- 1 36.
Part 2. Theoretical models of speech perception in language, April 1 965, 2, 45-59.
Part 3. Cursive script recognition, May 1 965, 2, 1 04- 1 1 6.
LUCKIESH, M. Visual il/usions. PRINCETON, N. J. : Van Nostrand-Reinhold, 1 922.
Also available in paperback from Dover Publications, 1965.
M cCoLLOUGH, C. Color adaptation of edge detectors in the human visual system. Science, 1 965, 149, 1 1 1 5- 1 1 1 6.
. . MERsHON, D. H . , & GOGEL, W. C. Effect of stereoscopic cues on perce1ved whi!eness.
American Journal of Psychology, 1 970, 83, 55-67.
MILLER, G. A. Decision units in the perception of speech. !RE Transactions on Information Theory, 1 962, 8, 8 1 -83 (a).
MuELLER, C. G., RuDOLPH, M., & the Editors of Time-Life Books. Light and vision. New York : Time, Inc., 1 969.
NEissER, U . Cognitive Psycho/ogy. New York : Appleton, 1 967.
NoRMAN. D. A. Memory and attention : An introduction to human information proces-sing. New York : Wiley, 1969. (a). . .
PANTLE, A. J . , & SEKULER, R. W. Velocity-sensitive elements in human v1s10n : Initial psychophysical evidence. Vis ion Research, 1968, 8, 445-450.
PATTERsON, R. D. Noise masking of a change in residue pitch. Journal of the Acoustical Society of America, 1 969, 45, 1 520-1 524.
PENROsE, L. S. & PENROsE, R. lmpossible objects : A special type of illusion. Brilish Journal of Psychology, 1 958, 49, 3 1 .
PIRENNE, M . H . Vision and the eye. (2nd ed.) London : Associated Book Publishers, 1 967.
PIRENNE, M. H. Optics, painting, andphotography. London and New York : Cambridge University Press, 1 970.
PüLYAK, S. The vertebrate visual system. Chicago : U niversity of Chicago Press, 1 957.
POMERANZ, B., & CHUNG, S. H . Dendritic-tree anatomy codes form-vision physiology in tadpole retina. Science, 1 970, 170, 983-984.
PRITCHARD, R. M. Stabahzed images -on the retina. Scientific American, 1 96 1 204, 72-78.
RAMUssEN, G. L., & WINDLE, W. F. (Eds.) Natural mechanisms of the auditory and vestibular systems. Springfield, 111. : Thomas, 1 960.
RATLIFF, F. Inhibitory interaction and the detection and enhancement of contours.
REFERENCIAS 30 1
In W. A. ROSENBLITH (Ed), Seusory communication. Cambridge, Mass. : M . I .T. Press, 1 96 1 .
RATLIFF, F. Mach bands : Quantitative studies on neural networks in the retina. San Francisco : Holden-Day, 1965.
RATLIFF, F., & HARTLINE, H. K. The response of limulus optic nerve fibers to patterns of illumination the receptor mosaic. Journal of General Physiology, 1 959, 42, 1 24 1 - 1 255.
RIGGs, L. A . . RATLIFF, F., CoRNsWEET, J. C., & CüRNsWEET, T. N. The disappearance of steadily-fixated objects. Journal of the Optical Society of America, 1 953, 43, 495-501 .
RIPPs, H . , & WEALE, R . A. Color vision. Anual Review of Psychology, 1 969, 20, 1 93-2 16.
RüBINsON, D. A. Eye movement control in primates. Science, 1968, 161, 1 2 1 9 - 1 224.
RüBINsON, D. W., & DADsON, R. S. A. redetermination of the equal-loudness relations for pure tones. Britsh Journal of Applied Physics, 1 9 56, 7, 1 66- 1 8 1 .
ROSENBLITH, W. A . (Ed) Sensory communication. Cambridge, Mass. : M.I.T. Press, 1 96 1 .
SCHARF, B . Critica! bands, I n J . V . Tobias (Ed.), Foundations of modern auditory theory. Vol. I. New York : Academic Press, 1 970.
SCHMITT, F. O. (Ed.) The neurosciences : Second study program. New York : Rockefeller University Press, in press.
SCHNEIDER, G. E. Contrasting visuomotor functions of tectum and cortex in the golden hamster. Psychologische Forschung, 1 967, 1968, 31, 52-62.
SCHNEIDER, G. E. Two visual systems. Science, 1969, 163, 895-902.
SEITZ, W. C. The responsive eye. New York : Museum of Modern Art, 1 965.
SEKULER, R. W., & GANZ, L. Aftereffect of seen motion with a stabilized retina! image. Science, 1 963, 139, 4 1 9-420.
SELFRIDGE, O. Pandemonium : A paradigm for learning. In Symposium on the mechanization of thought processes. London : HM Stationery Office, 1 959.
SELFRIDGE, O., & NEissER, U. Pattern recogriition by machine. Scientific American, 1 960, 203 (2), 60-68.
SOBY, J. T. René Magritte. New York : Museum of Modern Art, 1 965.
SPINELLI, D. N. Receptive field organization of ganglion cells in the cat's retina. Experimental Neuro/ogy, 1 967, 19, 29 1 - 3 1 5.
STERLING, P., & WICKELGREN, B. G. Visual receptive fields in the superior colliculus of the cat. Journal of Neurophysiology, 1 969, 32, 1 - 1 5 .
STEVENs, S. S. (Ed.) Handbook of experimental psychology. New York : Wiley, 1 95 1 .
STEVENs, S . S . To honor Fechner and repeal his law. Science, 1 96 1 , 133; 80-86.
(b). STEVENs, S. S. A metric for the social consensus. Science, 1 966, 151, 530-54 1 .
(a). STEVENs, S. S., & DAVIs, H. Hearing : lts psycho/ogy and physiology. N ew York :
Wiley, 1 938.
STROMEYER, C. F. Further studies of the McCollough effect. Perception and Psychophysics, 1 969, 6, 1 05- 1 1 0.
STROMEYER, C. F., & MANSFIELD, R. J. Colored aftereffects produced with moving images. Perception & Psychophysics, 1970, 7, 108- 1 1 4.
SYLVEsTER, D. Magritte. Catalogue of an exhibition of paintings by Rene Magritte. 1 898-1967. London : The Arts Council of Great Britain, 1969.
TEUBER, H. L. Perception. In J. FIELD, H. w. MAGOUN, & v. E. HALL (Eds.),
302 PROCESAMIENTO DE INFORMACION HUMANA
Handbook ofphysiology, Section 1 : Neural physiology. Vol. 3. Baltimore : Williams & Wilkins, 1 960.
ToBJAS, J. Y. (Ed.) Foundations ofmodern auditory theory. Vol. 1 New York : Academic Press, 1 970.
TREVARTHEN, C. B. Two mechanisms of vision in primates. Psycho/ogische Forschung, 1 968, 31, 299-337.
van BERGEIJK, W. A. Variation on a theme of Békésy : a model of binaural interaction. Journal of the Acoustical Society of America, 1 962, 34, 143 1 - 1 437.
van den BRINK, G. Two experiments on pitch perception : Displacusis of harmonic AM signals and pitch of iñharmonic AM signals. Journal of the Acoustical Society of America, 1 970, 48, 1 355- 1 365.
VASARELY, V. Vasarely. Translated by H . Chevalier. Neuchatel, Switzerland : Edition's du Griffon Neuchatel, 1 965.
VERHEIJEN, F. J. A simple after image method demonstrating the involuntary multi-directional eye movements during fixation. Optica Acta, 1 96 1 , 8, 309-3 1 1 .
VERNON, M. D. (Ed.) Experiments in visual perception. Harmondsworth, Middlesex, England : Penguin Books, 1 966.
WAGNER, H. G., MACNICHOL, E. F., JR. , & WOLBARSHT, M. L. The response properties of single ganglion cells in the goldfish retina. Journal of General Physiology, 1 960, 43, 45-62.
WALD, G. The receptors for human color vision. Science, 1 964, 145, 1 007- 1 0 1 7. WATHEN-DUNN, W. (Ed.) Models for the perception of speech and visual form. Cam
bridge, Mass. : M.I.T. Press, 1 967. WEVER, E. G. Teory of hearing. New York : Dover Publications, 1 970. WHITE, B. W., SAUNDERS, F. A., SCADDEN, L., BACH-Y-RITA, P., & COLLINS, c. c. See
ing with the skin. Perception & Psychophysics, 1970, 7, 23-27.WHITFIELD, l . C. The auditory pathway. London : Arnold, 1 967.WHITFIELD, l . C., & EVANS, E. F. Responses of auditory cortical neurons to stimuli
of changing frequency. Journal of Neurophysio/ogy, 1 965, 28, 655-672.WICKELGREN, B. G., & STERLING, P. Influence of visual cortex on receptive fields
in the superior colliculus of the cat. Journal of Neurophysiology, 1 969, 32, 1 6-23.WOODWORTH, R. S., & SCHLOSBERG, H. Experimental psychology. New York : Holt,
1 9 54. WYSZECKI, G. W., & STILES, W. S. Color science, concepts and methods, quantitative
data and formulas. New York : Wiley, 1 967.ZwICKER, E., · & SCHARF, B. Model of lou:lness summation. Psychological Review,
1965, 72, 3-26. ZWISLOCKI, J. Analysis of sorne auditory characteristics. In R. D. Luce, R. R.
Bush, and E. Galanter (Eds.). Handbook of mathematical psychology, Vol. l l I .New York : Wiley, 1 965.