23
Antonio Reynoso Lobato 1 Módulo 1 Sistemas Reactivos reaccionar a lo que ves Antonio Reynoso Lobato 2 Objetivo del Módulo Analizar, en sus fundamentos físicos, los métodos de control que posee el agente así como el procesamiento de señales del entorno del mismo; por medio de la aproximación subsimbólica evolutiva

Agente de Estimulo y Respuesta

Embed Size (px)

Citation preview

Page 1: Agente de Estimulo y Respuesta

1

Antonio Reynoso Lobato 1

Módulo 1

Sistemas Reactivosreaccionar a lo que ves

Antonio Reynoso Lobato 2

Objetivo del Módulo

Analizar, en sus fundamentos físicos, los métodos de control que posee el agente asícomo el procesamiento de señales del entorno del mismo; por medio de la aproximación subsimbólica evolutiva

Page 2: Agente de Estimulo y Respuesta

2

Antonio Reynoso Lobato 3

Secciones

•Agentes de estímulo-respuesta•Redes neuronales•Sistemas evolutivos•Sistemas con estados•Visión artificial

Antonio Reynoso Lobato 4

Módulo 1, Sección 1

Agentes de

estímulo-respuesta

Page 3: Agente de Estimulo y Respuesta

3

Antonio Reynoso Lobato 5

Objetivo de la Sección

Analizar sistemas que no tienen estados internos y que sólo reaccionan a los estímulos generados por los entornos donde operan.

Antonio Reynoso Lobato 6

Temas

•Percepción y acción.

•Representación e implementación de las funciones para la selección de acciones.

•Consideraciones adicionales.

Page 4: Agente de Estimulo y Respuesta

4

Antonio Reynoso Lobato 7

Percepción y acción.

•Robots: capaces de responder a estímulos que reciben sus sensores.

– Machina Speculatrix (53): se movía hacia una luz de intensidad moderada y evitaba luces brillantes

– Agentes de estímulo-respuesta (Agentes E-R)

Antonio Reynoso Lobato 8

Ejemplo ilustrativo

• Mundo:– Limites:

No existen pasillos estrechos ( el espacio entre los objetos y la frontera deberá ser, de al menos, dos celdas de longitud)

• Robot:– Comportamiento:

Ir a una celda fronteriza, o que limite con un objeto, y seguir su perímetro indefinidamente.

Page 5: Agente de Estimulo y Respuesta

5

Antonio Reynoso Lobato 9

Robot en un Mundo cuadriculado

X = (0,0,0,0,0,0,1,0)

Antonio Reynoso Lobato 10

Comportamiento

• Percibir: si una celda esta libre para ser ocupada ó no– Ocho entradas sensoriales S = [s(1),s(2),....,s(8)]

S(i) = 0: si puede ser ocupadaS(i) = 1: si no.

• Acción:– Acciones primitivas que correspondan a las percepciones:

Puede moverse a una celda libre adyacente que este en su misma fila o columna (si la celda no esta libre la acción no tendría efecto):

– 1: Norte (1 celda hacia arriba)– 2: Este (1 celda a la derecha)– 3: Sur (1 celda hacia abajo)– 4: Oeste (1 celda a la izquierda)

Page 6: Agente de Estimulo y Respuesta

6

Antonio Reynoso Lobato 11

Diseñar

1.Dadas las propiedades del mundo a habitar.

2.Concretada la tarea que tiene que desarrollar.

Diseñar: especificar una función definida sobre las entradas sensoriales que seleccione la acción apropiada en cada momento para lograr el objetivo encomendado al robot

Antonio Reynoso Lobato 12

Cálculo

• Vector de características: que se correlacionan con las propiedades del entorno que son relevantes– Numéricas (números reales)– Categorizadas (nombres o propiedades: [color = (rojo, verde,...)] )– Binarias (1 y 0´s ó F y V)

• Cálculo de la acción: se selecciona una acción a partir del vector de características

Page 7: Agente de Estimulo y Respuesta

7

Antonio Reynoso Lobato 13

Proceso

•Proceso:– Desplazado hacia la percepción:

El mundo se percibe como un estado en que la acción X ( norte por ejemplo) es posible

– Desplazado hacia la acción:Se obtiene la acción X realizando el cálculo directamente sobre las entradas sensoriales

– Dividido entre percepción y acción.

Antonio Reynoso Lobato 14

¿Cómo realizar la División?

• De modo que las mismas características puedan ser usadas en otras tareas que el robot tenga que realizar (se asemeja al uso de las funciones de una librería)

– 1° Resolver como realizar la división.– 2° Resolver:

Conversión de los datos primitivos del vector de características.Especificar la función para el cálculo de la acción.

Page 8: Agente de Estimulo y Respuesta

8

Antonio Reynoso Lobato 15

Percepción:

• Entradas sensoriales:– (S1, S2,....,S8) => 2^8 = 256 combinaciones posibles.

La condición que prohíbe pasillos estrechos descarta combinaciones.

– Definir:» Características: X1, X2, X3, X4 (variables sensoriales)

• El procesamiento perceptual puede producir ocasionalmente información errónea, incompleta ó ambigua que lleve a una selección inadecuada de la acción a tomar.

Antonio Reynoso Lobato 16

Características:

• X1 = 1 si y solo si S2 = 1 ó S3 = 1.

• Combinaciones booleanas de las entradas sensoriales

Page 9: Agente de Estimulo y Respuesta

9

Antonio Reynoso Lobato 17

Acción:• Definir la función:

– Reglas:Si ninguna característica toma el valor de 1, moverse en cualquier dirección (norte por defecto) hasta encontrar un borde.Si X1=1 y X2=0, moverse al EsteSi X2=1 y X3=0, moverse al Sur.Si X3=1 y X4=0, moverse al OesteSi X4=1 y X1=0, moverse al Norte

– Combinaciones booleanas de las características

Antonio Reynoso Lobato 18

Álgebra Booleana• Representación de la función booleana:

– F(X1, X2,...,Xn) : le hace corresponder a este arreglo de 1´s y 0´s o bien 1 o bien 0

• Conectivas: ( * , + , ¬ )– Conjunción:

= : tiene el valorX1X2 = 1 si y solo si X1 = 1 y X2 = 1;X1X2 = 0 en cualquier otro caso

– Disyunción inclusiva:X1+X2 = 0 si y solo si X1 = 0 y X2 = 0;X1+X2 = 1 en cualquier otro caso

– Complemento o Negación:¬X = 1 si y solo si X = 0¬X = 0 si y solo si X = 1

PROPIEDAD DE DUALIDAD

Page 10: Agente de Estimulo y Respuesta

10

Antonio Reynoso Lobato 19

Álgebra Booleana

• Reglas:– 1+1 = 1; 1+0 = 1; 0+0 = 0– 1*1 = 1; 1*0 = 0; 0*0 = 0– ¬1 = 0; ¬0 = 1

• Robot:– F = ¬X1*¬X2*¬X3*¬X4 + X4*¬X1 (moverse al norte)– X4 = S1 + S8 (característica)

• Átomo: Formula booleana de una variable X1

• Literal: Función booleana de una variable o su complemento ¬X1

Antonio Reynoso Lobato 20

Leyes de las conectivas• Conmutativa:

– X1X2 = X2X1; X1+X2 = X2+X1• Asociativa:

– (X1X2)X3 = X1(X2X3)– (X1+X2)+X3 = X1+(X2+X3)– Estas dos leyes permiten eliminar los paréntesis

• De Morgan:– ¬(F1F2) = ¬F1 + ¬F2– ¬(F1+F2) = ¬F1*¬F2

• Distributiva:– F1(F2+F3) = F1F2 + F1F3– F1+(F2F3) = (F1+F2)(F1+F3)

Page 11: Agente de Estimulo y Respuesta

11

Antonio Reynoso Lobato 21

Formas y Clases•Monomio ó término: conjunción de literales

– L1L2....Ln es un término de la función– Tamaño del término: número de literales– 3^n monomios distintos de n variables

(límite inferior)

•Cláusula: disyunción de literales– (L1+L2+....+Ln) es una cláusula de la función– Tamaño de la cláusula: número de literales– 3^n cláusulas distintas de n variables

(límite superior)• Si F es un término aplicando la leyes de De Morgan

¬F es una cláusula y viceversa

Antonio Reynoso Lobato 22

Formas y Clases• FND: Forma Normal Disyuntiva, si puede escribirse como una

disyunción de términos– F = X1X2 + X2X3X4– FND de k términos: si consiste en una disyunción de k

términos.– Pertenece a la Clase k-FND: si el tamaño del mayor término

es k

• FNC: Forma Normal Conjuntiva, si puede expresarse como una conjunción de cláusulas

– F = (X1+X2)(X2+X3+X4)– FNC de k cláusulas: si consiste en una conjunción de k

cláusulas.– Pertenece a la Clase k-FNC: si el tamaño de la mayor cláusula

es k

• Cualquier expresión FNC se convierte a FND aplicando las leyes de De Morgan y viceversa (reciprocas)

Page 12: Agente de Estimulo y Respuesta

12

Antonio Reynoso Lobato 23

Representación e Implementación

•Selección de Acciones:– Una generalización de las funciones booleanas:

Función definida sobre el vector de características, que tenga R valores de salida distintos:

– R posibles acciones a seguir

Antonio Reynoso Lobato 24

Representación• Funciones de selección de acciones:

– Sistemas de Producción:Reglas de Producción:

– c(i) a(i) : c(i) condición; a(i) acciónConjunto de Producciones: (Tablas de decisión )

c(1) a(1)c(2) a(2)

.

.c(n) a(n)

Page 13: Agente de Estimulo y Respuesta

13

Antonio Reynoso Lobato 25

Funciones de selección de acciones:

– Reglas de Producción:c(i) a(i) :

– c(i) condición: cualquier función booleana definida sobre el vector de características

» (normalmente es un monomio).– a(i) acción:

» Acción primitiva» Llamadas a otro sistema de producción» Conjunto de acciones a ser ejecutadas

simultáneamente

Antonio Reynoso Lobato 26

Funciones de selección de acciones:

Conjunto de Producciones:Se busca, siguiendo el orden establecido en el conjunto de reglas, la que la evaluación de su condición sea igual a 1

c(1) a(1)c(2) a(2)

.

.c(n) a(n)

Page 14: Agente de Estimulo y Respuesta

14

Antonio Reynoso Lobato 27

Ejecución por defecto• Por lo general la última regla tiene el valor de 1

(Regla por defecto)

• A medida que se van ejecutando las acciones las condiciones de las reglas deben ser comprobadas continuamente:

– Se modifican las entradas sensoriales constantemente

• Sistema de Producción:– X4¬X1 norte– X3¬X4 oeste– X2¬X3 sur– X1¬X2 este– 1 norte

• Proceso sin Fin.

Antonio Reynoso Lobato 28

Sistemas Dirigidos por Objetivos

• Las acciones se ejecutan hasta que se alcanza algún objetivo

– Objetivo: condición booleana de las característicasC:alcanzo la esquina cóncava

– C nil: acción nula (sin efectos)– 1 sb: seguimiento de bordes

• Programas Teleo-Reactivos (T-R)– Teleo: fin ó propósito

Page 15: Agente de Estimulo y Respuesta

15

Antonio Reynoso Lobato 29

Programas T-R

• La primera regla define el objetivo general( ciclo WHILE)

• El objetivo debe de estar bien definido:– expresado como una función booleana de las

características

• Las acciones conducen al agente, inexorablemente, hacia el objetivo general (Robustez)

Antonio Reynoso Lobato 30

Programas T-R

• El sistema de percepción debe de ser preciso ( se puede recuperar de):

– Percepciones erróneas (contratiempos)– Acciones ejecutadas incorrectamente– Procesos externos del entorno

• Pueden contener Parámetros: fijados en el momento en que los programas son llamados

• Pueden llamar a otros programas T-R

• Pueden llamarse ellos mismos (Recursividad)

Page 16: Agente de Estimulo y Respuesta

16

Antonio Reynoso Lobato 31

Redes Lógicas

•Puertas Lógicas:– AND, NAND, OR,etc...

•Unidad Lógica con Umbral (ULU)– Aplica una función no lineal sobre una suma

ponderada de sus entradas.

Antonio Reynoso Lobato 32

Unidad Lógica con Umbral (ULU)• ULU: Modelo simplificado de una neurona biológica:

– Cuyo disparo depende de la suma de intensidades de las sinapsis:

• Que atenúan o amplifican la intensidad de las entradas

Page 17: Agente de Estimulo y Respuesta

17

Antonio Reynoso Lobato 33

Implementación mediante ULU´s

•Separa el espacio de los vectores de entrada en dos regiones mediante una superficie lineal:

– Hiperplano de n dimensiones•Funciones linealmente separables:

– Monomios: conjunción de literales– Cláusulas: disyunción de literales

•Funciones no-separables:– Ó exclusivo:

f = X1¬X2 + ¬X1X2

Antonio Reynoso Lobato 34

Implementación de un monomio

• Los pesos en las líneas de entrada

• Umbral dentro del circulo

Page 18: Agente de Estimulo y Respuesta

18

Antonio Reynoso Lobato 35

Función para el seguimiento de bordes

f = X1¬X2 = (S2 + S3)¬(S4 + S5)

= (S2 + S3)¬S4¬S5

(Moverse al Este)

Antonio Reynoso Lobato 36

Redes Neuronales

• Selección de acciones:– 2 acciones posibles:

• Implementación con una sola ULU:– siempre y cuando tengamos como entrada

una representación codificada del vector de características

– Mas de 2 acciones posibles:• Implementación con una red de ULU´s

(red neuronal)

Page 19: Agente de Estimulo y Respuesta

19

Antonio Reynoso Lobato 37

Implementación de Programas T-R

• Sugerencia de Kats: combinaciones repetidas de inversores y puertas AND– implementadas por medio de ULU´s

• Entradas: valores binarios de c(i)• Salidas: activan a las acciones a(i)

– Implementación por medio de CIPA:Comprobación, Inhibición, Propagación, Acción

• 2 entradas• 2 salidas• 2 ULU´s

Antonio Reynoso Lobato 38

Unidades CIPA

• CIPA: Comprobación, Inhibición, Propagación, Acción• 2 entradas:

• Inhibición• Comprobación

• 2 salidas:• Propagación• Acción

• 2 ULU´s• Conjunción: de una entrada con el

complemento de la otra• Disyunción: de las dos entradas

Page 20: Agente de Estimulo y Respuesta

20

Antonio Reynoso Lobato 39

Red de Unidades CIPA• La entrada de inhibición será igual a 0, cuando

en ninguna de las reglas precedentes la condición sea cierta

• La entrada de comprobación toma el valor de 1, cuando la condición correspondiente a la regla representada es cierta

Conjunción

Disyunción

Antonio Reynoso Lobato 40

Red de Unidades CIPA• Si la entrada de comprobación es igual a 1 y la

de inhibición es igual a 0, la salida de accióntoma el valor de 1

• Si las dos entradas toman el valor de 1, la salida de propagación toma el valor de 1 inhibiendo a todas las unidades que siguen

Conjunción

Disyunción

Page 21: Agente de Estimulo y Respuesta

21

Antonio Reynoso Lobato 41

Unidades CIPA

• Si implementamos un CIPA por medio de unamatriz de puertas programables – ( o de cualquier forma dinámica de construir

circuitos)– cada vez que se llama al programa T- R – se construye dinámicamente el circuito que

implementamos

Antonio Reynoso Lobato 42

Arquitectura de Subsunción

• Otro formalismo para especificar el proceso queasocia las entradas sensoriales con las acciones correspondientes.

• La idea general es que el comportamiento global del agente descansa sobre un conjunto demódulos de comportamiento

Page 22: Agente de Estimulo y Respuesta

22

Antonio Reynoso Lobato 43

Módulos de comportamiento• Cada módulo recibe información de las entradas sensoriales:

– Si las entradas satisfacen una precondición específica, se ejecuta el programa específico para cada módulo

• Un módulo puede ser subsumido en otro (inmediato inferior)

prioridad

Antonio Reynoso Lobato 44

Sistemas E-R• Arquitectura horizontal

– Cuando un modulo j se subsume en un modulo i;• El modulo i tiene prioridad sobre el módulo j

• Arquitectura vertical– Procesamiento perceptual: calcular el

• Vector de características, a partir de– Señales sensoriales

– Selección de acciones: calcular la• Acción, a partir del

– Vector de características

Page 23: Agente de Estimulo y Respuesta

23

Antonio Reynoso Lobato 45

Sistemas E-R• Arquitectura horizontal

– Permite al diseñador considerar de forma simultánea aquellos aspectos relacionados con la percepción y la acción que sirven de base para presentar pautas de comportamiento especificas

Se benefician con la división vertical entre percepción y acción

– El vector de características lo pueden dividir en diferentes campos y procesarlos concurrentemente

• Arquitectura vertical– La relación inherente entre extracción de información y la

generación de pautas de comportamiento hace mas atractiva la optimización de la programación

La interacción entre sistemas reactivos relativamente simples en entornos complejos pueden producir comportamientos verdaderamente complejosTiene una pequeña cantidad de estados internos

Antonio Reynoso Lobato 46

Consideraciones Adicionales• Agentes E-R: no son verdaderamente inteligentes

– Teoría de controlTermostatoControladoresLas partes de un sistema operativo

• Sistemas E-R:– Sistemas T-R:

Modelos etológicos. Comportamiento animal– El resultado de una acción actúa de estimulo para la

activación de la siguiente acción de la secuenciaAgentes tropistas:– Buscan o se mueven hacia los estímulos:

» fototropismo