41
Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Introdução às Redes Neurais Artificiais DCA0121 – Inteligência Artificial Aplicada Heitor Medeiros 1

Introdução às Redes Neurais Artificiaisheitorm/aulasDCA/dca0121/DCA0121-02... · Redes Neurais Artificiais ... Uma corporação de Ciências criou uma rede a qual pode predizer

Embed Size (px)

Citation preview

Universidade Federal do Rio Grande do NorteDepartamento de Engenharia de Computação e

Automação

Introdução às Redes Neurais Artificiais

DCA0121 – Inteligência Artificial Aplicada

Heitor Medeiros

1

Tópicos da aula

Introdução às Redes Neurais Artificiais

Modelo do Neurônio Artificial de McCulloch&Pitts

Arquiteturas de RNA

2

Redes Neurais Artificiais

3

Motivação

• Máquinas que possam imitar o cérebro.

• O cérebro é responsável por processar informaçõessensoriais e controlar o comportamento do corpo.

– Processar imagens (visão)

– Processar sons (audição e fala)

– Processar sinais de contato (tato)

...

4

Máquina do Cérebro

...

Motivação

5

Processamento de Imagens (Visão)Algoritmo de

Aprendizagem: Visão

Algoritmo de Aprendizagem: Audição

Processamento de Sons (Audição)

Processamento de Sons (Fala)Algoritmo de

Aprendizagem: Fala

???

Máquina do Cérebro

...

Motivação

6

Algoritmo de Aprendizagem: Visão

Algoritmo de Aprendizagem: Audição

Algoritmo de Aprendizagem: Fala

Máquina do Cérebro

Um Único Algoritmo de Aprendizagem

Visão

Audição

...

Motivação

• O cérebro é formado por bilhões de neurôniosinterconectados.

• A interconexão garante o processo deaprendizagem.

7

O Neurônio

• Estrutura do Neurônio:

8

Corpo celular

Dendritos

Axônio

Terminais sinápticos

(conexões de entrada)

(conexão de saída)

Neurônio: Unidade computacionalrecebe entradas, realiza um cálculoe processa uma saída.

O Neurônio Artificial

• O neurônio artificial é modelado como umaunidade computacional conforme mostradoabaixo.

9

E1

E2

E3

...

SaídaUnidade de

Processamento

Rede de Neurônios Artificiais

• Uma Rede Neural Artificial é um conjunto deneurônios artificiais interconectados para gerar umaou mais saídas a partir de uma ou mais entradas.

10

11

Aplicações com Redes Neurais Artificiais (RNA)

Reconhecimento de Objetos: Carro

12

Reconhecimento de Caracteres: Placas de Automóveis

13

Reconhecimento de Faces

14

Reconhecimento de Caracteres: Formulários

15

Classificação do Sexo do Caranguejo

• Classificação do sexo do caranguejo a partir de seisdados de características físicas do caranguejo.

16

Sexo do caranguejo

Características físicas do

caranguejo

Outros exemplos de Classificação de Padrões

• Diagnóstico de Câncer de Próstata:

Uma corporação de Ciências criou uma rede a qual pode predizer ocâncer de próstata. As redes foram treinadas para predizer resultadosbaseados em teste de PSA ("Prostate Specific Antigen") e para predizer arecorrência de câncer depois do tratamento.

• Predição de permanência de paciente na UTI:

Um grupo da Escola de Medicina da Universidade Johns Hopkinsdesenvolveu uma rede neural para prever quais pacientes na Unidade deTratamento Intensivo (UTI) cirúrgico do Hospital iriam permanecer seteou mais dias. As entradas da rede incluíam idade, o uso de droga ououtras terapias, e sinais fisiológicos tais como taxa cardíaca e pressãosanguínea, e resultados de laboratório tais como contagens de célulasbrancas.

17

Outros exemplos de Classificação de Padrões

• Determinando significância de drogas:

O grupo de pesquisa da "Zeneca Pharmaceuticals" em Wilmingtondesenvolveu uma aplicação de rede neural para examinar dados deexperimentos com drogas os quais reduzem o tempo de análise em até68%.

A rede neural foi treinada para detectar "bons" picos de pressão dabexiga de centenas de picos em arquivos de dados. Estes picos sãocríticos para determinar a significância da droga em experimentosdesenhados como "screening" de mais compostos de droga.

Os pesquisadores previamente usaram o método do papel e o lápis paraanalisar estes picos, um método que levou 40 horas por mês. Usandoredes neurais, reduziu o tempo de análise para 13 horas por mês.

18

Controle de Processos Utilizando Redes Neurais

19

Por que escolher as Redes Neurais?

20

• Uma ferramenta eficiente para classificação depadrões NÃO LINEARES.

• A maioria dos fenômenos do mundo real são denatureza não linear.

Por que escolher as Redes Neurais?

21

• As redes neurais artificiais, conhecidas também comoprocessadores maciçamente paralelamentedistribuídos, se assemelham ao cérebro pelacapacidade de adquirir o conhecimento através de umprocesso de aprendizagem e de armazenamento doconhecimento através de forças de conexão entreneurônios, também chamadas de pesos sinápticos[Haykin 2001].

Por que escolher as Redes Neurais?

22

• Generalização das informações.

• Não linearidade.

• Mapeamento entrada/saída.

• Adaptabilidade.

• Tolerância a falhas.

Por que escolher as Redes Neurais?

23

• Não linearidade: Se existir pelo menos um neurônio não

linear, a rede pode mapear uma funçãonão linear.

• Mapeamento entrada/saída. A rede pode funcionar como um gerador

de função genérica.

Por que escolher as Redes Neurais?

24

• Adaptabilidade: Aprendizado pode ser alterado através de

um novo treinamento. A rede é adaptável a novas situações.

• Tolerância a falhas: Um dano em um neurônio não causa uma

falha da rede.

Modelo Computacional do Neurônio Artificial

25

Modelo do Neurônio Artificial

• A simulação do comportamento de um neurôniobiológico só foi possível a partir da criação domodelo computacional de um neurônio apresentadopor Warren McCulloch e Walter Pitts em 1943.

26

Modelo do Neurônio Artificial: McCulloch&Pitts

• Modelo de Neurônio Artificial de McCulloch&Pitts:

27

28

W1

W2

Wn

...

X1

X2

Xn

𝑋 ∗𝑊 f(.)u y = f(u)

Modelo do Neurônio Artificial: McCulloch&Pitts

• Potencial de ativação (𝑢), função de ativação [𝑓(𝑢)] e saída doneurônio (𝑦).

𝑢 =

𝑖=1

𝑛

𝑤𝑖 ∗ 𝑥𝑖

𝑦 = 𝑔(𝑢)

• Funcionamento do neurônio:1. Coleta dos valores de entrada (estímulos).2. Multiplicação dos estímulos pelos pesos sinápticos das ligações.

Obs.: Os pesos sinápticos precisam de um estímulo para ativar o neurônio.

3. Obtenção do potencial de ativação a partir do somatório de todas asentradas do neurônio.

4. Geração da saído do neurônio a partir da aplicação de uma funçãode ativação.

29

Modelo do Neurônio Artificial: McCulloch&Pitts

Funções de Ativação

• Como o objetivo da função de ativação é ativar ou não umasaída, a função degrau é um boa opção.

30

Degrau unipolar

𝑔 𝑢 = 0, 𝑢 < 01, 𝑢 ≥ 0

Degrau bipolar

𝑔 𝑢 = −1, 𝑢 < 01, 𝑢 ≥ 0

Funções de Ativação: Degrau

• Analisando a derivada da função degrau:

• Devido ao uso de algoritmos de treinamento da rede(próximas aulas!) baseados em correção por erro,funções descontínuas podem gerar resultadosineficientes.

31

Funções de Ativação:Funções totalmente diferenciáveis

• Utilização de funções totalmente diferenciáveis nasfunções de ativação.

• Função Sigmoide: 𝑔 𝑢 =1

1+exp −𝑢

32

𝒈 𝒖𝒅 𝒈 𝒖

𝒅𝒖

Funções de Ativação:Funções totalmente diferenciáveis

• Função tangente hiperbólica: 𝑔 𝑢 =1−exp(−𝑢)

1+exp −𝑢

33

𝒈 𝒖𝒅 𝒈 𝒖

𝒅𝒖

Funções de Ativação:Funções totalmente diferenciáveis

• Função linear: 𝑔 𝑢 = 𝑢

34

𝒈 𝒖

• Não apresenta a curva suavecomo as funções sigmoide etangente hiperbólica.

Arquiteturas de Redes Neurais

35

Distribuição dos Neurônios Artificiais

Arquiteturas de RNA

• Os neurônios são distribuídos de forma paralela eseparados por camadas.

36

Arquiteturas de RNA

Arquiteturas de RNA

Redes diretas (feedforward) de camada simples

Redes feedforward de camadas múltiplas

Redes recorrente ou realimentada

37

Arquiteturas de RNA

Arquiteturas de RNA

Redes feedforward de camada simples

Redes feedforward de camadas múltiplas

Redes recorrente ou realimentada

38

Principais redes:

• Perceptron• Adaline

Obs.: primeiras redes.

Principais redes:

• Perceptron de multicamadas (MLP)• RBF

Revisando

• Características das Redes Neurais Artificiais.

– Não linearidade, generalização, mapeamentoentrada/saída, adaptabilidade e tolerância a falhas.

• Modelo de Neurônio Artificial [McCulloch&Pitts].

– Combinação linear: sinais de entrada (estímulos) epesos sinápticos.

– Função de ativação.

• Tipos de funções de ativação.

• Arquiteturas de Redes Neurais.

39

Referências

40

1. Haykin, Simon S. Redes neuraisartificiais: princípio e prática. 2ª ed.São Paulo: Bookman, 2000.

2. Da Silva, Ivan Nunes; Spatti, DaniloHernane; Flauzino, Rogério Andrade.Redes Neurais Artificiais paraengenharia e ciências aplicadas cursoprático. São Paulo: Artliber, 2010.

Dúvidas?

Dúvidas por email:

[email protected]

41