Upload
vuongkhanh
View
230
Download
5
Embed Size (px)
Citation preview
Universidade Federal do Rio Grande do NorteDepartamento de Engenharia de Computação e
Automação
Introdução às Redes Neurais Artificiais
DCA0121 – Inteligência Artificial Aplicada
Heitor Medeiros
1
Tópicos da aula
Introdução às Redes Neurais Artificiais
Modelo do Neurônio Artificial de McCulloch&Pitts
Arquiteturas de RNA
2
Motivação
• Máquinas que possam imitar o cérebro.
• O cérebro é responsável por processar informaçõessensoriais e controlar o comportamento do corpo.
– Processar imagens (visão)
– Processar sons (audição e fala)
– Processar sinais de contato (tato)
...
4
Máquina do Cérebro
...
Motivação
5
Processamento de Imagens (Visão)Algoritmo de
Aprendizagem: Visão
Algoritmo de Aprendizagem: Audição
Processamento de Sons (Audição)
Processamento de Sons (Fala)Algoritmo de
Aprendizagem: Fala
???
Máquina do Cérebro
...
Motivação
6
Algoritmo de Aprendizagem: Visão
Algoritmo de Aprendizagem: Audição
Algoritmo de Aprendizagem: Fala
Máquina do Cérebro
Um Único Algoritmo de Aprendizagem
Visão
Audição
...
Motivação
• O cérebro é formado por bilhões de neurôniosinterconectados.
• A interconexão garante o processo deaprendizagem.
7
O Neurônio
• Estrutura do Neurônio:
8
Corpo celular
Dendritos
Axônio
Terminais sinápticos
(conexões de entrada)
(conexão de saída)
Neurônio: Unidade computacionalrecebe entradas, realiza um cálculoe processa uma saída.
O Neurônio Artificial
• O neurônio artificial é modelado como umaunidade computacional conforme mostradoabaixo.
9
E1
E2
E3
...
SaídaUnidade de
Processamento
Rede de Neurônios Artificiais
• Uma Rede Neural Artificial é um conjunto deneurônios artificiais interconectados para gerar umaou mais saídas a partir de uma ou mais entradas.
10
Classificação do Sexo do Caranguejo
• Classificação do sexo do caranguejo a partir de seisdados de características físicas do caranguejo.
16
Sexo do caranguejo
Características físicas do
caranguejo
Outros exemplos de Classificação de Padrões
• Diagnóstico de Câncer de Próstata:
Uma corporação de Ciências criou uma rede a qual pode predizer ocâncer de próstata. As redes foram treinadas para predizer resultadosbaseados em teste de PSA ("Prostate Specific Antigen") e para predizer arecorrência de câncer depois do tratamento.
• Predição de permanência de paciente na UTI:
Um grupo da Escola de Medicina da Universidade Johns Hopkinsdesenvolveu uma rede neural para prever quais pacientes na Unidade deTratamento Intensivo (UTI) cirúrgico do Hospital iriam permanecer seteou mais dias. As entradas da rede incluíam idade, o uso de droga ououtras terapias, e sinais fisiológicos tais como taxa cardíaca e pressãosanguínea, e resultados de laboratório tais como contagens de célulasbrancas.
17
Outros exemplos de Classificação de Padrões
• Determinando significância de drogas:
O grupo de pesquisa da "Zeneca Pharmaceuticals" em Wilmingtondesenvolveu uma aplicação de rede neural para examinar dados deexperimentos com drogas os quais reduzem o tempo de análise em até68%.
A rede neural foi treinada para detectar "bons" picos de pressão dabexiga de centenas de picos em arquivos de dados. Estes picos sãocríticos para determinar a significância da droga em experimentosdesenhados como "screening" de mais compostos de droga.
Os pesquisadores previamente usaram o método do papel e o lápis paraanalisar estes picos, um método que levou 40 horas por mês. Usandoredes neurais, reduziu o tempo de análise para 13 horas por mês.
18
Por que escolher as Redes Neurais?
20
• Uma ferramenta eficiente para classificação depadrões NÃO LINEARES.
• A maioria dos fenômenos do mundo real são denatureza não linear.
Por que escolher as Redes Neurais?
21
• As redes neurais artificiais, conhecidas também comoprocessadores maciçamente paralelamentedistribuídos, se assemelham ao cérebro pelacapacidade de adquirir o conhecimento através de umprocesso de aprendizagem e de armazenamento doconhecimento através de forças de conexão entreneurônios, também chamadas de pesos sinápticos[Haykin 2001].
Por que escolher as Redes Neurais?
22
• Generalização das informações.
• Não linearidade.
• Mapeamento entrada/saída.
• Adaptabilidade.
• Tolerância a falhas.
Por que escolher as Redes Neurais?
23
• Não linearidade: Se existir pelo menos um neurônio não
linear, a rede pode mapear uma funçãonão linear.
• Mapeamento entrada/saída. A rede pode funcionar como um gerador
de função genérica.
Por que escolher as Redes Neurais?
24
• Adaptabilidade: Aprendizado pode ser alterado através de
um novo treinamento. A rede é adaptável a novas situações.
• Tolerância a falhas: Um dano em um neurônio não causa uma
falha da rede.
Modelo do Neurônio Artificial
• A simulação do comportamento de um neurôniobiológico só foi possível a partir da criação domodelo computacional de um neurônio apresentadopor Warren McCulloch e Walter Pitts em 1943.
26
Modelo do Neurônio Artificial: McCulloch&Pitts
• Modelo de Neurônio Artificial de McCulloch&Pitts:
27
• Potencial de ativação (𝑢), função de ativação [𝑓(𝑢)] e saída doneurônio (𝑦).
𝑢 =
𝑖=1
𝑛
𝑤𝑖 ∗ 𝑥𝑖
𝑦 = 𝑔(𝑢)
• Funcionamento do neurônio:1. Coleta dos valores de entrada (estímulos).2. Multiplicação dos estímulos pelos pesos sinápticos das ligações.
Obs.: Os pesos sinápticos precisam de um estímulo para ativar o neurônio.
3. Obtenção do potencial de ativação a partir do somatório de todas asentradas do neurônio.
4. Geração da saído do neurônio a partir da aplicação de uma funçãode ativação.
29
Modelo do Neurônio Artificial: McCulloch&Pitts
Funções de Ativação
• Como o objetivo da função de ativação é ativar ou não umasaída, a função degrau é um boa opção.
30
Degrau unipolar
𝑔 𝑢 = 0, 𝑢 < 01, 𝑢 ≥ 0
Degrau bipolar
𝑔 𝑢 = −1, 𝑢 < 01, 𝑢 ≥ 0
Funções de Ativação: Degrau
• Analisando a derivada da função degrau:
• Devido ao uso de algoritmos de treinamento da rede(próximas aulas!) baseados em correção por erro,funções descontínuas podem gerar resultadosineficientes.
31
Funções de Ativação:Funções totalmente diferenciáveis
• Utilização de funções totalmente diferenciáveis nasfunções de ativação.
• Função Sigmoide: 𝑔 𝑢 =1
1+exp −𝑢
32
𝒈 𝒖𝒅 𝒈 𝒖
𝒅𝒖
Funções de Ativação:Funções totalmente diferenciáveis
• Função tangente hiperbólica: 𝑔 𝑢 =1−exp(−𝑢)
1+exp −𝑢
33
𝒈 𝒖𝒅 𝒈 𝒖
𝒅𝒖
Funções de Ativação:Funções totalmente diferenciáveis
• Função linear: 𝑔 𝑢 = 𝑢
34
𝒈 𝒖
• Não apresenta a curva suavecomo as funções sigmoide etangente hiperbólica.
Arquiteturas de RNA
Arquiteturas de RNA
Redes diretas (feedforward) de camada simples
Redes feedforward de camadas múltiplas
Redes recorrente ou realimentada
37
Arquiteturas de RNA
Arquiteturas de RNA
Redes feedforward de camada simples
Redes feedforward de camadas múltiplas
Redes recorrente ou realimentada
38
Principais redes:
• Perceptron• Adaline
Obs.: primeiras redes.
Principais redes:
• Perceptron de multicamadas (MLP)• RBF
Revisando
• Características das Redes Neurais Artificiais.
– Não linearidade, generalização, mapeamentoentrada/saída, adaptabilidade e tolerância a falhas.
• Modelo de Neurônio Artificial [McCulloch&Pitts].
– Combinação linear: sinais de entrada (estímulos) epesos sinápticos.
– Função de ativação.
• Tipos de funções de ativação.
• Arquiteturas de Redes Neurais.
39
Referências
40
1. Haykin, Simon S. Redes neuraisartificiais: princípio e prática. 2ª ed.São Paulo: Bookman, 2000.
2. Da Silva, Ivan Nunes; Spatti, DaniloHernane; Flauzino, Rogério Andrade.Redes Neurais Artificiais paraengenharia e ciências aplicadas cursoprático. São Paulo: Artliber, 2010.