Aprendizado N~ao-Supervisionado - folivetti.github.io · Aprendizado N~ao-Supervisionado Essas t...

Aprendizado Nao-Supervisionado

Fabrıcio Olivetti de Franca

Universidade Federal do ABC

Topicos

1. Aprendizado Nao-Supervisionado

2. Agrupamento de Dados

Muitas vezes nao temos um rotulo pre-definido que queremos extrair de

nossos dados.

Contagem?

O aprendizado nao-supervisionado especifica as tecnicas para extrair

conhecimento de um conjunto de dados sem que tenhamos:

• Informacao do que queremos encontrar.

• Qualquer retorno indicando corretude do que encontramos.

Essas tecnicas se baseiam em:

• Formacao de grupos de dados similares.

• Modelo de criacao de um dado.

• Busca de objetos representativos.

• Reducao de Dimensionalidade e Extracao de Atributos.

Formacao de grupos de dados

Define-se uma medida de similaridade entre nossos dados.

Forme grupos baseados na similaridade entre objetos do mesmo grupo.

Nas imagens abaixo:

Podemos formar os grupos “bonzinhos” e “malvados”:

Podemos formar os grupos “masculino”, “feminino” e “indefinido”:

Podemos formar os grupos “herois”, “vıtimas” e “viloes”:

Modelo de Criacao

Procura encontrar um modelo que explica a geracao dos dados:

P(θ | x) =?

Modelo de Criacao

Vamos tomar como exemplo agora as seguintes imagens:

Modelo de Criacao

Com elas podemos encontrar os seguintes modelos de criacao:

Dados Representativos

Vamos considerar que uma imagem e um conjunto de pixels, e as cores

desses pixels sao nossos dados.

Se encontrarmos as k cores mais representativa dessa imagem, podemos

redesenha-la utilizando essas cores, economizando bits!

Dados Representativos

Reducao de Dimensionalidade e Extracao de Atributos

Ja vimos que em alguns casos (textos, imagens, vıdeos) temos a

necessidade de extrair atributos estruturados para que seja possıvel

utilizar algoritmos de Aprendizado de Maquina.

Alem disso, em algumas situacoes tambem pode ser desejavel extrair

atributos do conjunto de atributos estruturados.

A extracao de novos atributos e motivado por:

• encontrar um espaco de atributos com separacao linear entre as

classes;

• reduzir a dimensao do problema reduzindo o custo computacional do

modelo de aprendizado;

• descobrir relacoes entre os atributos que podem ser de interesse

pratico;

• projetar para um espaco bi ou tri-dimensional com o intuito de

visualizar os dados.

Ja a reducao de atributos e aplicada com o objetivo de minimizar o

impacto da maldicao da dimensionalidade.

Quando o espaco de atributos tem uma dimensao muito grande,

observamos alguns fenomenos:

• A diferenca entre as distancias de objetos similares e dissimilares se

torna pequena.

• Muitos atributos nao contribuem com o objetivo do aprendizado.

• Alguns atributos inserem ruıdos que atrapalham o ajuste dos

parametros livres dos algoritmos.

Agrupamento de Dados

k-Means

Digamos que temos diversas cores que sao tons de vermelho, verde e azul.

0 50 100 150 200 250x

k-Means

Queremos escolher as 3 cores mais representativas desse conjunto!

0 50 100 150 200 250x

k-Means

E nao necessariamente essas 3 cores devem fazer parte do conjunto de

dados, podemos criar cores novas!

0 50 100 150 200 250x

k-Means

O que caracteriza uma cor representativa de um conjunto?

0 50 100 150 200 250x

k-Means

Bom, para saber isso primeiro precisamos conhecer os conjuntos!

0 50 100 150 200 250x

k-Means

Para nosso exemplo e facil:

0 50 100 150 200 250x

k-Means

A cor representativa de cada grupo e aquela que mais se aproxima de

todas do grupo.

0 50 100 150 200 250x

k-Means

Ou seja, e a que tem maior similaridade media com os elementos do

grupo.

0 50 100 150 200 250x

k-Means

Ou seja, e a que tem maior similaridade media com os elementos do

grupo.

0 50 100 150 200 250x

k-Means

Matematicamente, quem sao esses elementos?

0 50 100 150 200 250x

k-Means

Dado um conjunto de pontos X n-dimensionais, queremos determinar o

ponto c , representando o centro, que minimiza:

J(X , c) =1

m∑i=1

dist(xi, c)

definimos que a distancia e o inverso da similaridade.

k-Means

O mınimo pode ser encontrado com:

∇J(X , c) =1

m∑i=1

∇dist(xi, c) = 0

k-Means

Temos os centros...como definir os grupos?

0 50 100 150 200 250x

k-Means

Para cada amostra x, verificamos o centro mais proximo...essa amostra

fara parte desse grupo.

0 50 100 150 200 250x

k-Means

Sabemos como calcular o centro, dado os grupos...e como definir os

grupos dado os centros.

0 50 100 150 200 250x

Mas como comecamos?

k-Means

Comecamos chutando pontos iniciais para os centros.

0 50 100 150 200 250x

k-Means

Definimos os grupos de acordo com esses centros:

0 50 100 150 200 250x

k-Means

Para cada grupo, calculamos o novo centro:

0 50 100 150 200 250x

k-Means

E remontamos os grupos:

0 50 100 150 200 250x

k-Means

Repetimos esse procedimento...

0 50 100 150 200 250x

k-Means

...ate os centros ou os grupos nao se alterarem mais.

0 50 100 150 200 250x

k-Means - Algoritmo

def kmeans(X, k, it=100):

centers = [X[i,:] for i in np.random.choice(X.shape[0])]

while it>0:

centers = emStep(X, centers)

return estStep(X, centers)

def emStep(X, centers):

return maxStep( X, estStep(X, centers) )

k-Means - Algoritmo

def estStep(X, centers):

return np.array([np.argmin(distances(x_i, centers))

for x_i in X])

def maxStep(X, labels):

return [X[labels == k].mean(axis = 0)

for k in np.unique(labels)]

k-Means - Algoritmo

def distances(x, centers):

return [dist(x, center_j) for center_j in centers]

k-Means - Scikit-Learn

from sklearn.cluster import KMeans

model = KMeans(n_clusters=k)

model.fit(X)

clusters = model.labels_

Proxima Aula

Na proxima aula aprenderemos sobre os algoritmos de agrupamento

Espectral e Hierarquico.

Aprendizado N~ao-Supervisionado - folivetti.github.io · Aprendizado N~ao-Supervisionado Essas t...

Documents

Aprendizado Profundo em Redes Desaﬁadoras: Conceitos e ...conceitos relacionados ao aprendizado de máquina, e principais algoritmos e modelos de aprendizado profundo. A Seção

Redes Neurais. TE073 - Processamento Digital de Sinais II 2 Tópicos Introdução Conceitos Histórico Modelos Neurônios Redes Aprendizado Supervisionado

Lighted Strings: Tecnologia Aplicada ao Aprendizado de

MODOS DE APRENDIZADO NÃO-SUPERVISIONADO PARA … · modos de aprendizado nÃo-supervisionado para o modelo neur4l sem-pesos wisard tese submetida ao corpo docente da coordenaÇÃo

INF 1771 – Inteligência Artificial Edirlei Soares de Lima Aula 18 – Aprendizado Não-Supervisionado

Algoritmos de Agrupamento - Aprendizado não supervisionado

Aprendizado Supervisionado para Redes Neurais Pulsadas sem …monografias.poli.ufrj.br/monografias/monopoli10011211.pdf · 2014-08-26 · Aprendizado Supervisionado para Redes Neurais

MURILO BARRETO SOUZA Rede de aprendizado supervisionado

REDES NEURAIS ARTIFICIAIS - ime.usp.bradao/RNAFINAL2018.pdf · • funÇÕes de ativaÇÃo • aprendizado • aprendizado supervisionado ... • o paralelismo É a principal caracterÍstica

Aplicação de Máquinas de Aprendizado Extremo ao Problema

APRENDIZADO NÃO-SUPERVISIONADO EM REDES NEURAIS … · PALAVRAS-CHAVE: Redes neurais pulsadas, aprendizado não-supervisionado, agrupamento, visão computacional. ABSTRACT Pulsed

Aprendizado de Máquina - folivetti.github.io · Rotula˘c~ao dos Dados Nas tarefas de Aprendizado Supervisionado, e necess ario rotular uma parte dos dados obtidos para a constru˘c~ao

Introdução ao Aprendizado de Máquina

Material de apoio ao aprendizado de Circuitos Eletricos I´§ão_da_lista_de... · Material de apoio ao aprendizado de Circuitos Eletricos I´ Soluc¸ao da Lista de Exerc˜ ´ıcios

Aprendizado Semi-Supervisionado em Redes Complexas Fabricio Breve ICMC – USP

Boas Maneiras Aprendizado Não Supervisionado Universidade … · •Boas Maneiras –Métricas de Avaliação & Téc. de Validação –Avaliação & Comparação de Classificação

INF 1771 – Inteligência Artificial Aula 20 – Aprendizado Não-Supervisionado Edirlei Soares de Lima

Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas - Uma Revisão Sistemática

Aprendizado Semi-Supervisionado utilizando Competição e Cooperação entre Partículas em Redes

Capítulo 6 Redes Neurais Artificiais para …decastro/pdf/RNA_C6.pdf · Conforme estudamos no Capítulo 2, o aprendizado não-supervisionado ... aprendizado auto-organizado (devido