Upload
internet
View
128
Download
0
Embed Size (px)
Citation preview
PAGE RANKDuílio Assis Nobre
SUMÁRIO
Introdução a Processos Estocásticos- Definição e exemplos
Cadeias de Markov- Definição e exemplos- Probabilidade de Transição- Probabilidades Estacionárias
Aplicação na área de computação: Page Rank
Referências
INTRODUÇÃO A PROCESSOS ESTOCÁSTICOS
Definição
Exemplos:- X(t) representa o número de clientes numa loja no
instante t;- X(t) representa a cotação de uma ação no fim do dia t;- X(t) representa o nível de stock de um determinado
artigo no fim do dia t;
CADEIAS DE MARKOV
Definição
CADEIAS DE MARKOV
Considere o seguinte exemplo:
- Para cada pessoa que compre licor da família F há 90% de probabilidade de o próximo licor que comprar seja licor Florescente.
- Já para cada pessoa que compre o licor da família P há só 80% de o próximo comprado seja ainda o licor Petalado.
CADEIAS DE MARKOV
Matriz de transição de estados:
Outra forma de representação, diagrama de tansições:
CADEIAS DE MARKOV
Portanto a probabilidade de transição em n passos é dada por:
Probabilidade de Transição:
CADEIAS DE MARKOV
Matriz de transição para 3 passos:
Visto isso, podemos dizer que se P for uma matriz estocástica, então qualquer potência de P o é, pois:
CADEIAS DE MARKOV
Probabilidades Estacionárias:- Probabilidades de transição em dezesseis períodos:
A esta probabilidade chama-se probabilidade estacionária do estado j e representa-
se por חj. Por outras palavras,
CADEIAS DE MARKOV
- Corresponde a um sistema de equações de solução indeterminada:
CADEIAS DE MARKOV
Relembrando o primeiro exemplo, quais são as probabilidades estacionárias?
O que significam estes valores?
PAGE RANK
Motivação:
- Dexar claro o que é Page Rank e sua importância
- Mostrar como o é calculado para cada página
PAGE RANK
PAGE RANK
A formula:
PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))
- PR(Tn): Importância de cada página
- C(Tn): Número de links saindo de cada página
- d e (1-d): valores de Teleporting
PAGE RANK
Teleporting:
- Uma caminha aleatória.
- Uma caminha aleatoria normal.
PAGE RANK
Exemplo 1:
Pelo gráfico temos que C(A) = 1 e C(B) = 1
Certo, mas quais valores iniciais de PR(A) e PR(B)?
d = 0.85
PR(A) = (1 – d) + d(PR(B)/1)
PR(B) = (1 – d) + d(PR(A)/1)
PAGE RANK
PR(A) = 0.15 + 0.85 * 1/1= 1
PR(B) = 0.15 + 0.85 * 1/1= 1
Vamos começar com ambos iguais a 1:
Agora, vamos considerar ambos inicialmente iguais a 0:
PR(A) = 0.15 + 0.85 * 0.2775= 0.385875
PR(B) = 0.15 + 0.85 * 0.385875= 0.47799375
PR(A) = 0.15 + 0.85 * 0/1= 0.15
PR(B) = 0.15 + 0.85 * 0.15/1= 0.2775
Repetindo as contas:
PAGE RANK
PR(A) = 0.15 + 0.85 * 40/1= 34.15
PR(B) = 0.15 + 0.85 * 34.15/1= 29.1775
Agora, vamos considerar ambos inicialmente iguais a 40:
Repetindo as contas:
PR(A) = 0.15 + 0.85 * 29.1775/1= 24.950875
PR(B) = 0.15 + 0.85 * 24.950875/1= 21.35824375
PAGE RANK
Começando com ambos 0, vamos fazer um número considerável deinterações . Abaixo segue apenas os resultados:
PR(A): 0.00000 PR(B): 0.00000PR(A): 0.15000 PR(B): 0.27750PR(A): 0.38588 PR(B): 0.47799PR(A): 0.55629 PR(B): 0.62285 PR(A): 0.67942 PR(B): 0.72751 PR(A): 0.76838 PR(B): 0.80313PR(A): 0.83266 PR(B): 0.85776PR(A): 0.87909 PR(B): 0.89723PR(A): 0.91265 PR(B): 0.92575PR(A): 0.93689 PR(B): 0.94635PR(A): 0.95440 PR(B): 0.96124PR(A): 0.96705 PR(B): 0.97200 PR(A): 0.97620 PR(B): 0.97977 PR(A): 0.98280 PR(B): 0.98538 PR(A): 0.98757 PR(B): 0.98944 PR(A): 0.99102 PR(B): 0.99237 PR(A): 0.99351 PR(B): 0.99449 PR(A): 0.99531 PR(B): 0.99602 PR(A): 0.99661 PR(B): 0.99712PR(A): 0.99755 PR(B): 0.99792
Visto os resultados das 3 suposiçõesde valores iniciais a PR(A) e PR(B), a que conclusão podemos chegar?
PAGE RANK
Exemplo 2:
Exemplo 3:
PAGE RANK
Quais seriam os PRs das páginas do exemplo 3?
PR(A) = (1-d) + d (PR(B)/C(B) + … + PR(Spam n)/C(Spam n))
Pegando todos os 1000 spams e isolando temos:
PR(A) = (1-d) + d (PR(B)/C(B) + 1000(PR Spam) /C(Spam ))
Qual seria o efeito desse fator 1000 no cálculo do PR(A) e PR(B)?
Fazendo algumas contas, temos:
PR(A): 0.00000 PR(B): 0.00000 PR(Spams): 0.00000 PR(A): 0.15000 PR(B): 0.27750 PR(Spams): 0.15024 PR(A): 127.85049 PR(B): 108.82292 PR(Spams): 0.24250 PR(A): 206.27456 PR(B): 175.48338 PR(Spams): 0.29916
PAGE RANK
PAGE RANK
Qual seria a sua importância de um modo geral?
O que seria um possível defeito?
REFERÊNCIAS
http://www.ianrogers.net/google-page-rank/
http://www.youtube.com/watch?v=FNjQ-itLuBY&feature=related
- Chave de busca no YouTube: Como funciona el algoritmo PageRank de Google
PAGE RANKDuílio Assis Nobre