Upload
henrique-dias
View
237
Download
0
Embed Size (px)
Citation preview
Previsor de Aprovação
Henrique [email protected]
Sumário
• Motivação• Atributos Previsores• Coleta de Dados• Relevância dos Atributos• Escolha da Classe• Relação dos Dados• Resultados• Análise dos Erros• Atributos não verificados• Conclusão • Agradecimentos
Motivação
Aumentar o aproveitamento acadêmico dos alunos, podendo oferecer a eles um sistema que possa recomendar ou avaliar as disciplinas que melhor se caracterizam com o seu desempenho acadêmico.
Atributos Previsores
Idade
ClasseSexo
I1
I2
I3 I4
I5
I6
I7 Etapa
TRM
TIM
Créditos
Caráter
Docente
Disciplina
SemestreTotal de Créditos
SaúdeCarga Horária
Trabalho
Clima
FériasVestibular
RedaçãoRepetência
Histórico
Motivação
Conceito
Situação
Atributos Previsores
Idade
ClasseSexo
I1
I2
I3 I4
I5
I6
I7 Etapa
TRM
TIM
Créditos
Caráter
Docente
Disciplina
SemestreTotal de Créditos
SaúdeCarga Horária
Trabalho
Clima
FériasVestibular
RedaçãoRepetência
Histórico
Motivação
Conceito
Situação
Coleta de Dados• 5 Históricos
o Dados insuficientes o Distribuição das Classes
A: 12%, B: 30%, C: 45%, D: 8%, FF: 1%, CANC: 1%
• Fonte de dados do CPD
o 2150 alunos do semestre 2008/2o Distribuição das Classes
72% Aprovado; 23% Reprovado; 3% Afastado; 0,3% Canceladoo Normalizaçãoo Lixoo Dados que comprometem
• CPD Plus
o 18 Atributos: + Data Nascimento, Semestre Atual, Semestre Anterior, Idade Distribuição das Classes 19% A, 26% B, 29% C, 12% D, 11%FF, 4% NULL (Afastado, Cancelado)
o 21.328 Instâncias
Relevância dos Atributos
• 5 Históricos (Ranker + InfoGainAttributeEval)o 0.986 Disciplinao 0.1123 TRMo 0.1003 TIMo 0.0956 Index5
• CPD (Ranker + InfoGainAttributeEval)
o 0.28726 Indice3o 0.20548 TRMo 0.18971 TIMo 0.16162 Docenteo 0.15161 Disciplinao 0.15057 Indice4o 0.06263 Indice1o 0.05335 Indice5o 0.03273 Etapa o 0.02641 Indice2 o 0.00692 Creditos o 0.00552 Carater o 0.00387 Sexo
• CPD (Ranker + ReliefFAttributeEval)o 0.30403 Docenteo 0.28968 Disciplinao 0.06124 Indice3o 0.04235 TRMo 0.03368 Indice4o 0.03138 Etapao 0.02437 TIMo 0.01987 Indice1o 0.01235 Creditoso 0.00969 Caratero 0.00387 Indice2o 0.00248 Indice5o -0.00192 Sexo
Escolha da Classe
• Situaçãoo Aprovadoo Reprovadoo Afastadoo Cancelado
• Conceito
o Ao Bo Co Do FF
Relacão dos Dados (TIM x I3)
Resultados
Meta.ClassificationViaRegression TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.269 0.003 0.75 0.269 0.396 0.799 Afastado 0.922 0.474 0.84 0.922 0.879 0.857 Aprovado 0 0 0 0 0 0.387 Cancelado 0.507 0.09 0.635 0.507 0.564 0.843 Reprovado
Lazy.KStarTP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.821 0.007 0.797 0.821 0.809 0.996 Afastado 0.888 0.39 0.86 0.888 0.874 0.85 Aprovado 0 0.001 0 0 0 0.457 Cancelado 0.558 0.107 0.617 0.558 0.586 0.838 Reprovado
Análise de Erros
Atributos não verificados
• Semestre cursado: 1º ou 2º semestre • Número total de disciplinas cursada pelo aluno no semestre
corrente • Avaliação dos professores (Portal do Aluno)
Conclusão
• Dificuldade na obtenção dos dados• Escolha dos Atributos• Avaliação dos algorítmos• Implementação do sistema• Análise de dados Tomada de Decisão
Agradecimentos
• Paulo Engel Martins• Denise Coutinho, CPD - UFRGS
o Dados fornecidos • Contribuição espontânea dos históricos
o Alex Ziglero Augusto Santoso Carolina Nogueirao Felipe Silveirao Filipe Rodrigueso Marcelo Ruaso Rafael Pacheco Kovaleski
Muito Obrigado!
Dúvidas?
Sugestão de leitura: Super Crunchers, Ian Ayres