Upload
camilo-lopez-aravena
View
146
Download
4
Embed Size (px)
Citation preview
Diseño y construcción de una plataforma de clasificación y calificación de post para una red de blogs basada en textmining para Betazeta
Networks S.A.
Camilo López A.
betazeta
Volumen
Filtro de contenido
Categorizar
La Solución
Extract Obtención de datos
Extract
Transform Training
Datamanage
Limpieza, LDA y gestión de datos.
Extract
Transform Training
Datamanage
Predict Clasificación
Extract
Transform Training
Datamanage
Predict
Datos
Extract
Transform Training
Datamanage
Predict
Modelo
1 Sólo modelo -> Predicción Genérica
1 Cambio -> Cambiar todo
Análisis Histórico
Cliente
Sitios
Modelos
Clasific.
Clasificador A
Clasificador B
Clasificador C
Cliente
Modelo 2
Modelo 3
Clasificador A
Modelo 1
Sitio Z
Sitio X
Modelo 2 Sitio Z
Modelo 2
Modelo 3
Clasif. A
Modelo 1
Modelo Clasif. A
Topic A
Topic B
Topic C
M(1) C(A)
T(A)
T(B)
T(C)
M(2)
T(X)
T(Y)
T(Z)
M(1) C(A)
T(A)
T(B)
T(C)
M(2)
T(X)
T(Y)
T(Z)
Modelo General
M(1) C(A)
T(A)
T(B)
T(C)
M(2)
T(X)
T(Y)
T(Z)
Modelo Específico
Web Service
Clasificador A
Clasificador B
Cliente 1
Cliente 2
Cliente 3
Mejorar limpieza del texto y Stemming
Mejoras del modelo en el tiempo
Interfaz
Validación con expertos
Gantt Escritura Informe Mes Oct Noviembre Diciembre Enero
Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Ca
pít
ulo
Intro 50% 25% 20% 5%
Metodología 30% 60% 5% 5%
MC 10% 10% 10% 10% 20% 20% 20%
Solución 10% 20% 20% 20% 20% 10%
Experimentos 20% 30% 20% 20% 10%
Conclusiones 50% 40% 10%
T. Futuro 30% 60% 10%
Gantt Proyecto Mes Oct Noviembre Diciembre Enero
Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Ite
raci
on
es
Iteracion 1 50% 50%
Diseño I2 100%
Iteracion 2 30% 30% 40%
Diseño I3 50% 50%
Iteracion 3 40% 60%
Diseño I4 100%
Iteracion 4 30% 30% 40%
Interfaz 20% 20% 30% 30%
Muchas Gracias