28
Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno Elena Gamboa Arancibia Olga Acosta Claudia Gutiérrez

Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Embed Size (px)

Citation preview

Page 1: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Elena Gamboa ArancibiaOlga AcostaClaudia Gutiérrez

Page 2: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Gobierno Abierto

Transparencia

Colaboración Participación

Gobierno Abierto (Open Gov)

Colaboración con la sociedad

Page 3: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Principios del Gobierno Abierto

La PARTICIPACIÓN en un Gobierno

Abierto implica dar voz a los

ciudadanos en los procesos de toma de decisiones y

diseño de políticas públicas, usando

herramientas tecnológicas que

permitan expresar sus opiniones y

sugerencias sobre el quehacer

gubernamental para mejorar sus

actuaciones y servicios.

La TRANSPARENCIA aplicada al funcionamiento de los gobiernos significa que estos pongan a disposición de la sociedad toda la información relacionada con su actividad, gestión y administración.

La COLABORACIÓN continua entre las instituciones de administración públicade diversos niveles, así como entre el gobierno y ciudadanos, empresas, organizaciones, etc.

Contribuyendo a mejorar las condiciones de vida a través de la creación de aplicaciones, servicios en line, ciudades inteligentes, etc. Los ciudadanos, además de aportar su opinión sobre las políticas públicas, se convierten en socios de los gobiernos .

TECNOLOGÍAS DE LA INFORMACIÓN Y COMUNICACIÓN

DATOS ABIERTOS DE GOBIERNO

Page 4: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Datos Abiertos de Gobierno

• Datos Abiertos (Open Data) su objetivo es poner a disposición de todo el mundo los datos de manera que puedan ser consultados, redistribuidos y reutilizados libremente por cualquiera, respetando siempre la privacidad y seguridad de la información.

• Los  Datos Abiertos de Gobierno se refieren a la aplicación de los estándares de los Datos Abiertos a la información que gestionan las Instituciones de Administración Pública u otros organismos dependientes del estado.

Page 5: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Estándares de los Datos Abiertos

1. Completos: Todos los datos públicos deben estar disponibles. Se deben excluir la información personal y sensible.

2. Primarios: Los datos deben ser entregados tal como fueron recolectados de su fuente, con la mayor granularidad posible, sin modificaciones en su forma.

3. No propietarios: Los datos deben estar disponibles en un formato sobre el cual ninguna entidad tenga un control exclusivo

4. Libres de licencias: Los datos no deben estar sujetos a ninguna restricción producto de derechos de autor, patentes, derechos de marca o secreto industrial. Con restricciones que permitan regular la privacidad de las personas y seguridad de las instituciones

.

Page 6: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Estándares de los Datos Abiertos

5. Procesables automáticamente: deben estar en formatos que permitan el procesamiento automático.

6. Oportunos: Los datos deben estar disponibles tan pronto como sea posible con el fin preservar su valor.

7. Accesibles: Los datos deben estar disponibles para el más amplio rango de usuarios y para el más amplio rango de propósitos.

8. No discriminatorios: Los datos deben estar disponibles para todos, sin requerir registro.

Page 7: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Gobierno Abierto en Chile

Ley de Transparencia y Acceso a la Información

Pública

Directorio de Transparencia

Portal de Datos de Gobierno

Page 8: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Transparencia en Chile• La ley de Transparencia de la Función Pública y Acceso a la

Información de la Administración del Estado N° 20.285 establece lo siguiente:

Ley N°20.285

Transparencia de la función en la función Publica

Acceso a la información

Publicación de información en sitio web.

Solicitud de información a través de un formulario

Page 9: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Las instituciones deben publicar en su sitio web la siguiente información:

Los actos y documentos

Las potestades, responsabilidades, funciones o

tareas

Estructura orgánica

Personal de planta y a contrata

Contrataciones para el suministro de bienes muebles.

Trámites, Beneficios y subsidios

Los actos y resoluciones que tengan efectos sobre terceros

Presupuesto asignado, y los informes sobre su ejecución

Mecanismos de participación ciudadana

Mecanismos de participación, representación e intervención

Auditorías Internas

Page 10: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno
Page 11: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno
Page 12: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Datos Abiertos de Gobierno en Chile

• Instructivo Presidencial N° 005 sobre Gobierno

Abierto

Instructivo Presidencial N° 002 sobre Políticas de Participación Ciudadana

Creative Commons

Licencia GNU GPL

Open Database License (ODbL):

Page 13: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno
Page 14: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

•Formatos inadecuados•Formatos propietarios•Datos no son intero- perables

Formato

• Datos poco accesibles.

Despliegue

• Contenidos limitados( solo los determinados por la ley)

• Con restricciones de uso..

Contenido

La ley de transparencia en su forma activa no contempla el uso de los estándares de datos abiertos.

Por otra parte, en el portal de datos abiertos no se cumple con los estándares de formato internacionales para su publicación.

Datos No Son InteroperablesDatos No Democratizadores

Problema:

Page 15: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Objetivo General

• Crear un modelo de buenas prácticas para la publicación de los datos abiertos de gobierno tanto en su variable de Formato –Despliegue –Contenido para generar datos abiertos e interoperables para el uso de las personas e instituciones que los requieran.

Page 16: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Objetivos Específicos

• Diseñar un modelo de análisis y evaluación de datos abiertos de gobierno basado en estándares internacionales.

• Evaluar con dicho modelo la publicación de los datos en los sitios de transparencia y en el portal de datos abiertos de gobierno.

Page 17: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Modelo para la Evaluación de los Datos Abiertos

• De acuerdo a los estándares por W3C y el G8 se ha fijado el siguiente modelos de evaluación de datos abiertos:

Indicador Variable Valor

Formato

Tipo Pdf, csv,doc, xls,

xlsx,xml,html,txt, etc.

Procedencia Abierto/propietario

Licenciamiento abierto

Creative Common

GNU GPL

Open Database License

Facilidad de

procesamiento automático s/n

Despliegue

Nivel de navegación

1er nivel

2do nivel

3er nivel

Diseño responsivo s/n

Contenido

URI s/n

Metadatos

Título

Fuente

Descripción

Institución

Page 18: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

¿Cómo obtener la información de las variables planteadas en el modelo de

análisis?• Proponemos un proceso de Extracción de

Información para obtener la información de los indicadores propuestos en el modelo.

• El proceso de extracción se realiza en un corpus construido automáticamente con una muestra de entidades de gobierno.

Page 19: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Extracción de Información

• De acuerdo con Riloff y Lorenzen (1999), un sistema de EI obtiene información de textos en lengua natural y para un dominio específico, donde se debe definir previamente el dominio y los tipos de información de interés.

Page 20: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Extracción de Información Sitios de Gobierno

• El proceso de extracción de información en este caso específico tiene como propósito semi-automatizar la obtención de datos relacionados con los indicadores del modelo de evaluación de los sitios de gobierno abierto: Directorio de transparencia Activa y Portal de datos de gobierno.

• Herramientas utilizadas:

Lenguaje de Programación Python

Libreria Beautiful Soup

Sketch Engine

Page 21: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Metodología

Page 22: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Beautiful Soup

La librería Beautiful Soup nos permite la exploración y la extracción del contenido de páginas HTML y XML.

Se obtiene una estructura de datos anidada que facilita la navegación y la extracción de la información relevante mediante las funciones disponibles en el módulo.

En el siguiente link podemos encontrar un tutorial que nos explica como usar los diferentes funciones

http://www.crummy.com/software/BeautifulSoup/bs4/doc/

Page 23: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Sketch Engine

• Es una herramienta computacional que permite construir y analizar corpus.

• Es un programa que se puede consultar en la web: http://www.sketchengine.co.uk/

Page 24: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Sketch Engine

Page 25: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Sketch Engine• Una vez formado el corpus se puede explorar utilizando las

funciones del módulo:

Page 26: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Conclusiones• En muchas investigaciones actuales enfocadas en la extracción de

información (extracción terminológica, extracción de relaciones léxicas, etc.) se ha usado la Web como una fuente enorme de información textual.

• Metodologías como la planteada en nuestro trabajo permiten navegar un sitio Web de forma automática para obtener los URIs vía establecer una profundidad específica en el nivel de navegación y con ellos construir un corpus.

• En el caso concreto de este trabajo, la construcción de un corpus con información de entidades de gobierno nos permitió extraer los datos requeridos para evaluar el sitio.

• A grandes rasgos, vía este proceso de extracción de información fue evidente que no se aplicaba a cabalidad el modelo de datos abiertos por lo que concluimos que la información no es transparente a la ciudadanía.

Page 27: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Conclusiones• Sitios como el evaluado en este trabajo crecen continuamente

y por ello resulta indispensable crear mecanismos de monitoreo automáticos que permitan evaluarlos regularemente para verificar que cumplan con los requerimientos de los modelos en los que fueron concebidos.

• En este sentido, las técnicas de PLN resultan de gran utilidad para automatizar los procesos de extracción o recuperación de información, según sea el caso.

Page 28: Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno

Muchas gracias por su atención.