Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
Propuesta De Una Bodega De Datos Basada En
Estándares, Que Permitan La Disponibilidad Y La
Certificación De Información En La Educación
Superior En Colombia.
Autores
Oscar Julián Castiblanco Pardo
Lady Yohana Rozo Domínguez
Tutor
Lindsay Alvarez Pomar
Universidad Distrital Francisco José De Caldas
Especialización en Gestión de Proyectos de Ingeniería
Facultad de Ingeniería
Bogotá, Colombia
Agosto de 2019
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 2
Contenido
RESUMEN 4
PALABRAS CLAVE 5
INTRODUCCIÓN 6
1. CONTEXTO E IDENTIFICACIÓN DEL PROYECTO 7
1.1 Normatividad Ambiental 13
1.2 Normatividad de Calidad 14
1.3 Normatividad de Seguridad y Salud en el Trabajo 14
1.4 Referentes jurídico-legales del proyecto 15
1.5 Marco Conceptual 16
2. ANÁLISIS DEL MERCADO 19
2.1 Análisis de la Oferta 19
2.2 Análisis de la Demanda 20
2.2 Análisis de Mercado 23
3. PLANIFICACIÓN DEL PROYECTO 26
Misión 26
Visión 26
Objetivos 27
Legal 27
Política Integral HSEQ 27
Política de Calidad 27
Política Ambiental 28
Valor Agregado 29
4. INGENIERÍA DEL PROYECTO 29
4.1 Estudio Técnico 29
4.2 Definición del Producto 31
4.3 Base de datos OLTP 33
4.4 Base de datos OLAP 33
4.5 BlockChain 34
4.6 Bodega de Datos 35
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 3
4.7 Arquitectura Funcional 38
4.8 Arquitectura Técnica 39
4.9 Beneficios del Servicio 40
4.10 Definición del Proceso del Proyecto 40
4.11 Plan de Ventas 43
4.12 Análisis de Capacidad 44
5 ESTUDIO ADMINISTRATIVO 46
5.1 Estructura Organizacional 47
6 ESTUDIO ECONÓMICO - FINANCIERO 48
6.1 Costos Operativos y Administrativos 48
6.2 Ingresos Proyectados 49
7 CONCLUSIONES Y RECOMENDACIONES 1
8 REFERENCIAS 2
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 4
RESUMEN
El sistema de educación superior en Colombia cuenta con una gran cantidad y
variedad de aplicaciones y bases de datos involucrados en su core de negocio en
el ambiente educativo, esta información no se encuentra consolidada, lo que ha
permitido en el país a través de los años el aumento de empresas dedicadas
exclusivamente a la falsificación de títulos, creación de calificaciones, carnés
estudiantiles y réplicas de diplomas exactos generadas por las instituciones
educativas, práctica que se ha vuelto popular y con la cual en la actualidad se han
disparado el comercio de títulos como negocio del mercado no legal. Es necesario
aprovechar esta pluralidad con el fin de mejorar los accesos a las bases de datos,
haciendo uso de las herramientas tecnológicas actuales integrando los diferentes
orígenes de información, contando así un repositorio único que permita el acceso a
los datos, donde se incluya tanto la educación superior; que los datos
correspondientes a títulos profesionales y de posgrado, se encuentren actualizados
con la menor periodicidad posible y en la mayor frecuencia de tiempo. Contar con
la información histórica de los estudiantes, la integración de los datos por institución,
la coherencia de la información, mejorar la calidad de los datos, presentando
consistencia, completitud, haciendo que estos sean confiables, oportunos y
precisos; logrando certificar la veracidad de lo títulos obtenidos en cada institución
de educación superior, lo cual facilitará los trámites administrativos y la validación
por terceros (administración pública, empresas, empleadores, outsourcing,
universidades, entre otros), dando una garantía plena de cuándo y quién lo emitió,
y teniendo alcance de los mismos; con lo cual se busca garantizar que los estudios
relacionados por un egresado estén certificados y que estos se puedan compartir y
validar combatiendo los fraudes académicos y la falsificación de los títulos.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 5
PALABRAS CLAVE
BlockChain
Business Intelligence (BI)
Certified Education
Cloud Services
Data Warehouse
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 6
INTRODUCCIÓN
La información es un activo muy importante para las organizaciones, en la
actualidad la información se genera con una velocidad, un volumen y una variedad
nunca antes vista, en Colombia cada institución educativa ha modelado su sistema
de información de acuerdo a su necesidad, lo que ha dificultado la tarea de
consolidación de la información, la falta de estándares ha generado que cada
entidad cuente con sus propios lineamientos lo que abre una gran puerta para que
los certificados propios de cada institución educativa de educación superior, sean
falsificados. Esta misma autonomía dificulta la verificación y validación de los datos;
las organizaciones se limitan a solicitar las copias de algunos de los estudios
superiores, lo cual no garantiza ni certifica que estos sean reales, es decir que las
compañías están contratando profesionales con títulos falsos que ponen en riesgo
cualquier cargo a desempeñar.
Es necesario lograr centralizar los datos, permitiendo que en un repositorio central
se depositen los registros suministrados por cada institución educativa, modelando
bajo estándares que permitan su fácil integración y consolidación; El proyecto busca
integrar los estudios de educación superior, a través de un modelo de extracción,
transformación y carga de datos a una bodega de datos multidimensional
implementada en la nube, basada en estándares que permitan la integración de
información de los diferentes orígenes de negocio, estándares que van a estar
alineados a la entidad principal y a los atributos que tengan relación, desde el área
de trabajo hasta el repositorio central, depositando allí los registros de cada
egresado por institución educativa, programa académico, título obtenido, año de
titulación, promedio del egresado; así la certificación se lograra a través de
tokenización de las solicitudes, de acuerdo con la cantidad de datos que requiera
consultar una persona o con la cantidad de personas que requieran ser consultadas,
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 7
permitiendo así que un ente centralizado replique la información a cada entidad
educativa que se incorpore a la iniciativa, logrando así mantener el estándar y la
validación y certificación de los registros suministrados a nivel nacional.
1. CONTEXTO E IDENTIFICACIÓN DEL PROYECTO
El sistema de información educativo en Colombia, tiene problemas de calidad de los
datos como la poca o nula capacidad de recopilación, uso y calidad, la mayoría de
las bases de datos de las entidades educativas operan de manera independiente la
una de la otra, cuentan con sus propias definiciones de datos, lógicas de
implementación, la disponibilidad de la información es un factor clave que es
necesario abarcar en el contexto de la problemática ya que al ser difícil el acceso a
la misma, el procesamiento, la única definición de tipo de datos, la actualización,
granularidad, consistencia y acceso aumenta la dificultad de su uso y adecuada
explotación, lo que impide garantizar la consistencia de los datos, adicional no existe
una herramienta definida para la conexión a los datos y adecuado uso de estos, para
la generación de informes con indicadores generales que mejoren el alcance,
cobertura, disponibilidad y certificación de la información de la educación superior a
nivel nacional.
Para obtener el mayor rendimiento dentro de cada institución educativa, es necesario
gestionar el conocimiento, capturar los datos, transformar la información, asimilarla,
difundirla y transferirla para fortalecer el conocimiento, lo que permite la
implementación de nuevas metodologías y técnicas que permitan el apoyo a los
estudiantes y a los docentes, promoviendo el conocimiento real y potencial de los
miembros de la comunidad educativa, con los medios necesarios para efectuar el
cambio con una infraestructura básica, la disponibilidad de la información se puede
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 8
garantizar desde una solución inicial de DataWareHouse que permitan la gestión de
la información, como lo comparte (Robles, 1999) o una solución de Datamart.
El uso, administración y disposición de la información está regida por organismos
públicos que vigilan y garantizan que la información sea confidencial y solo tenga
acceso a ella las personas que cuentan con autorización, que sea integra que se
mantenga con exactitud, originalidad y totalidad de la información en los métodos de
procesamiento y finalmente que esté disponible y se cuenten con los accesos a
indicadores y recursos que de ella se requieran, tomando los datos operativo e
integrándolos en el DataWareHouse de acuerdo al concepto de (Gaibazzi, Ingrassia,
Marchese y Pérez, 2009).
En el ámbito universitario el uso de las tecnologías de la información y las
comunicaciones son pilares estratégicos para promover la innovación y la
creatividad, garantizando la disponibilidad de la información en la gestión educativa,
administrativa y de acceso, lo que permite una gestión eficiente, transparente y con
responsabilidad social universitaria implementando DataWareHouse con datos
orientados a distintas variables presupuestarias, académicas y de personal que
permite analizarlos para lograr una visión integrada de la institución educativa y que
sirva para la toma de decisiones según (Aguilar, Cabrera, Capanegra y Jorda, 2016);
lo relevante es descubrir la importancia de los datos dentro de la institución de
manera que logre integrar diferentes sectores y todos empiecen a reconocer lo
fundamental que es la calidad de datos en el registro de la información, contar con
información disponible aunque no sea de uso directo, permitiendo la toma de
decisiones y el análisis de información a través del uso de DataWareHouse o de
sistemas gerenciales tal como indica (Ottaviani, 2007).
La implementación de un DataWareHouse cumple con las necesidades de
requerimiento de información de las instituciones educativas para mejorar la gestión;
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 9
(Nader, 2004) indica que para la implementación de un proyecto de este alcance se
requiere contar con el apoyo de los usuarios ya que son quienes conocen del área
de negocio o procesos empresariales, de tiempo para definir las actividades,
alcance, construcción y puesta en marcha de la solución y finalmente de la
tecnología con la que se cuenta o que se va a utilizar en el desarrollo del proyecto.
Las principales características y bondades de un DataWareHouse las relaciona
(León, 2011) y son integrados es decir que no existen datos incoherentes y se
generan agrupaciones, históricos es decir que se conserva la historia del dato, no
volátiles ya que no permite su borrado ni modificación y finalmente orientados a un
tema específico ya que los datos se categorizan por temas de negocio no por
aplicación.
Según indican (Amadeo, Diaz y Osorio, 2012), en la universidad nacional de la plata
en Argentina, se enfrentó un proyecto de integración de datos que cuenta con
soluciones informáticas para la gestión académica de los alumnos desde los niveles
secundarios, grado y posgrado, para realizar análisis de manera multidimensional
resolviendo la disponibilidad de la información implementando una solución de
DataWareHouse, permitiendo la gestión de la información de forma confiable,
segura, auditable, flexible y con alta disponibilidad, llevando a cabo la gestión de las
carreras de grado y posgrado a través del SIU, sistema de información universitaria,
el cual fue implementado como mecanismo de gestión del conocimiento y formación
continua; el cual mejoro el aprovechamiento de la disponibilidad de información en
el sistema de educación superior, consolidando sus sistemas en un DataWareHouse
que brinda información agregada de las universidades nacionales, (Falivene,
Gurmendi y Silva, 2003)
Al igual que lo expone (Ramírez, 2014), en la universidad nacional de la amazonia
peruana, la implementación de un DataWareHouse integra la información de la
institución y se usa como soporte para la toma de decisiones gerenciales basadas
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 10
en un modelo lógico que requiere una carga inicial, una actualización de datos y la
implementación de un modelo físico que soporte el diseño multidimensional y que
previene el manejo de datos anómalos o faltantes, es por eso que para garantizar
una correcta solución de DataWareHouse es encuentran varios factores expuestos
por (Medina, 2005), que son involucrar al usuario, apoyo por parte de los directivos,
clara definición de requerimientos, planeación apropiada y expectativas realistas; es
necesario contar con la metadata técnica que describe la estructura física y de
negocio que describe las reglas de negocio para garantizar el proceso y soportar la
toma de decisiones como lo expone (Baño, 2017).
El diseño para resolver la disponibilidad de la información se puede plantear también
a través de un Datamart, este es un modelo más sencillo que un DataWareHouse,
ya que requiere menos complejidad pues permite su implementación por etapas que
van enfocadas a áreas del negocio lo que hace que el alcance sea limitado, pues se
implementan de manera individual por cada área de acuerdo con las necesidades
encontradas en cada área, tal como nos comparte (Vilca, 2016).
En la Universidad de Guayaquil (Erazo, 2015) plantea el diseño de un Datamart para
la formación docente, la cual brinda a los usuarios una herramienta tecnológica que
permite realizar consultas en menor tiempo, tener disponibilidad de información en
un repositorio centralizado, reportes con información actualizada, control de accesos,
información integrada con las correspondientes restricciones de acceso.
Según el Ministerio de Educación, el sistema de información colombiano ha sido
modelado de acuerdo con la necesidad de cada ente territorial, es así como se
identifica que cada organismo que interviene al nivel educativo maneja sus propios
lineamientos en temas de información, la falta de estándares propicia a que la
información reportada tenga datos inconsistentes, la consolidación de la información
no permite el uso correcto de la misma y la veracidad de los datos no sea acertada;
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 11
ya que se mide con indicadores y estándares específicos por lo cual no se realiza
un correcto rendimiento de cuentas y no se han podido implementar mejoras para
la certificación de los estudios de los egresado de la educación superior colombiana.
Este sistema comprende de una gran cantidad de bases de datos, las cuales
cuentan con su propia estructura, motor y versión de base de datos, lógica de
diseño, definición de datos, accesibilidad y restricciones que a menudo están mal
coordinadas y crea duplicaciones y vacíos en la información, “esto afecta la
capacidad para hacerle seguimiento a las tendencias en los niveles educativos,
evaluar el desempeño en cada ETC y entre ellas, y explotar la información para
diseñar políticas” (Piñeros et al., 2013; OCDE/BIRF/Banco Mundial, 2013), estas
políticas que se pueden diseñar son la base fundamental para la definición de los
estándares que permitan el manejo correcto de la información.
La mayoría de las bases de datos operan de manera independiente la una de la
otra, cuentan con sus propias definiciones de datos, lógicas de implementación y
generan sus propios indicadores, esta independencia en la información es un reto
bastante grande ya que son múltiples variables para tener en cuenta en el desarrollo
de una estrategia que garantice la información que va a ser consolidada y procesada
en un repositorio central de información.
La administración de las diferentes bases de datos las realiza diferentes actores a
nivel nacional, el Ministerio de Educación Nacional administra múltiples bases de
datos en “preprimaria, primaria y secundaria, y también se le exige a cada territorio
certificado que cuente con su propia información, las secretarías de educación
también pueden diseñar sus propios sistemas; Las instituciones de educación
superior administran su propia información” (OCDE/BIRF/Banco Mundial, 2013;
MEN, 2014), estas se les exige por ley que compartan la información con el
Ministerio de Educación Nacional; “El SENA administra su propio sistema de
información, y aplica sus propios criterios y estándares para hacerle seguimiento a
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 12
las instituciones técnicas y tecnológicas” (OCDE/BIRF/Banco Mundial, 2013; MEN,
2014).
La disponibilidad de la información es un factor clave que es necesario abarcar en
el contexto de la problemática ya que al ser difícil el acceso a la misma, el
procesamiento, la única definición de tipo de datos, la actualización, granularidad,
consistencia y acceso aumenta la dificultad de su uso y adecuada explotación, lo
que impide garantizar la consistencia de los datos sin dejar de lado la ausencia de
una herramienta definida para la conexión a los datos y adecuado uso de estos,
para la generación de informes que certifiquen los estudios de educación superior y
que permitan un análisis apropiado del alcance, cobertura y disponibilidad de la
educación a nivel nacional.
De continuar con esta diversidad de orígenes de datos, con la ausencia de una
estructura y unos lineamientos definidos y de una centralización de datos, se
continuará con el multiprocesamiento de los datos, con la definición de políticas que
no resuelven de forma correcta la centralización de los datos, la disponibilidad de
los mismos y la certificación que compruebe que los estudios de educación superior
registrados por una persona son reales y sigue la puerta abierta a la falsificación de
diplomas y estudios de educación superior.
El sistema de información tiene problemas de calidad de los datos como la poca ò
nula capacidad de recopilación, uso y calidad; “Unos datos de buena calidad son la
columna vertebral de un sistema de información robusto. Para que los datos sean
un apoyo efectivo para el diseño de políticas, estos deben ser consistentes, estar
completos, ser confiables, oportunos y precisos” (MEN, Cap. 1, 2016) , implementar
estrategias de calidad de la información es garantizar un mayor nivel de calidad,
precisión, exactitud, completitud, integridad, actualización, coherencia, relevancia,
accesibilidad, confiabilidad y potencia a la hora de gestionarla, las cuales resultan
útiles al procesamiento, análisis y cualquier otro fin que un usuario quiera darles,
cualidades requeridas en el diseño de una bodega de datos que permita la
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 13
consolidación de la información y sea un repositorio centralizado de los datos desde
del nivel superior en la educación colombiana.
Teniendo en cuenta la normatividad vigente, el proyecto se enfoca en gestión y
desarrollo de software, por lo tanto, la política ambiental tiene un doble propósito;
minimizar el impacto sobre el medio ambiente de su actividad y maximizar la
capacidad de la tecnología para crear nuevas oportunidades para el desarrollo
sostenible. Las Tecnologías de la Información y las Comunicaciones (TIC) permiten
a la sociedad ser más ecológicamente eficientes en el uso de recursos naturales y
pueden jugar un papel relevante en la solución de muchas de las problemáticas
ambientales actuales; el compromiso con la mejora continua del sistema para un
desempeño ambiental que permita velar por el cumplimiento de la legislación y otros
requisitos voluntarios en materia de medio ambiente a nivel global y local.
Adoptar de forma complementaria y conforme al principio de precaución, normas
internas o estándares internacionales, integrando las partes interesadas tales como
colaboradores, incentivando en el uso eficiente de los recursos, los clientes.
1.1 Normatividad Ambiental
Se basa en la norma ISO 14001 de 2015, está establece que las compañías deben
definir “la política ambiental de la organización y asegurarse de que, dentro del
alcance definido de su sistema de gestión ambiental, ésta: a) es apropiada a la
naturaleza, magnitud e impactos ambientales de sus actividades, productos y
servicios; b) incluye un compromiso de mejora continua y prevención de la
contaminación; c) incluye un compromiso de cumplir con los requisitos legales
aplicables y con otros requisitos que la organización suscriba relacionados con sus
aspectos ambientales; d) proporciona el marco de referencia para establecer y
revisar los objetivos y las metas ambientales; e) se documenta, implementa y
mantiene; f) se comunica a todas las personas que trabajan para la organización o
en nombre de ella; y g) está a disposición del público.”
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 14
Así mismo, nuestros “Principios de Actuación” contienen la primera referencia al
compromiso ambiental de la Compañía: “Estamos comprometidos con el desarrollo
sostenible, la protección del medio ambiente y la reducción de cualquier impacto
negativo de nuestras operaciones en el entorno.” La gestión ambiental es un
conjunto de procesos y actividades que permite la creación de valor. Esta Política
se basa por tanto en tres objetivos convergentes: − Gestión de riesgos y
cumplimiento legal en materia ambiental. − Promoción de la ecología eficiente
interna. − Aprovechamiento de oportunidades de negocio, brindando servicios
integrados que promuevan la sostenibilidad ambiental.
1.2 Normatividad de Calidad
Se fundamenta en la Norma ISO 9001 de 2015, cumpliendo con la calidad de los
productos y los servicios suministrados o prestados a los clientes, para ellos se debe
mantener la planificación y el control operativo, el liderazgo y cumplir los
compromisos, adquiridos, realizar mejora constante y hacer evaluación a los
cambios realizados; el servicio que se prestará es de diseño, arquitectura y
desarrollo de bases de datos enfocados en inteligencia de negocios, con la
construcción de cubos de información. La política de calidad conlleva un
compromete con los clientes a ofrecer un producto/servicio de alta calidad que
contribuya a la efectividad del manejo y control de la información, orientada al
fortalecimiento de los resultados, generando confianza hacia los usuarios finales;
cumpliendo con la normatividad legal y vigente de las organizaciones.
1.3 Normatividad de Seguridad y Salud en el Trabajo
Con respecto a la, tiene fundamentada su concepción en la Norma ISO 45001 de
2018, con orientación para su uso, que permita a la organización proporcionar
condiciones de trabajo seguras y saludables para la prevención de los daños y del
deterioro de la salud relacionados con el trabajo y para mejorar de manera proactiva
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 15
su desempeño de la SST. Esto incluye el desarrollo e implementación de una
política de la SST y objetivos que tengan en cuenta los requisitos legales aplicables
y otros requisitos que la organización suscriba cumpliendo con los compromisos,
con la identificación, evaluación, el control y la eliminación de riesgos laborales
presentes en las actividades de la empresa.
1.4 Referentes jurídico-legales del proyecto
La Constitución Política de Colombia reconoce en su artículo 15 que todas las
personas tienen derecho a su intimidad personal y familiar y a su buen nombre, y el
Estado debe respetarlos y hacerlos respetar. Este es el derecho que tenemos todos
a controlar nuestra información personal.
La ley 1581 de 2012 que es la Ley de Protección de Datos Personales (LPDP)
garantiza una serie de derechos a las personas, titulares de los datos personales,
tales como el ser informado de cuándo y para qué se recolectan, almacenan y tratan
sus datos personales, el derecho a acceder a sus datos y, en caso de ser necesario,
el derecho a la rectificación o supresión de sus datos.
Esta misma ley estable las obligaciones que deben cumplir los responsables del
Tratamiento de los datos al momento de recolectar, almacenar, usar, circular o
suprimir datos personales.
Uno de los elementos más relevantes es comprender que en el proceso de gestión
de datos el proyecto utiliza información personal y no personal, la primera amparada
bajo las autorizaciones provistas por las IES cuando aceptan el contrato de
servicios. De ahí que sea importante resaltar las diferencias que existen entre los
datos personales y no personales.
ISO 27001 o más exactamente “ISO / IEC 27001:2013 Tecnología de la información
- Técnicas de seguridad - Requisitos de un Sistema de Gestión de Seguridad de la
Información (SGSI)” es un estándar reconocido internacionalmente, que
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 16
proporciona un modelo para la creación, implementación, operación, supervisión,
revisión, mantenimiento y mejora de un sistema de gestión de la seguridad de la
información. Como otras normas de requisitos ISO, la ISO 27001 adopta un enfoque
por procesos y sigue el modelo "planificar -hacer -verificar -actuar" (plan-do–check-
act conocido como modelo PDCA).
Su objetivo fundamental es la gestión de la confidencialidad, la integridad, y la
disponibilidad de cualquier bien que tenga valor para la organización. Es
conveniente aclarar que el sistema de gestión que se crea bajo la normativa de ISO
27001 incluye no solamente la parte informática, sino también los recursos
humanos, los recursos económicos, patentes, contratos con los clientes, imagen y
reputación de la organización, seguridad de los locales, contratos con clientes.
1.5 Marco Conceptual
La disponibilidad de la información en un sistema informático es garantizar que se
mantenga trabajando sin sufrir ninguna degradación en cuanto a accesos, debe
contar con los recursos necesarios para que los usuarios que requieran accederlas
lo puedan hacer sin interrupciones; una vez que la información ha sido extraída
desde sus orígenes, debe ser almacenada de manera segura, la integridad de la
información no se debe ver comprometida así se obtenga la información de
diferentes fuentes.
La importancia de que las organizaciones cuenten con los datos necesarios para
soportar la toma de decisiones como dicen (Duque y Tamayo, 2001), va relacionado
con la combinación de las tecnologías de almacenamiento de datos y el proceso de
información que convierte esos datos fríos en valioso recurso para la dirección
empresarial; así como nos comparte (Anaya, 2012), con el uso de las bases de
datos relacionales, las organizaciones sufrieron cambios relevantes ya que estas
pasaron a ser elementos que debían integrarse y compartirse, por lo que pasan de
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 17
ser solo esquemas de recolección de datos a esquemas de análisis de los mismos
como lo indica (Rivadera, 2010).
De acuerdo con el Ministerio de Educación la diversidad de fuentes de información
con las que el país cuenta, el acceso y la disponibilidad de los mismos no ha sido
posible la implementación de un estándar que permita realizar el correspondiente
seguimiento a los datos, es por esto que es necesario enfrentarse al diseño de un
proyecto de bodega de datos, que incluye el apoyo de diferentes técnicas de campo
tanto administrativas, de diseño e implementación de bases de datos y análisis de
información basada en estrategias metodológicas revisando los sistemas de
información y sus principales características como lo indica (Duque y Tamayo,
2001), el aspecto funcional como indica (Anaya, 2012), propone de algunas
estrategias metodológicas, la bodega de datos, como tal se da revisando los
sistemas de información y sus principales características y aunque existen muchas
metodologías nos informa (Rivadera, 2010), se imponen entre la mayoría dos
metodologías, la de Kimball y la de Inmon.
Así como nos indican (Duque y Tamayo, 2001), los datos que poblarán la bodega
de datos provienen de diferentes orígenes, por lo tanto, se requiere definir una
estructura y esquema eficiente; además, consolidar esos datos implica conocer y
manejar diferentes sistemas, diferentes motores de bases de datos y eventualmente
varios lenguajes de programación, es decir que básicamente e proyecto de diseño
se basa en un proyecto de modelado de base de datos, por lo tanto “su estrategia
de desarrollo debe girar alrededor del modelo de datos” (Anaya, 2012); hay que
resaltar el rol central de la tarea de definición de requerimientos. Los requerimientos
del negocio son el soporte inicial de las tareas subsiguientes que se enfocan en
diferentes áreas como nos lo comparte (Rivadera, 2010).
Cabe resaltar tal como indica (Anaya, 2012), que la implementación de una bodega
de datos debe estar soportada por un conjunto de herramientas informáticas de alta
productividad, con funcionalidades especializadas que permitan hacer la
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 18
correspondencia entre los datos de los sistemas operativos y los datos que
almacenaran en la bodega de datos, adicional lo ratifican (Duque y Tamayo, 2001),
al indicar que la integración de datos y metadatos de diferentes fuentes y épocas,
requieren de la limpieza, filtrado y refinación de los datos, la ausencia de valores de
atributos y la existencia de valores ilógicos o inconsistentes, hace necesaria la
definición de atributos que permitan agrupar y condensar la información en la
bodega de datos, programar la sincronización y actualización de la información de
las diferentes fuentes de datos y definir valores por defecto en los casos en que se
identifiquen inconsistencias; es por esto que la creación de un modelo dimensional
es un proceso dinámico y altamente iterativo, el proceso de diseño comienza con
un modelo dimensional de alto nivel obtenido a partir de los procesos priorizados
que relaciona (Rivadera, 2010), que son: elegir el proceso de negocio, establecer el
nivel de granularidad, elegir las dimensiones, identificar medidas y por último las
tablas de hechos.
Finalmente es necesario definir la periodicidad con la cual se va a llevar a cabo el
cargue de información a la bodega de datos, si estos se harán cíclicos o
periódicamente, esto va definido a cada situación particular, así se define si va a ser
diaria, semana, mensual o en otro periodo de tiempo; los cargues deben ser
masivos aprovechando las herramientas tecnológicas o los utilitarios de las bases
de datos o rutinas desarrolladas para esto; en el almacenamiento se deben lograr
estrategias para lograr eficiencia. En las bodegas de datos es posible manejar
diversos niveles de granularidad, a menor granularidad mayor es la cantidad de
detalle. los datos operacionales deben resumirse y acumularse para aumentar la
granularidad.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 19
2. ANÁLISIS DEL MERCADO
En el estudio de mercado se identifican los entes educativos de educación superior,
que no cuentan con una solución de inteligencias de negocios basada en
lineamientos y estándares que permitan la consulta de información, los cuales son
clientes potenciales para el servicio a ofertar. Este estudio de mercado se realiza a
partir del análisis de la oferta y de la demanda.
2.1 Análisis de la Oferta
En el mercado colombiano las universidades que cuentan con soluciones de
inteligencia de negocios que permitan la consulta y certificación de los estudios de
nivel superior para sus egresados, al público ya sean otras universidades o terceros
desde un ambiente digital es nula, lo cual representa una ventaja competitiva en
este campo por el nivel de innovación y de aplicación de los lineamientos de
estándares en la implementación y uso de la bodega de datos y blockchain, los
cuales permiten la replicación de los datos de forma distribuida y segura gracias al
cifrado que se aplica a todo el tipo de transacciones. La estructura de mercado en
el cual se desarrolla el proyecto es un OLIGOPOLIO, ya que los servicios son
ofertados por una pequeña cantidad de oferentes, exactamente cuatro en el
territorio nacional, los cuales ofertan un servicio similar, el cual consiste en
soluciones de inteligencia de negocios que resuelven indicadores específicos de
cada institución académica; sin embargo, ninguna de estas ofrece el servicio de
implementación de estándares nacionales, para consolidar los datos y la consulta a
través de tokens con tecnología blockchain que permita la calidad y veracidad de
los títulos obtenidos por cada estudiante y suministre de forma consolidada la
información, certificada por cada ente académico. El recurso humano es el bien
sustituto, ya que en cada universidad hay un área encargada específicamente de la
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 20
generación de certificaciones y la validación de la información de forma telefónica o
por correo electrónico.
Se realiza un análisis de precios de la competencia, con el fin de fijar un precio
asequible y adecuado para los clientes teniendo en cuenta los beneficios y el
diferencial que ofrece nuestra propuesta.
2.1.2 Análisis de Precios
Los precios de la competencia están establecidos como se muestra en la Tabla 1.
COMPETIDORES TOTAL AÑO
HEINSOHN BUSINESS TECHNOLOGY $ 406.837.344
CLARO $ 625.599.461
ORACLE $ 706.833.637
SAP $ 436.634.067
Tabla 1 - Precios de la Competencia
La fijación del precio está determinada por la cantidad de horas empleadas por los
ingenieros para el desarrollo del proyecto y por los costos de operación, el valor
agregado de este producto se encuentra en la optimización del tiempo, en el ahorro
del recurso humano, en el incremento de oportunidades de negocio, en la
estandarización de los datos a través de la implementación de nomenclaturas y en
la certificación de estos a través de Tokens basados en Blockchain.
2.2 Análisis de la Demanda
La demanda del servicio son las instituciones de educación superior del país. Según
los consumidores se clasifica en demanda básica por tener uso final y por estudio
del mercado es demanda por sustitución dado que una persona especializada
realiza esta misma labor, pero en un mayor tiempo.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 21
2.2.1 Segmentación del Mercado
El mercado objetivo corresponde a las universidades que en la actualidad no
cuentan con un proceso centralizado de información, quienes reportan al estado
indicadores en archivos planos, estos representan un porcentaje de participación
significativo, lo que ofrece un segmento de mercado de volumen suficiente de ventas
para generar las utilidades esperadas por la organización.
La mayoría de los clientes potenciales cuentan con un buen músculo financiero,
puesto que estos deben tener la capacidad de solventar económicamente el
desarrollo de los proyectos. Los clientes potenciales de acuerdo con la
segmentación del mercado, se encuentran identificados en la Tabla 2.
ITEM INSTITUCION EDUCACION SUPERIOR CIUDAD
1 Universidad De Los Andes Bogotá D.C.
2 Colegio De Estudios Superiores De Administracion-Cesa Bogotá D.C.
3 Universidad Nacional De Colombia Bogotá D.C.
4 Universidad Eia Medellín
5 Escuela Colombiana De Ingenieria (Julio Garavito) Bogotá D.C.
6 Pontificia Universidad Javeriana Bogotá D.C.
7 Universidad Icesi Cali
8 Universidad Externado De Colombia Bogotá D.C.
9 Universidad De Antioquia Andes
10 Universidad De Antioquia Carmen De Viboral
11 Universidad De La Sabana Chia
12 Colegio Mayor De Nuestra Señora Del Rosario Bogotá D.C.
13 Universidad Del Norte Barranquilla
14 Corporacion Universitaria Empresarial Armenia
15 Universidad Eafit Medellín
16 Universidad Pontificia Bolivariana Medellín
17 Universidad Sergio Arboleda Bogotá D.C.
18 Universidad Distrital (Francisco Jose De Caldas) Bogotá D.C.
19 Pontificia Universidad Javeriana Cali
20 Universidad Nacional De Colombia Manizales
21 Universidad De Antioquia Medellín
22 Institucion Universitaria De Envigado Envigado
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 22
23 Universidad De Nariño Pasto
24 Universidad De Medellin Medellín
25 Universidad Ces Medellín
26 Corporacion Universitaria Lasallista Caldas
27 Escuela Militar De Aviacion (Marco Fidel Suarez) Cali
28 Fundacion Universidad De Bogota (Jorge Tadeo Lozano) Bogotá D.C.
29 Universidad Catolica De Pereira Pereira
30 Universidad Autonoma De Bucaramanga-Unab Bucaramanga
31 Universidad Libre Bogotá D.C.
32 Universidad Del Cauca Popayan
33 Universidad Ean Bogotá D.C.
34 Universidad Nacional De Colombia Palmira
35 Fundacion Universitaria Konrad Lorenz Bogotá D.C.
36 Universidad Tecnologica De Bolivar Cartagena
37 Escuela Naval De Cadetes (Almirante Padilla) Cartagena
38 Fundacion Universitaria Agraria De Colombia -Uniagraria Bogotá D.C.
39 Universidad De San Buenaventura Bogotá D.C.
40 Universidad Pontificia Bolivariana Bucaramanga
41 Universidad De Antioquia Turbo
42 Universidad De Los Llanos Villavicencio
43 Universidad Del Atlantico Barranquilla
44 Universidad El Bosque Bogotá D.C.
45 Universidad De Boyaca -Uniboyaca Tunja
46 Universidad Del Valle Cali
47 Universidad De La Salle Bogotá D.C.
48 Universidad-Colegiomayordecundinamarca Bogotá D.C.
49 Universidad Pontificia Bolivariana Monteria
50 Universidad Autonoma De Occidente Cali
Tabla 2 - Tabla Segmentación de Mercado -Fuente: https://www.mineducacion.gov.co/portal/Educacion-superior/
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 23
2.1.1 Competidores
Dentro de los competidores a nivel nacional que ofrecen servicios similares se
encuentran: Heinsohn Business Technology, Claro, Oracle y SAP.
• Heinsohn Business Technology: Se encarga de Integración y estandarización
de la información en su línea de negocio de inteligencia de negocios con
indicadores y alertas de negocio en tiempo real. El enlace de la página web
es https://www.heinsohn.com.co/productos_servicios/business-intelligence/
• Claro: AMÉRICA MÓVIL es un grupo empresarial líder en
telecomunicaciones y servicios IT, ofrece soluciones de inteligencia de
negocio “extremo a extremo” incluye el desarrollo de los artefactos de
software, almacenamiento y explotación de datos. El enlace de la página web
es https://www.claro.com.co/empresas/
• ORACLE: Implementan almacenes de datos, realizan despliegues, cargan
los datos y ejecutan trabajos programados. El enlace de la página web es
https://www.oracle.com/co/database/data-warehouse.html
• SAP: Implementa soluciones de Inteligencia de Negocios, transforma los
datos en conocimiento para su aprovechamiento estratégico, con
herramientas e indicadores para medir, analizar, controlar la gestión y facilitar
la toma de decisiones. El enlace de la página web es
https://www.sap.com/latinamerica/products/bi-platform.html
2.2 Análisis de Mercado
La fijación del precio de DataSoft Analytic SAS, está determinada por la cantidad de
horas empleadas por los ingenieros para el desarrollo del proyecto y por los costos
de operación, el valor agregado de este producto se encuentra en la optimización
del tiempo, en el ahorro del recurso humano, en el incremento de oportunidades de
negocio, en la estandarización de los datos a través de la implementación de
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 24
nomenclaturas y en la certificación de estos a través de Tokens basados en
Blockchain
Imagen 1. Oferta servicio
El mercado objetivo corresponde a las universidades que en la actualidad no
cuentan con un proceso centralizado de información, quienes reportan al estado
indicadores en archivos planos, estos representan un porcentaje de participación
significativo, lo que ofrece un segmento de mercado de volumen suficiente de
ventas para generar las utilidades esperadas por la organización, esta
segmentación se realizó por ubicación geográfica, para el plan de ventas se eligió
la ciudad de Bogotá como Capital principal de arranque.
$0
$100.000.000
$200.000.000
$300.000.000
$400.000.000
$500.000.000
$600.000.000
$700.000.000
$800.000.000
HEINSOHN
BUSINESSTECHNOL
OGY
CLARO ORACLE SAP DataSoftAnalytics
S.A.S
TOTAL AÑO 406837344 625599461 706833637 436634067 375000000
Co
sto
en
Mill
on
es
TOTAL AÑO
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 25
Imagen 2. Segmentación geográfica clientes
B o g o t á D . C .
M e d e l l í n
C a l i
B a r r a n q u i l l a
B u c a r a m a n g a
C a r t a g e n a
A n d e s
A r m e n i a
C a l d a s
C a r m e n D e V i b o r a l
C h i a
E n v i g a d o
M a n i z a l e s
M o n t e r i a
P a l m i r a
P a s t o
P e r e i r a
P o p a y a n
T u n j a
T u r b o
V i l l a v i c e n c i o
186
5222
111111111111111
TOTAL DE INSTITUCIONES DE EDUCACION SUPERIOR
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 26
3. PLANIFICACIÓN DEL PROYECTO
El plan estratégico es brindar a nuestros clientes una herramienta donde puedan
disponer, manejar y consolidar la información académica de manera segura y en
tiempo real, con la posibilidad de tener esta información certificable ante las demás
partes académicas y la industria.
Por esto, nos preparamos todos los días para ofrecer soluciones tecnológicas que
permitan analizar volúmenes desbordados de datos, con alto nivel de precisión y sin
dificultad, haciendo uso de plataformas cloud (Azure) para el almacenamiento de
datos y el sistema de block-chain para tener un control efectivo ante cualquiera
vulneración de la información.
Misión
Nos comprometemos a facilitar y estimular que los colombianos puedan acceder a
las modernas tecnologías de la información, para lo cual trabajaremos en
arquitecturas de modelado de datos enfocadas a la cocreación de bases de datos
siempre disponibles, seguras y escalables, con el propósito de que las IES puedan
contar con la posibilidad de manejar y visualizar la información en cualquier
momento de manera que esta información sea certificable tanto académicamente
como a nivel organizacional.
Visión
Consolidarnos como la StartUp con mayor crecimiento a nivel nacional en cuanto a
cobertura de su plataforma y efectividad en sus procesos de certificación de
información para la educación superior. Para el ámbito internacional, mostrarnos
como la StartUp de éxito colombiano con ventas de servicio fuera de territorio
nacional en un porcentaje del 30%.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 27
Objetivos
- Explorar el comportamiento de los datos que se encuentran implementados en la
estructura colombiana de gestión en el nivel de educación superior en Colombia.
- Plantear estándares que faciliten la disponibilidad de información en el diseño de
la bodega de datos en el nivel de educación superior en Colombia.
- Proponer la solución lógica de una bodega de datos basada en estándares que
permitan la disponibilidad y la certificación de los estudios de educación superior en
Colombia, desde un único repositorio centralizado que garantice la veracidad de los
mismo.
Legal
Política Integral HSEQ
En DataSoft Analytics S.A.S, diseñamos, desarrollamos, implementamos,
integramos, y brindamos soporte sobre nuestra plataforma. Nos interesa mantener
relaciones de largo plazo con nuestros clientes, proveedores y demás grupos de
interés, a través del cumplimiento de los requisitos aplicables, la mejora continua en
nuestros sistemas de gestión de calidad, un equipo de trabajo competente y un
servicio de calidad, nos comprometemos a, Mejorar continuamente el desempeño
del sistema integrado de gestión HSEQ, Capacitar, formar y mejorar las
competencias de sus colaboradores, Prevenir y disminuir los impactos ambientales
generados por su actividad, Prevenir y disminuir los accidentes, enfermedades
profesionales y daños a la propiedad que se puedan generar a los colaboradores,
contratistas, clientes y comunidad en general, Cumplir con los aspectos legales,
vigentes y aplicables, estipulados por la legislación Colombiana o en los países
donde preste sus servicios, Cumplir con los criterios internos de desempeño, los
requisitos contractuales, y la satisfacción de las necesidades del cliente.
Política de Calidad
La StartUp se dedica a la aplicación de tecnologías Bussines Intelligent, BigData y
BlockChain para centralizar la información de estudiante en cuanto a su historia
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 28
académica, permitiendo la visualización de las mismas en un aplicativo web,
haciendo uso de plataformas tecnológicas como son DWH, Servidores y
procesadores de Data de la suit Azure. Se va a dar servicio de diseño, arquitectura
y desarrollo de bases de datos, y aplicativos webs enfocados disponibilidad y
certificación de notas, e integrando esta plataforma en los diversos IES a nivel
nacional. Se darán los servicios bajo el perfil de “Software as a service”, de tal
manera de tendrá un producto inicial y luego se tendrá una renta por el uso de la
misma. Se compromete con los clientes a ofrecer un producto/servicio de alta calidad
que contribuya a la efectividad del manejo y control de la información, orientada al
fortalecimiento de los resultados, generando confianza hacia los usuarios finales;
cumpliendo con la normatividad legal y vigente de las organizaciones.
Política Ambiental
Los principios de política ambiental: “Estamos comprometidos con el desarrollo
sostenible, la protección del medio ambiente y la reducción de cualquier impacto
negativo de nuestras operaciones en el entorno, relacionados con las diferentes
actividades y/o procesos que influyen en aspectos ambientales, apoyados en el
marco legal de la norma iso 14001, tales como consumo de energía por centros de
cómputo, por servidores, uso de agua para la parte administrativa y consumo, así
mismo como vertimientos de aguas residuales, de esta manera hacer un análisis en
pro del uso efectivo de los recursos. La Política Ambiental tiene un doble propósito;
minimizar el impacto sobre el medio ambiente de su actividad y maximizar la
capacidad de la tecnología para crear nuevas oportunidades para el desarrollo
sostenible. Las Tecnologías de la Información y las Comunicaciones (TIC) permiten
a la sociedad ser más ecológicamente más eficientes en el uso de recursos naturales
y pueden jugar un papel relevante en la solución de muchas de las problemáticas
ambientales actuales.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 29
Valor Agregado
Maneja la información de tu Institución de Educación Superior - IES sin bloqueos o
restricciones, teniendo siempre la disponibilidad de la información desde cualquier
punto de trabajo, reduciendo riesgos y vulnerabilidades del sistema, encapsulando
todo en la seguridad y veracidad de la información para ofrecer a sus usuarios un
programa certificado.
4. INGENIERÍA DEL PROYECTO
El estudio técnico del proyecto está dividido en dos aspectos, el estudio técnico de
la bodega de datos y el estudio técnico de Block Chain, a continuación, se describen
los dos estudios.:
4.1 Estudio Técnico
En este estudio se evalúan los aspectos tecnológicos y técnicos que son requeridos
para el desarrollo del proyecto, tiene como propósito fundamental mantener de forma
centralizada y unificada la información correspondiente a los diferentes estudios
realizados por una persona. En este, se definen las características del modelo a
desarrollar que garantice la disponibilidad de la información, las fases de análisis,
diseño, desarrollo e implementación del servicio, las herramientas de trabajo
disponibles; esto con el fin de determinar las actividades y tiempos dentro del
proyecto, los cuales impactan directamente el costo de este proyecto.
La necesidad básica de disponibilidad de información, ha tomado fuerza en la
actualidad en las organizaciones, esta se ha dado en medida a la cantidad de datos
que se manejan transaccionalmente, ya que contar con la información de forma
oportuna y precisa, permite generar conocimiento; es por esto, que ha cambiado el
uso de los datos para contar con un autoservicio de información; donde los
consumidores de la información cuenten con reportes, visualizaciones e indicadores
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 30
que les permitan optimizar la toma de decisiones, por esto en el diseño de bodega
de datos para el área educativa se identificó que la implementación de
estándares, facilitan el cargue de los datos en el DataWareHouse en todos los
niveles académicos y el consumo de los mismos en las diferentes herramientas de
visualización.
Estos estándares se pueden implementar en toda la arquitectura de la
solución, desde el modelo conceptual, la identificación de las fuentes operacionales,
el modelo de extracción transformación y carga (ETL), en el DataWareHouse en su
ambiente operacional, en los modelos analíticos a implementar y en general en la
solución de inteligencia de negocios integrada con Blockchain; para el caso actual,
los estándares se implementarán en el diseño lógico de la bodega de datos para la
educación en Colombia.
Los estándares a implementar requieren de un vocabulario en común, el cual
debe estar documentado y disponible para ser utilizado por las partes interesadas,
lo cual permite comunicar los datos con confianza en su precisión y utilidad; Este
vocabulario en común es el que evita la confusión en el uso de los datos en la bodega
de datos, incluye definiciones estándar, conjuntos de opciones y especificaciones
técnicas para agilizar el intercambio y la comparación para un conjunto clave de
elementos de datos educativos; así se logran datos precisos, oportunos y
consistentes para informar la toma de decisiones y reducción de la carga de
personal asociada con el descifrado de datos.
En la definición de estándares se tendrán en cuenta las siguientes características,
tal como indica (Turban,2009):
1. Nombres de los elementos que componen la bodega de datos.
2. Valores por defecto para los campos.
3. Tipos y capacidad de los datos.
4. Códigos para la identificación de las entidades académicas.
5. Nombres estándar para las dimensiones y tablas de hechos.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 31
El consumo o explotación de los datos desde la bodega de datos, se facilita contando
con los estándares para implementar, ya que cada entidad educativa puede usar
la información sin necesidad de un intérprete de tablas propio de cada base de datos
origen, de no desarrollarse el proyecto, se continuaran presentando los
inconvenientes tales como el acceso directo a la base de datos transaccionales para
generar los diferentes archivos con los cuales se reporta al Ministerio de Educación,
lo cual ocasiona que la base de datos se comporte con lentitud y que la base de
datos se degrade, que el resultado presentado no sea confiable ya que puede ser
manipulable antes de que sea suministrado en los diferentes documentos por lo tanto
no sean confiables, que la revisión de un grupo grande de datos aumente la inversión
en tiempo y en recursos y que no se cuente con el histórico de los informes.
La implementación de los estándares en el DataWareHouse contribuirá con la
disminución de datos erróneos, obsoletos o incompletos, logrando efectivizar la
consulta de los datos disponibles ofreciendo eficiente y oportunamente la
información de forma homogénea y fiable, permitiendo la consulta y tratamiento
jerarquizado de la misma, concediendo a las partes interesadas acceso para crear
sus propios reportes, sin la participación de personal técnico, mejorando
notablemente la integridad de los datos y los tiempos de entrega.
4.2 Definición del Producto
El proyecto está encaminado a la elaboración de un servicio orientado hacia los
entes de educación superior y a las empresas, que garantice la certificación de los
estudios realizados por una persona evitando la falta de veracidad de los estudios
de educación superior realizados. Se evalúa la infraestructura tecnológica y la
capacidad de los recursos incluidos para ejecutar el alcance del proyecto. Las
tecnologías necesarias para la implementación del proyecto expuesto serían por un
lado una base de datos transaccional, una base de datos analítica y la incorporación
de Block Chain.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 32
Para la implementación del modelo se requiere de máquinas virtuales en la nube,
motores de bases de datos SQL, IP´s de acceso, Data Warehouse, sistema de
presentación de datos – Power BI, sistema de integración de desarrollo con
Integracion continua y entrega continua, sistema de cada de datos segura
(BlockChain) y soporte del uso de la plataforma. En la siguiente tabla se da un
detallado del listado con un estimado por Microsoft.
Microsoft Azure Estimate
Service type Description Estimated Cost
Virtual Machines
1 F8s v2 (8 vCPU; 16 GB de RAM); Windows – SQL Server; 3 años de reserva; 4 discos de sistema operativo administrados: S10, 15.000 unidades de transacción
$ 3,660.69
Azure SQL Database
Base de datos única, modelo de compra Núcleo virtual, nivel Uso general Tier, Gen 4, 1, instancias 8 vCore, 3 año de reserva, 32 GB de almacenamiento, 16 GB de almacenamiento de copia de seguridad
$ 1,354.62
IP Addresses 0 direcciones IP dinámicas, 5 direcciones IP estáticas, 0 reasignaciones
$ -
SQL Data Warehouse Nivel: Optimizado para Compute Gen1, proceso: DWU 200 x 1 Months, almacenamiento: 1 TB
$ 3,765.79
Power BI Embedded
1 nodos x 1 Months, tipo de nodo: A3, 4 nodos virtuales, 10 GB de RAM, 601-1200 pico de representaciones por hora
$ 2,937.67
Azure DevOps
Usuarios: 5 usuarios de Azure DevOps, 8 partes interesadas, 8 suscriptores de Visual Studio. Extensiones: 0 usuarios de Test Plans, 5 usuarios de Artifacts. Servicios adicionales: 0 canalizaciones hospedadas de Microsoft + 0 canalizaciones autohospedadas, 10 VUM
$ -
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 33
Azure Blockchain Service
Basic tier, 2 Member(s) X 2 Nodes per member X 1 Months, 10 GB Storage
$ 2,679.00
Support Support $ -
Totales Licensing Program MOSP
Monthly Total $ 14,175.00
Annual Total U$ $ 170,100.00
Total, Anual COP $ 544,320,000.00
Tabla 3. Requerimientos operativos del Cloud
4.3 Base de datos OLTP
En el mercado existen múltiples fabricantes, en lo que respecta a bases de datos,
aunque se destaca Microsoft y Oracle por ser los más extendidos, aunque también
se podría optar por una base de datos de enfoque de alto rendimiento como podrían
ser HANA o por una solución de código abierto como MySQL. El diseño y la creación
de la base de datos se centra en el modelo de datos y la estructura de tablas
necesaria incluyendo la implementación física de las mismas, así como su carga de
datos.
4.4 Base de datos OLAP
Los cubos OLAP son estructuras multidimensionales (cubos) que permiten analizar
bases de datos relacionales de gran volumen y variedad con una gran agilidad y
rapidez, reduciendo enormemente el tiempo y los recursos empleados en el análisis,
por la mejora de la rapidez en el almacenamiento de datos y la optimización del
rendimiento de la memoria caché.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 34
4.5 BlockChain
La cadena de bloques es un sistema transparente que se puede comprobar que
cambiará la forma de pensar de la gente respecto al intercambio de valor y activos,
el cumplimiento de los contratos y el uso compartido de datos. La tecnología consiste
en un libro de contabilidad seguro y compartido de las transacciones distribuidas
entre una red de PC, en lugar de tenerlas un solo proveedor. Las empresas están
utilizando la cadena de bloques como una capa de datos común para habilitar una
nueva clase de aplicaciones. Ahora los procesos y los datos empresariales se
pueden compartir entre varias organizaciones, lo que elimina el desperdicio, reduce
el riesgo de fraude y crea nuevas fuentes de ingresos. El sistema BlockChain se
implementará dentro del proyecto en la creación de token para las solicitudes de
certificación de estudios en las universidades embebidas en nuestra
plataforma/servicio. Este token tendrá un cobro por paquetes tanto dirigido a
entornos educativos como a entornos corporativos.
Imagen 3. Macromodelo BlockChain
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 35
4.6 Bodega de Datos
El diseño del DataWareHouse es un repositorio completo de datos, donde se
integran y almacenan datos estratégicos, tácticos y operativos con el objeto de
que los usuarios puedan consultar la información que es de gran utilidad, bajo un
esquema unificado en un único sitio. Permite aislar las consultas transaccionales
(OLTP) de las que soportan la toma de decisiones (OLAP), esta bodega es orientada
a un tema particular con integridad de los datos, incluyendo datos históricos.
4.6.1 Características de un Bodega de Datos.
Una característica fundamental de una bodega de datos como nos comparte
(Ponniah, 2010), es que incluye datos históricos, lo cual permite hacer análisis de
tendencias, contiene una vista integrada de los datos removiendo las inconsistencias
dejándolos unificados limpios y estandarizados, en la bodega de datos los datos se
guardan en un formato de solo lectura, se realiza un refresco periódico y se mantiene
registro de los cambios. El nivel de detalle de los datos hace referencia a la
granularidad de la bodega de datos, cuenta con calidad de datos, provee
capacidades para la inteligencia de negocios.
4.6.1.2. Metodologías de Diseño de una Bodega de Datos.
En la actualidad existen dos grandes expositores de las metodologías con las cuales
se puede diseñar una bodega de datos, estos son Bill Inmon y Ralph Kimball.
4.6.1.2.1 Metodología “Top-Down”.
El proponente de esta metodología (Inmon, 1992), sugiere que una bodega es un
repositorio centralizado para toda la empresa, donde los datos son almacenados en
el más bajo nivel de granularidad, basado en un modelo de datos normalizados. La
bodega de datos central podría alimentar almacenes de datos dependientes
basados en un modelo de datos dimensional.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 36
Las ventajas de este modelo son la vista empresarial de los datos, almacén
centralizado de datos y control y reglas centralizadas. Las desventajas de esta
metodología es que toma mucho tiempo en su construcción, es altamente expuesta
a fallos, se requiere conocimiento integral del negocio, la inversión es muy alta y la
prueba de concepto es muy compleja.
4.6.1.2.2 Metodología “Bottom Up”.
(Kimball, 1996), sugiere una bodega de datos corporativa como una colección conformada
por almacenes de datos, se diseña la bodega para un área de negocio especifico, este
almacén tiene un rol estratégico y será la columna vertebral de la bodega de datos, se diseña
un segundo almacén y se integra a la bodega y así sucesivamente. Este principio tiene un
alcance departamental en donde se guarda solo datos relevantes de un área o unidad de
negocio. Los almacenes contienen datos en el más bajo nivel granularidad y agregados
dependiendo de las necesidades de análisis. Las ventajas con las que cuenta esta
metodología son: Implementación rápida y de piezas mejorables, tiene un favorable retorno
de la inversión y prueba de concepto, tiene un menor riesgo de fallos y es inherentemente
incremental; las desventajas de esta propuesta es que cada almacén contiene su propia
vista de datos, podría resultar en redundancia de datos, perpetuidad de inconsistencias e
irreconciliables en los datos y proliferación de interfaces poco manejables, pero la solución
a estas desventajas ya evidenciadas es el diseño de las dimensiones a través de los
diferentes almacenes de datos.
4.6.1.3 Arquitectura Lógica de una Bodega de Datos.
Existen varias arquitecturas de bodegas de datos que pueden ser implementadas,
basadas en datamarts y bodega de datos con datamarts.
4.6.1.3.1 Arquitectura Centralizada.
Aborda requerimientos a nivel empresarial, cuenta con un origen de datos, un área
de trabajo, un almacén de datos y un destino de consulta.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 37
4.6.1.3.2. Arquitectura Federada.
Es una aproximación de integración de los datos sin una bodega de datos de datos
global, la aproximación de la bodega se realiza con consultas directamente al área
de almacenamiento
4.6.1.3.3. Arquitectura Almacenes de datos independientes.
Se cuentan con almacenes de datos independientes y no proveen una vista unificada
de los datos, cuenta con un origen de datos, un área de trabajo, varios almacenes
de datos y un destino de consulta.
4.6.1.3.4. Arquitectura Hub and Spoke
Es una arquitectura centralizada similar a la propuesta por Inmon, con la presencia
de almacenes de datos dependientes de la bodega, tal como nos comparte
(Marakas, 2005), la bodega se encuentra normalizada mientras los almacenes de
datos podrían configurarse con modelos normalizados, desnormalizados,
dimensionales, agregados dependiendo de requerimientos individuales.
4.6.1.3.5 Arquitectura Datamarts Bus
Es una arquitectura como la propuesta por Kimball, donde la bodega de datos está
compuesta por almacenes de datos, los almacenes de datos siguen el modelo
dimensional, por lo que se abordan requerimientos para cada área de negocio con
dimensiones reutilizables.
4.6.1.4 Componentes de una Bodega de Datos.
La bodega de datos está compuesta por las fuentes u orígenes de datos, (Ponniah,
2010), nos comparte que el área de trabajo de los datos en la cual se ejecutan las
acciones de extracción transformación y carga y donde se pueden ejecutar tareas
de limpieza de datos, cambios, combinaciones, conversiones y des duplicación de
registros, el área de almacenamiento el cual puede ser un sistema de gestión de
base de datos multidimensional (MDDBMS) o un Sistema de gestión de bases de
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 38
datos relacionales (RDBMS), el área de entrega de información, la metadata
operacional o de negocio o del proceso de ETL y el componente de manejo y
control.
4.7 Arquitectura Funcional
A manera funcional se tiene contemplado que en la ejecución del proyecto se
realicen las actividades de migración de información académica del cliente a la
arquitectura propuesta por el proyecto, una etapa de preparación de procesamiento
que involucra tareas de limpieza y normalización de la información no estructurada;
posteriormente la descentralización de la información para agregarla al sistema
blockchain. Las solicitudes de los usuarios se realizarán a la plataforma generando
un token de consulta, en cuanto a la actualización de data se realizará por parte de
contratos inteligentes para que este valide y permita la certificación de la
información.
Imagen 4. Modelo Migración Data, Fuente www.microsoft.com
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 39
Imagen 5. Modelo solicitud de Certificación por Token, Fuente www.microsoft.com
4.8 Arquitectura Técnica
La arquitectura técnica requerida para el desarrollo de la solución del proyecto se
refiere a componentes de inteligencia de negocios, nuestro proveedor de la
plataforma tecnológica es Microsoft, ya que con SQL Server Data Tools contamos
con una herramienta de desarrollo moderna para crear bases de datos relacionales
de SQL Server, bases de datos SQL de Azure, modelos de datos de Analysis
Services (AS), paquetes de Integration Services (IS) e informes de Reporting
Services (RS). Con SSDT, se realizará la implementación de tres bases de datos
con SQL Server, una con funcionalidad de área de trabajo, otra base de datos
utilizada como auditoria y otra base de datos que será repositorio de la bodega de
datos; el diseño e implementación del proceso de ETL a través de SSIS se utilizará
para realizar la extracción de los orígenes de datos desde cada IES, la
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 40
correspondiente transformación de los datos, con la calidad de datos requerida y el
cargue al repositorio de bodega de datos.
Con SSAS se realizará la implementación del modelado de datos multidimensional,
el cual contará con las diferentes dimensiones que satisfagan la necesidad de
información requerida para ser reportada a través de Blockchain. Toda la solución
propuesta será implementada en Azure como IAAS, esto garantiza la disponibilidad
de la solución y la integración de sus diferentes componentes ya que los recursos
informáticos son altamente escalables y automatizados. La oferta al cliente está
resuelta por SAAS ya que el software como servicio utiliza Internet para entregar
aplicaciones que están bajo nuestra administración. Esta solución de certificación y
consulta se ejecutan directamente a través del navegador web y no requieren
descargas ni instalaciones en el lado del cliente.
4.9 Beneficios del Servicio
Disponer de un sistema de bodega de datos, que permita la disponibilidad, acceso
y seguridad de la información, facilitando las labores de análisis y gestión de esta,
logrando certificar los estudios realizados por los alumnos, permitiendo así mejorar
los procesos de selección en el ámbito laboral y de admisión en el ámbito académico.
El plan de negocios tiene dos frenes, uno es el diseño y la implementación de la
arquitectura de bodega de datos para la Institución de Educación Superior (IES),
subiendo la arquitectura a la nube para la integración con el servicio de blockchain;
el segundo es la creación de un sistema de tokens, con la cual los clientes podrán
solicitar la certificación de estudios de los candidatos.
4.10 Definición del Proceso del Proyecto
En el desarrollo del proyecto se establece el proceso requerido para llevar a cabo la
bodega de datos basada en estándares, que permitan la disponibilidad y la
certificación de información, lo que incluye el plan de actividades, la capacidad de
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 41
personal necesaria para ejecutarlo, el detalle técnico de los modelos y las
tecnologías existentes que permiten la implementación.
Servicio
Caracteristicas del Servicio
Nombre del
Servicio
Sistema de Bodega de datos
Basada En Estándares, Que
Permitan La Disponibilidad
Y La Certificación De
Información En La
Educación Superior En
Colombia.
Linea de
Producción DatawareHouse/Blockchain
Versiones
Anteriores 0
Version
Actual 1
Modulo
Sistema de datos de calidad, con disponibilidad y seguridad al acceso de la
información, permitiendo la certificación de la educación profesional en
Colombia
Descripción del Servicio
Descripción
General
El servicio permite a las clientes tener una mejor gestión de su base de datos
de graduados, logrando tener información con mayor calidad, granularidad,
acceso y seguridad. Además el usuario de la plataforma podrá solicitar de
manera ágil la certificación de la información de nuevos colaboradores y/o
nuevos estudiantes mediante el uso de tokens; de esta manera se tiene un
excelente control en cuanto a posibles fraudes de la educación.
Objetivo
Modelar una bodega de datos, basada en estándares que permitan la
disponibilidad y certificación de información en la Educación Superior en
Colombia.
Explorar el comportamiento de los datos que se encuentran implementados
en la estructura colombiana de gestión en el nivel de educación superior en
Colombia.
Proponer estándares en el diseño, que faciliten la disponibilidad de
información en el diseño de la bodega de datos en el nivel de educación
superior en Colombia.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 42
Diseño lógico de una bodega de datos basada en estándares que permitan
la disponibilidad y la certificación de los estudios de educación superior en
Colombia, desde un único repositorio centralizado que garantice la
veracidad de los mismo.
Arquitectura
Descripción
El proyecto está enfocado a la elaboración de un servicio SaaS haciendo
uso de una plataforma de tecnología en la nube, dándole un valor agregado
en cuanto su uso y funcionalidad, creando una arquitectura de trabajo
tecnológico encaminado hacia el DataWareHouse y el blockchain;
entregando de esta manera a las Instituciones de Educación Superior en
Colombia una plataforma de fácil uso, con una alta calidad en sus datos, y
con la ventaja de realizar la certificación de la información a sus alumnos
graduados.
Requerimientos del Servicio
Virtual
Machines
1 F8s v2 (8 vCPU; 16 GB de RAM); Windows – SQL Server; 3 años de
reserva; 4 discos de sistema operativo administrados: S10, 15.000 unidades
de transacción
Azure SQL
Database
Base de datos única, modelo de compra Núcleo virtual, nivel Uso general
Tier, Gen 4, 1, instancias 8 vCore, 3 año de reserva, 32 GB de
almacenamiento, 16 GB de almacenamiento de copia de seguridad
IP Addresses 5 direcciones IP estáticas
SQL Data
Warehouse
Nivel: Optimizado para Compute Gen1, proceso: DWU 200 x 1 Months,
almacenamiento: 1 TB
Power BI
Embedded
1 nodos x 1 Months, tipo de nodo: A3, 4 nodos virtuales, 10 GB de RAM,
601-1200 pico de representaciones por hora
Azure DevOps
Usuarios: 5 usuarios de Azure DevOps, 8 partes interesadas, 8 suscriptores
de Visual Studio. Extensiones: 0 usuarios de Test Plans, 5 usuarios de
Artifacts. Servicios adicionales: 0 canalizaciones hospedadas de Microsoft +
0 canalizaciones autohospedadas, 10 VUM
Azure
Blockchain
Service
Basic tier, 2 Member(s) X 2 Nodes per member X 1 Months, 10 GB Storage
Tabla 4. Ficha técnica del Servicio
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 43
4.11 Plan de Ventas
El mercado total (TAM) equivale a 50 universidades, las cuales están registradas, el
mercado al que le podemos servir (SAM) es de 18 universidades inicialmente que equivale
al 36% que están ubicadas en Bogotá, y el mercado que podemos conseguir (SOM) para el
primer año corresponde al 12% de estas, es decir, 2 Universidades
PV Primer Año
Mes # Universidades Etapa
1 0 Construcción
2 0 Construcción
3 0 Construcción
4 0 Construcción
5 0 Construcción
6 0 Construcción
7 0 Comercialización
8 1 Comercialización
9 0 Comercialización
10 0 Comercialización
11 1 Comercialización
12 0 Comercialización
Total 2 Tabla 5. Plan de Ventas
Las ventas de los cinco años siguientes se muestran en la siguiente tabla, se asume un
comportamiento lineal aumentando una universidad por año.
PV Cinco Años
Año #
Universidades Etapa
1 2 Construcción/Comercialización
2 3 Comercialización
3 4 Comercialización
4 5 Comercialización
5 6 Comercialización Tabla 6. Ventas proyectadas a 5 años
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 44
4.12 Análisis de Capacidad
Para desarrollar una estimación de los recursos del proyecto se van a requerir para
cumplir con el plan de ventas se realiza un análisis de capacidad de funciones para
cada uno de los cargos
Para la fase de desarrollo de la plataforma se proyecta la necesidad de 2 ingenieros
de desarrollo que diseñen y construyan la plataforma, así mismo se evalúa la
necesidad de un profesional UX que cree y desarrolle una experiencia de usuario
intuitiva. Adicionalmente se requiere del administrador quien se encargará de
adelantar los trámites administrativos de la empresa, como también crear e
implementar un plan de ventas; El periodo de desarrollo constará de 6 meses. El
personal necesario para el desarrollo se muestra en la siguiente tabla:
Rol Número
Ingeniero Desarrollo 2
Profesional UX 1
Administrador 1
Tabla 7. Etapa diseño y desarrollo
En la siguiente fase, de comercialización se proyectan las actividades de
comercialización, acercamiento al cliente y publicidad, para ello se plantean los
siguientes análisis de capacidad estimando los siguientes supuestos y condiciones
de operación:
• Tasa de ocupación del personal en promedio del 70%
• Al ingreso del cliente a nuestra plataforma, se deberá migrar, configurar e
implementar su modelo de base de datos a la arquitectura del servicio y
además integrar la data al sistema de BlockChain, se tendrá un tiempo
estimado de 10 días laborales
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 45
• Creación del perfil y los usuarios del cliente para el acceso, manejo y consulta
de la plataforma, con un tiempo estimado de 1 día laboral.
• La evolución de la plataforma y la actualización en servicios, tiempos y
procedimientos, se realizarán todos los meses para lo cual se tiene destinado
un desarrollador que destinara la mitad de su carga laboral en ello, para un
total de 10 días laborales.
• El soporte técnico se estima que al inicio el cliente tenga un 90% de
probabilidad en la solicitud de algún requerimiento y se tomen 60 minutos en
la atención.
• Los clientes llegaran por medio de solicitud en página web y publicidad en
redes, para lo cual se tendrá un comercial el cual tomara sus requerimientos
y ofrezca la propuesta al cliente, se estima una probabilidad de venta del 30%
al inicio del proyecto. Para lo cual el proceso del comercial con cada posible
cliente puede ser de 60 minutos; más sin embargo si el cliente ve la necesidad
de una visita física (primeramente, a nivel Bogotá), esto podrá tomar un total
de 4 horas.
• Las ventas telefónicas – en frio, tendrán tres fases, primero contacto con el
cliente y creación de la necesidad con un tiempo de 10 minutos, segundo,
muestra de plataforma y sus características 15 minutos, por último, el paso
del cliente a la persona comercial (Ítem anterior). En este proceso se puede
tener un porcentaje de captura del cliente de un 40%
• El área de publicidad y mercadeo destinara su total carga laboral al
posicionamiento de la marca en canales electrónicos y redes sociales.
Rol Supuestos Valor Unidad
Developer Engineer Implementacion de Cliente 60 Horas
Developer Engineer Evolución Plataforma 40 Horas
Developer Engineer Devops Plataforma 20 Horas
Support Profesional Atención Cliente 120 Horas
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 46
Support Profesional Devops Plataforma Horas
Bussiness Development Venta Remota 120 Horas
Bussiness Development Venta Presencial Horas
Bussiness Development Porpuesta y Contrato Comercial Horas
Sales Representative Busqueda y Primer Contacto con
Clientes 120 Horas
Marketing Publicidad 120 Horas
Admin Pagos nomina, impuestos, etc 120 Horas
Tabla 8 . Capacidad comercialización e implementación
Evaluando el plan de desarrollo, despliegue y comercialización propuesto
anteriormente y teniendo presente la cantidad de horas y el porcentaje de ocupación
se obtiene el personal necesario para el proyecto. Para la fase de desarrollo se
proyectan dos ingenieros de desarrollo, un profesional UX, y el administrador,
Posterior a tener el producto madurado se pasa a la etapa de comercialización donde
se entrará a trabajar con dos ingenieros de desarrollo, un profesional de soporte, un
profesional de ventas, un profesional de manejo comercial de clientes, un
administrador de startup y un profesional de mercadeo.
5 ESTUDIO ADMINISTRATIVO
Para garantizar la correcta ejecución del proyecto se realiza el análisis de los
requerimientos administrativos, se involucra la evaluación y análisis del personal
idóneo para el cumplimiento de las funciones según la estructura de trabajo y la
definición del plan estratégico de la organización.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 47
5.1 Estructura Organizacional
La estructura organizacional de la compañía se define en ingeniería, soporte y,
mercadeo y publicidad.
En el área de ingeniería se incluyen dos recursos un CEO y un CTO, encargados
también de partes administrativa, el área como tal es la encargada de desarrollar
las correspondientes ETL’s y de programar el sistema para la generación
automática de los informes a través de tokens, desde los diferentes orígenes de
datos de cada uno de los entes educativos de educación superior.
El área de soporte es el encargado de garantizar el correcto funcionamiento del
servicio, solucionando las dudas de los clientes y las incidencias técnicas.
El área mercadeo y publicidad es clave para las ventas, en esta incluimos el recurso
de mercadeo y publicidad quien garantiza las relaciones públicas, investigaciones
de mercado, boletines, redes sociales, satisfacción al cliente y estrategias para
abordar el mercado.
Imagen 6. Organigrama estructural
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 48
6 ESTUDIO ECONÓMICO - FINANCIERO
En la siguiente sección se presenta el análisis de costos de todos los elementos necesarios
para la realización del proyecto, incluyendo el recurso humano, los elementos tecnológicos,
los arriendos, servicios, y la compra de elementos de trabajo. Se hace un análisis de flujo
de caja del proyecto a 5 años, y se realiza un análisis de sensibilidad de los costos e
ingresos a partir de la variación del precio del producto.
6.1 Costos Operativos y Administrativos
Con respecto a los costos de nómina, se considera la cantidad de personas establecidas
en la sección de análisis de capacidad, indicando 7 personas para el primer año
completando un total de 9 en el año 5. Se establecen contratos a término indefinido con
todas las prestaciones de ley. Se considera un incremento anual de los sueldos del 5%, en
la tabla 9 se muestran los cargos y salarios.
Rol Salario Mes Meses Total Año Personas Total Año Personas
Ingeniero de Desarrollo $ 3,000,000.00 12 $ 36,000,000.00 2 $ 72,000,000.00
Soporte Técnico $ 1,700,000.00 10 $ 17,000,000.00 1 $ 17,000,000.00
CTO $ 5,000,000.00 12 $ 60,000,000.00 1 $ 60,000,000.00
CEO $ 6,000,000.00 12 $ 72,000,000.00 1 $ 72,000,000.00
Mercadeo $ 2,000,000.00 10 $ 20,000,000.00 1 $ 20,000,000.00
Auxiliar Administrativo $ 1,200,000.00 10 $ 12,000,000.00 1 $ 12,000,000.00
Total Año $ 253,000,000.00
Tabla 9. Gastos Nomina x año
En la tabla 10 se muestra un resumen de todos los costos anualmente, al igual que la
anterior se tiene un incremento anual del 5% de acuerdo con el IPC colombiano.
Año
0 1 2 3 4 5
Costos Nomina $ 0.00 253,000,000.00 265,650,000.00 278,932,500.00 292,879,125.00 307,523,081.25
Plataforma Azure $ 0.00 544,320,000.00 571,536,000.00 600,112,800.00 630,118,440.00 661,624,362.00
Publicidad $ 0.00 5,000,000.00 5,250,000.00 5,512,500.00 5,788,125.00 6,077,531.25
Arriendo Oficina $ 0.00 58,320,000.00 61,236,000.00 64,297,800.00 67,512,690.00 70,888,324.50
Total: $ 0.00 866,320,000.00 909,636,000.00 955,117,800.00 1,002,873,690.00 1,053,017,374.50
Tabla 10. Gastos nomina proyectados a 5 años
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 49
6.2 Ingresos Proyectados
Se determina un precio de la subscripción anual bajo el modelo IAAS de $3750.000.000, y
una tasa de renovación del 90% de los clientes, esto quiere decir que el 10% de los clientes
se desafilian del servicio en cada periodo, por ende se toma la tasa de crecimiento anual
del 20% para el servicio de alquiler/suscripción de la plataforma. Por el lado de solicitud de
tokens para certificación, se proyecta que después de la suscripción de una IES a la
plataforma se tendrán ingresos sobre los $30,000,000.00 para el primer año con un
incremento porcentual del 40%.
Para realizar el análisis del flujo de caja, se debe tener en cuenta el capital inicial
presupuestado en $135.000.000.00, valor con el que se pondrá a operar la empresa en sus
etapas iniciales. Se divide esta inversión en entre los socios y un préstamo, tomando así
una Inversión inicial de $65.000.000.00 y el restante de préstamo.
Se utiliza una tasa de interés bancaria del 20% EA, tomando un crédito de libre inversión,
se considera también unos impuestos del 35% sobre las utilidades.
Flujo de Caja – Con Préstamo
AÑOS: 0 1 2 3 4 5
Ingresos x Ventas Plataforma $ 750,000,000.00 $ 900,000,000.00 $ 1,080,000,000.00 $ 1,296,000,000.00 $ 1,555,200,000.00
Ingresos x Ventas - Token $ 30,000,000.00 $ 42,000,000.00 $ 58,800,000.00 $ 82,320,000.00 $ 115,248,000.00
Préstamo $ 70,000,000.00
Egresos $ 875,640,000.00 $ 928,536,000.00 $ 974,962,800.00 $ 1,023,710,940.00 $ 1,074,896,487.00
Costos Nomina $ 253,000,000.00 $ 265,650,000.00 $ 278,932,500.00 $ 292,879,125.00 $ 307,523,081.25
Plataforma Azure $ 544,320,000.00 $ 571,536,000.00 $ 600,112,800.00 $ 630,118,440.00 $ 661,624,362.00
Publicidad $ 5,000,000.00 $ 5,250,000.00 $ 5,512,500.00 $ 5,788,125.00 $ 6,077,531.25
Arriendo Oficina $ 58,320,000.00 $ 61,236,000.00 $ 64,297,800.00 $ 67,512,690.00 $ 70,888,324.50
Equipos de Computo $ 15,000,000.00 $ 15,750,000.00 $ 16,537,500.00 $ 17,364,375.00 $ 18,232,593.75
Depreciación
Intereses $ 9,800,000.00 $ 8,317,421.24 $ 6,627,281.46 $ 4,700,522.11 $ 2,504,016.45
Flujo de Caja Antes de Impuestos -$ 105,440,000.00 $ 5,146,578.76 $ 157,209,918.54 $ 349,908,537.89 $ 593,047,496.55
Impuestos $ 0.00 $ 1,801,302.56 $ 55,023,471.49 $ 122,467,988.26 $ 207,566,623.79
Flujo de Caja Después de Impuestos -$ 105,440,000.00 $ 3,345,276.19 $ 102,186,447.05 $ 227,440,549.63 $ 385,480,872.76
Depreciación
Amortización $ 10,589,848.25 $ 12,072,427.01 $ 13,762,566.79 $ 15,689,326.14 $ 17,885,831.80
Inversión Inicial $ 80,000,000.00
Recuperación del Capital de Trabajo $ 20,000,000.00
Valor de Salvamento $ 5,300,000.00
Flujo de Caja Neto $ 10,000,000.00 -$ 116,029,848.25 -$ 8,727,150.82 $ 88,423,880.26 $ 211,751,223.48 $ 392,895,040.95
Valor Presente Neto $ 306,804,636.92
TIO (EA) 14%
TIR 83.17%
Tabla 11. Flujo de Caja con préstamo y amortización.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La Certificación de Información en la
Educación Superior en Colombia
Página | 2
Flujo de Caja – Sin Préstamo
AÑOS: 0 1 2 3 4 5
Ingresos x Ventas Plataforma $ 750,000,000.00 $ 900,000,000.00 $ 1,080,000,000.00 $ 1,296,000,000.00 $ 1,555,200,000.00
Ingresos x Ventas - Token $ 30,000,000.00 $ 42,000,000.00 $ 58,800,000.00 $ 82,320,000.00 $ 115,248,000.00
Préstamo
Egresos $ 875,640,000.00 $ 928,536,000.00 $ 974,962,800.00 $ 1,023,710,940.00 $ 1,074,896,487.00
Costos Nomina $ 253,000,000.00 $ 265,650,000.00 $ 278,932,500.00 $ 292,879,125.00 $ 307,523,081.25
Plataforma Azure $ 544,320,000.00 $ 571,536,000.00 $ 600,112,800.00 $ 630,118,440.00 $ 661,624,362.00
Publicidad $ 5,000,000.00 $ 5,250,000.00 $ 5,512,500.00 $ 5,788,125.00 $ 6,077,531.25
Arriendo Oficina $ 58,320,000.00 $ 61,236,000.00 $ 64,297,800.00 $ 67,512,690.00 $ 70,888,324.50
Equipos de Computo $ 15,000,000.00 $ 15,750,000.00 $ 16,537,500.00 $ 17,364,375.00 $ 18,232,593.75
Depreciación
Intereses $ 9,800,000.00 $ 8,317,421.24 $ 6,627,281.46 $ 4,700,522.11 $ 2,504,016.45
Flujo de Caja Antes de Impuestos -$ 105,440,000.00 $ 5,146,578.76 $ 157,209,918.54 $ 349,908,537.89 $ 593,047,496.55
Impuestos $ 0.00 $ 1,801,302.56 $ 55,023,471.49 $ 122,467,988.26 $ 207,566,623.79
Flujo de Caja Después de Impuestos -$ 105,440,000.00 $ 3,345,276.19 $ 102,186,447.05 $ 227,440,549.63 $ 385,480,872.76
Depreciación
Amortización
Inversión Inicial $150,000,000.00
Recuperación del Capital de Trabajo $ 20,000,000.00
Valor de Salvamento $ 5,300,000.00
Flujo de Caja Neto $150,000,000.00 -$ 105,440,000.00 $ 9,269,376.19 $ 108,406,752.05 $ 233,971,869.88 $ 417,638,759.02
Valor Presente Neto $ 493,251,339.79
TIO (EA) 14%
TIR 87.27%
Tabla 12. Flujo de Caja sin préstamo
7 CONCLUSIONES Y RECOMENDACIONES
- Se identifican diferentes orígenes de datos, los cuales se comportan como CORE
de negocio de diferentes instituciones de educación superior en Colombia, logrando
dimensionar las diferentes ETLs que son necesarias implementar para garantizar la
correcta exploración de los datos.
- Se plantea un diseño de nomenclaturas tanto para la bodega de datos como para
las tablas desde el proceso de extracción de tablas, lo que garantiza que el
desarrollo sea estándar y permita la fácil construcción de la misma, basadas en una
relación entidad-atributo.
- Con base en el análisis realizado y las herramientas tecnológicas propuestas, se
propone la solución lógica para llevar a cabo el diseño de la bodega de datos, que
se comportará como repositorio centralizado, la cual a través de Blockchain
permitirá la certificación de los estudios de educación superior en Colombia.
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 2
8 REFERENCIAS
Aguilar, Ma., Cabrera, G., Capanegra, H. y Jorda, Ma. (2016). El Empleo De Las Tecnologías De Información Y Comunicaciones (Tics) En El Ámbito Universitario. Recuperado de: http://www.scielo.org.ar/pdf/daapge/n26/n26a06.pdf
Amadeo, A., Diaz, J. y Osorio, M. (2012). Hacia un Sistema de Información
Integrado en la Universidad Nacional de La Plata. Argentina Un caso de estudio. Recuperado de: http://documentos.redclara.net/bitstream/10786/834/1/11-2_hacia_un_Sistema_de _informacion_Integrado.pdf
Anaya De Páez, R. (2012), Las bodegas de datos como apoyo a los sistemas de información acerca del negocio. Recuperado de: http://publicaciones.eafit.edu.co/index.php/revista-universidad-eafit/article/view/1176
Baño, H. (2017). Business Intelligence Para Mejorar La Gestión Académica En La
Academia Aeronáutica Mayor Pedro Traversari. (Tesis de Maestría). Universidad Regional Autónoma de los Andes, Abato, Ecuador.
Colombia, Ministerio de Educación Nacional, (MEN, Cap. 1, 2016), Recuperado
de: https://www.mineducacion.gov.co/1759/articles-356787_recurso_1.pdf Duque, N. y Tamayo, A. (2001), DataWarehouse (Bodega De Datos). Herramienta
Para La Toma De Decisiones. Recuperado de http://bdigital.unal.edu.co/58094/1/datawarehouseparte2.pdf
Erazo, J. (2015). Análisis, Diseño y Desarrollo del Datamart Formación Docentes
para el prototipo de Sistema Académico Integrado en las Carreras de Ingeniería en Sistemas Computacionales e Ingeniería en Networking y Telecomunicaciones de la Facultad de Ciencias Matemáticas y Físicas de la Universidad de Guayaquil, (Tesis de Pregrado).
Falivene, G., Gurmendi, M. y Silva, G. (2003). El e-learning como mecanismo
articulador de procesos de gestión del conocimiento y formación continua en las organizaciones públicas: El caso del Sistema de Información Universitaria (SIU), Recuperado de: http://cmapspublic.ihmc.us/rid=1212522161015_1418394775
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 3
_11753/el%20%20e-learning%20%20en%20las%20%20organizaciones%20%20 publicas.pdf
Gaibazzi, Ma., Ingrassia, R., Marchese, A. y Pérez, N. (2009). Sistemas De
Conocimiento En Organismos Públicos. Recuperado de: http://rephip.unr.edu.ar/bitstream/handle/2133/ 7722/Marchese%2C%20Ingrassia%20sistemas%20de%20conocimientos.pdf?sequence=3
Guizado, R. (2015). Diseño e implementación de un data mart olap para el análisis
gerencial académico que será desarrollado para la Unidad Educativa La Colina. (Tesis de pregrado) Universidad Central de Ecuador, Quito, Ecuador.
Inmon, H. (1992). Building the data warehouse. Editorial Wiley. Jimenez, F., Zambrano, E. (2009). Implementacion de un DATAMART para el área
de capacitación y consultoria del centro de educación continua “CEC”. (Tesis de Pregrado) Escuela Politecnica Nacional, Quito, Ecuador.
Kimball, R. (1996). The data warehouse Toolkit. Editorial Wiley. León, H. (2011). Desarrollo de un Prototipo de Datawarehouse para la gestión y
Administración directiva en la carrera de Ingenieria en Sistemas Computacionales. (Tesis de pregrado). Universidad de Guayaquil, Guayaquil, Ecuador.
Marakas, G. (2005). Modern Data Warehousing, Mining, and visualization: Core
Concepts. Editorial Prentice Hall. Medina, J. (2005). Evaluación del impacto de los sistemas de información en el
desempeño individual del usuario: aplicación en instituciones universitaria. (Tesis de doctorado) Universidad Politécnica de Madrid, Madrid, España. Recuperado de: http://oa.upm.es/244/1/Jose_Melchor_Medina.pdf
Nader, J. (2004). Sistema de Apoyo Gerencial Universitario. (Tesis de Maestría).
Universidad Politécnica de Madrid, Madrid, España. OCDE, Organization for Economic Co-operation and Development, (OCDE/BIRF/Banco Mundial, 2013; MEN, 2014), Reviews of National
Policies for Education: Tertiary
Propuesta de una Bodega de Datos Basada en Estándares Que Permitan La Disponibilidad y La
Certificación de Información en la Educación Superior en Colombia
Página | 4
Education in Colombia 2012, OECD Publishing, París, Recuperado de: http://dx.doi.org/10.1787/9789264180697-en.
Ottaviani, J. (2007). Políticas de gestión universitaria y su relación con las nuevas
tecnologías de la información y de la comunicación. Recuperado de: http://m.bdigital.uncu.edu.ar/ objetos_digitales/2322/politicasottaviani.pdf
Piñeros, L., B. Caro Acero y L. Villa Arcila (Piñeros et al., 2013; OCDE/BIRF/Banco
Mundial, 2013), “Diagnóstico de los sistemas de información de la educación inicial, básica, media y superior”, ESOCEC Ltd., julio del 2013.
Ramírez, J. (2014). Data Warehousing. (Tesis de pregrado). Universidad Nacional
de la amazonia peruana, Amazonas, Perú. Rivadera, G. (2010), La metodología de Kimball para el diseño de almacenes de
datos (Datawarehouses) Recuperado de: http://www1.ucasal.edu.ar/htm/ingenieria/cuadernos/archivos/5-p56-rivadera-formateado.pdf
Robles, R. (1999). El Nuevo Paradigma De La Gestión Del Conocimiento, y Su Aplicación Al Ámbito Educativo. Recuperado de: https://idus.us.es/xmlui/bitstream/handle/11441/ 62364/EL%20NUEVO%20PARADIGMA%20DE%20LA%20GESTI%C3%93N%20DEL%20CONOCIMIENTO.pdf?sequence=1&isAllowed=y Ponniah, P. (2010). Data warehousing fundamentals for IT professionals 2010. Editorial Wiley
Turban, E. (2009). Decision Support System and Business Intelligence. Editorial
Pearson. Vilca, J. (2016). Implementación de un sistema de consultas analíticas para el
soporte de las decisiones en instituciones educativas públicas basado en un Datamart, aplicando la metodología HEFESTO. (Tesis de pregrado). Universidad Nacional Mayor De San Marcos, Lima, Perú.