32
Grupo : TRI-O “Por que dos… no son suficientes” e necesita saber má ra invertir mejor..

Analysis Services

Embed Size (px)

Citation preview

Page 1: Analysis Services

Grupo : TRI-O“Por que dos…

no son suficientes”

“Se necesita saber más para invertir mejor...”

Page 2: Analysis Services

SQL Analysis Services

Page 3: Analysis Services

Características Edición Express

Edición Workgroup

Edición Standard

Edición Enterprise

Analysis Services NO NO SI SI

Data Mining NO NO SI SI

Funcionalidad Business Intelligence SLQ Server 2008

Page 4: Analysis Services

¿Qué es Analysis Services?Microsoft SQL Server Analysis Services proporciona funciones de procesamiento analítico en línea (OLAP) y minería de datos para aplicaciones de Business Intelligence (BI). Analysis Services admite OLAP al permitirle diseñar, crear y administrar estructuras multidimensionales que contienen datos agregados desde otros orígenes de datos, por ejemplo bases de datos relacionales.

Introducción a La Tecnología OLAPEl Proceso analítico en línea (OLAP) es la tecnología que permite a las aplicaciones de cliente el acceso eficiente a los almacenes y puestos de datos (almacenes donde se analizan los datos). OLAP proporciona muchas ventajas a los usuarios que realizan análisis, por ejemplo:

o Un modelo de datos intuitivo y multidimensional que facilita la selección, recorrido y exploración de los datos.

o Un lenguaje analítico de consulta que proporciona la capacidad de explorar las complejas relaciones existentes entre los datos empresariales.

o Un pre cálculo de los datos consultados con más frecuencia que permite una rápida respuesta a las consultas.

Page 5: Analysis Services

En un modelo de datos OLAP, la información es vista como cubos, los cuales consisten de categorías descriptivas (dimensiones) y valores cuantitativos (medidas). El modelo de datos multidimensional simplifica a los usuarios formular consultas complejas, arreglar datos en un reporte, cambiar de datos resumidos a datos detallados y filtrar o rebanar los datos en subconjuntos significativos.

Por ejemplo, las dimensiones típicas de un cubo que contenga información de ventas incluirían: tiempo, región, producto, canal, organización y escenario (planeado o real). Las medidas típicas incluirían: ventas en dólares (u otra moneda), unidades vendidas, número de personas, ingresos y gastos.

Un almacén de datos es una base de datos que contiene la información que, normalmente, representa el historial empresarial de una organización. Estos datos históricos se utilizan para realizar análisis que apoyen las decisiones empresariales a diferentes niveles, desde el diseño estratégico a la evaluación del rendimiento de una unidad determinada de la organización. Los datos contenidos en un almacén de datos se encuentran organizados para permitir el análisis más que para procesar transacciones en tiempo real como ocurre en los sistemas de proceso de transacciones en línea (OLTP, Online Transaction Processing).

Page 6: Analysis Services

La tecnología OLAP permite un uso más eficaz de los almacenes de datos para el análisis en línea, lo que proporciona respuestas rápidas a consultas analíticas complejas e iterativas.

Los modelos de datos multidimensionales de OLAP y las técnicas de agregados de datos organizan y resumen grandes cantidades de datos para que puedan ser evaluados con rapidez mediante el análisis en línea y las herramientas gráficas.

La respuesta a una consulta realizada sobre datos históricos a menudo suele conducir a consultas posteriores en las que el analista busca respuestas más concretas o explora posibilidades.

Los sistemas OLAP proporcionan la velocidad y la flexibilidad necesarias para dar apoyo al analista en tiempo real.

Page 7: Analysis Services

Introducción a La Tecnología OLTPEn muchas ocasiones, un almacén de datos se utiliza como el fundamento de un sistema de ayuda para la toma de decisiones. Los almacenes de datos se han diseñado para superar algunos de los problemas que una organización encuentra cuando intenta realizar un análisis estratégico mediante la misma base de datos que utiliza para realizar el proceso de transacciones en línea (OLTP).

Normalmente, los sistemas OLTP:

o Admiten el acceso simultáneo de muchos usuarios que agregan y modifican datos.

o Contienen grandes cantidades de datos, incluidos los datos extensivos utilizados para comprobar transacciones.

o Tienen estructuras complejas.

o Se ajustan para dar respuesta a la actividad transaccional.

o Proporcionan la infraestructura tecnológica necesaria para admitir las operaciones diarias de la empresa.

Page 8: Analysis Services

Dificultades de la Tecnología OLTP para realizar Análisis en Línea.

o Los analistas carecen de la experiencia técnica necesaria para crear consultas "ad hoc" (para un fin específico) contra la compleja estructura de datos.

o Las consultas analíticas que resumen grandes volúmenes de datos afectan negativamente a la capacidad del sistema para responder a las transacciones en línea.

o El rendimiento del sistema cuando está respondiendo a consultas analíticas complejas puede ser lento o impredecible, lo que causa un servicio poco eficiente a los usuarios del proceso analítico en línea.

o Los datos que se modifican con frecuencia interfieren en la coherencia de la información analítica.

o La seguridad se complica cuando se combina el análisis en línea con el proceso de transacciones en línea.

Page 9: Analysis Services

Tecnología OLAP Vs. Tecnología OLTP

Page 10: Analysis Services

Almacén de Datos (Datawarehouse ).

o Organizan los datos para analizarlos.

o Pueden combinar datos de orígenes heterogéneos en una única estructura homogénea.

o Organizan los datos en estructuras simplificadas buscando la eficiencia de las consultas analíticas más que del proceso de transacciones.

o Contienen datos transformados que son válidos, coherentes, consolidados y con el formato adecuado para realizar el análisis.

o Proporcionan datos estables que representan el historial de la empresa

o Se actualizan periódicamente con datos adicionales, no con transacciones frecuentes.

o Simplifican los requisitos de seguridad.

o Proporcionan una base de datos organizada para OLAP, no para OLTP.

Page 11: Analysis Services

Data mart.

Un Data mart es una versión especial de almacén de datos (data warehouse). Son subconjuntos de datos con el propósito de ayudar a que un área específica dentro del negocio pueda tomar mejores decisiones.

Entre las características de un data mart destacan:

o Usuarios limitados.

o Área especifica.

o Tiene un propósito especifico.

o Tiene una función de apoyo.

Page 12: Analysis Services

Minería de DatosData Mining constituye un miembro clave del Business Intelligence (BI) y permite analizar datos, hallando patrones escondidos, de manera automática o semiautomática. En lo que va del tiempo muchas empresas han acumulado una gran cantidad de datos en sus bases de datos, el resultado de esta colección de datos es que las organizaciones tienen “datos ricos” pero “pobre conocimiento”.

El propósito principal de la Minería de Datos (Data Mining) es extraer de los datos patrones, incrementar su valor intrínseco y transformar la data en conocimiento.

El DM proporciona un enorme valor a las organizaciones. En estos tiempos el DM puede implementarse con más transparencia debido a:

o Gran cantidad de data disponible.

o Alto nivel de competencia.

o Tecnología Lista.

Page 13: Analysis Services

Estructura de minería de datos La estructura de minería de datos es una estructura de datos que define el dominio de datos a partir del cual se generan los modelos de minería de datos. Una única estructura de minería de datos puede contener varios modelos de minería de datos que comparten el mismo dominio.

Las unidades de creación de la estructura de minería de datos son las columnas de la estructura de minería de datos. Estas columnas contienen información como el tipo de datos, el tipo de contenido y el modo en que se distribuyen los datos.

Una estructura de minería de datos también puede contener tablas anidadas. Una tabla anidada representa una relación de uno a varios entre la entidad de un escenario y sus atributos relacionados. Por ejemplo, si la información que describe al cliente se encuentra en una tabla y las compras del cliente en otra, puede utilizar tablas anidadas para combinar la información en un único escenario. El identificador del cliente es la entidad y las compras son los atributos relacionados.

La estructura de minería de datos no contiene información sobre el modo en que las columnas se utilizan para un modelo de minería de datos concreto, ni sobre el tipo de algoritmo que se utiliza para generarlo; esta información se define en el propio modelo de minería de datos.

Page 14: Analysis Services

UDM (Unified Dimensional Model) La función de un modelo UDM (Unified Dimensional Model) es aproximar los orígenes de datos al usuario. Un UDM se genera a partir de uno o varios orígenes de datos físicos. El usuario emite consultas en el UDM mediante diversas herramientas de cliente, como Microsoft Excel.

Existen ventajas para el usuario final aun cuando el modelo UDM sólo se genere como una fina capa sobre el origen de datos: un modelo de datos más sencillo y más fácil de comprender, el aislamiento de orígenes de datos de servidor heterogéneos y un rendimiento mejorado para las consultas de tipo de resumen. En algunos escenarios, un modelo UDM simple se puede generar automáticamente. Una mayor inversión en la generación del modelo UDM puede generar ventajas adicionales por la gran cantidad de metadatos que puede proporcionar el modelo.• Mejora notablemente el modelo del usuario.

• Proporciona consultas de alto rendimiento que admiten un análisis interactivo.

• Captura las reglas de negocio del modelo para proporcionar un análisis mejorado.

• Permite que los usuarios actúen según los datos que ven.

Page 15: Analysis Services

Arboles de decision Clustering Series temporales

Clustering secuencial

Asociación Redes neuronales

Ejemplos de Algoritmos

Page 16: Analysis Services

OBJETOS DE ANALYSIS SERVICES

Orígenes de datosUn origen de datos representa una conexión a un origen de datos y contiene la cadena de conexión que define el modo en que Analysis Services conecta con un almacén de datos físico mediante un proveedor Microsoft .NET Framework administrado o un proveedor OLE DB nativo.

La cadena de conexión contiene información sobre el nombre del servidor, la base de datos, la seguridad, el tiempo de espera y otra relacionada con la conexión. Analysis Services admite directamente muchos orígenes de datos.

Entre los orígenes de datos admitidos se incluyen las bases de datos de Microsoft SQL Server y las creadas mediante otros productos, como Oracle, DB2 y Teradata.

Page 17: Analysis Services

Vistas de origen de datosUna vista de origen de datos contiene el modelo lógico del esquema que utilizan los objetos de las bases de datos de Analysis Services: cubos, dimensiones y estructuras de minería de datos.

o Contiene los metadatos que representan objetos seleccionados a partir de uno o más orígenes de datos subyacentes para generar un almacén de datos relacional subyacente.

o Se puede generar con uno o más orígenes de datos, lo que permite definir objetos OLAP y de minería de datos que integren datos de varios orígenes.

o Puede contener relaciones, claves principales, nombres de objeto, columnas calculadas y consultas que no están presentes en un origen de datos subyacente y que son independientes de los orígenes de datos subyacentes.

o No está visible ni disponible para que las aplicaciones cliente realicen consultas.

Page 18: Analysis Services

Vistas de origen de datos

La vista de origen de datos le ofrece flexibilidad a la hora de crear objetos en Analysis Services (SSAS), Integration Services (SSIS) y Reporting Services (SSRS), dado que los objetos de bases de datos Analysis Services están vinculados a los objetos lógicos contenidos en la vista de origen de datos en lugar de estar directamente vinculados a los objetos físicos subyacentes definidos en el origen de datos subyacente.

Por lo tanto, el usuario puede definir objetos lógicos, como columnas calculadas o consultas con nombre, que no existen en un origen de datos subyacente y a los que es posible que no tenga permisos para definir en un origen de datos subyacente.

Page 19: Analysis Services

CUBOS

“Un cubo es un conjunto de medidas y dimensiones relacionadas que se usa para analizar datos. “

Page 20: Analysis Services

Cubos.Una medida es un hecho, que es un valor o medida transaccional que un usuario podría desear agregar. Las medidas se obtienen de las columnas de una o varias tablas de origen y se agrupan en grupos de medida.

Una dimensión es un grupo de atributos que representa un área de interés relacionada con las medidas del cubo y que se usan para analizar las medidas del cubo. Por ejemplo, una dimensión Customer podría tener los atributos Customer Name, Customer Gender y Customer City, lo que permitiría que Customer Name, Customer Gender y Customer City analizaran las medidas del cubo.

Los atributos se obtienen de las columnas de una o varias tablas de origen. Los atributos de cada dimensión se pueden organizar en jerarquías para proporcionar rutas para el análisis.

Un cubo se aumenta con cálculos, indicadores clave de rendimiento (KPI), acciones, particiones, perspectivas y traducciones. Los cubos son esencialmente sinónimos de un modelo UDM (Unified Dimensional Model). Los cubos se desarrollan en función de tablas y vistas modeladas en una vista de origen de datos.

Los hechos de un cubo se agregan a todas las dimensiones, en función de las jerarquías de dimensiones.

Page 21: Analysis Services

Dimensiones

Las dimensiones constituyen un componente fundamental de los cubos. Las dimensiones organizan los datos en función de un área de interés para los usuarios, por ejemplo clientes, almacenes o empleados.

Las jerarquías se utilizan para organizar las medidas incluidas en un cubo.

Las dimensiones en Analysis Services contienen atributos que corresponden a columnas de tablas de dimensiones. Estos atributos aparecen como jerarquías de atributo y se pueden organizar en jerarquías definidas por el usuario, o bien se pueden definir como jerarquías de elementos primarios y secundarios basadas en columnas en la tabla de dimensiones subyacente.

Page 22: Analysis Services

Funciones.

Las funciones se utilizan para administrar la seguridad de los objetos y datos de Analysis Services. En términos simples, una función asocia los identificadores de seguridad (SID) de usuarios y grupos de Microsoft Windows que tienen derechos y permisos de acceso específicos a los objetos administrados por una instancia de Analysis Services. En Analysis Services se incluyen dos tipos de funciones:

o La función del servidor, que es una función fija que proporciona acceso de administrador a una instancia de Analysis Services.

o Las funciones de base de datos, que son funciones definidas por los administradores para controlar el acceso a los objetos y datos de los usuarios que no son administradores.

Page 23: Analysis Services

EnsambladosAnalysis Services (SSAS) proporciona gran cantidad de funciones intrínsecas que se pueden utilizar con los lenguajes MDX (Expresiones multidimensionales) y DMX (Extensiones de minería de datos), diseñados para realizar multitud de tareas, desde el cálculo estadístico estándar hasta recorridos de miembros de una jerarquía. No obstante, al igual que con cualquier otro producto complejo, existe siempre la necesidad de ampliar la funcionalidad. medida.

Por lo tanto, Analysis Services permite agregar ensamblados a una instancia o base de datos de Analysis Services. Los ensamblados permiten crear funciones externas definidas por el usuario mediante cualquier lenguaje CLR (Common Language Runtime), como por ejemplo Microsoft Visual Basic .NET o Microsoft Visual C#. También puede utilizar lenguajes de automatización COM (Modelo de objetos componentes), como Microsoft Visual Basic o Microsoft Visual C++.

Page 24: Analysis Services

Administrar Analysis Services

La administración de Analysis Services (SSAS) incluye la administración de todas las instancias mediante el mantenimiento de la seguridad óptima, la implementación, la copia de seguridad y restauración de las bases de datos, el procesamiento de objetos, la automatización de tareas y la supervisión de la actividad de una instancia de Analysis Services.

Administrar y Mantener Analysis Services

La administración de una instancia de Analysis Services (SSAS) se compone de la administración del propio servicio Analysis Services, el establecimiento de las propiedades de configuración de Analysis Services, la administración del almacenamiento de datos utilizando particiones locales y remotas, la copia de seguridad y la restauración, y la finalización de la actividad del usuario cuando sea necesario.

Page 25: Analysis Services

Realizar copias de seguridad y restaurar una base de datos de Analysis Services

Las copias de seguridad permiten a los administradores guardar un estado específico de una base de datos de Microsoft SQL Server 2005 Analysis Services (SSAS) y sus objetos.

En general, las copias de seguridad de Analysis Services contienen metadatos y un subconjunto de datos de origen y/o agregaciones, no la totalidad de los datos de detalle subyacentes.

La restauración permite a los administradores restaurar una base de datos Analysis Services a un estado anterior.

Las razones para hacer copias de seguridad incluyen la recuperación de datos y la preparación de auditorías

Page 26: Analysis Services

Procesamiento en Analysis Services

Como administradores, se debe mantener actualizados los objetos de Analysis Services (SSAS) en las bases de datos de producción mediante su procesamiento.

Mientras el trabajo de procesamiento está en funcionamiento, se puede obtener acceso a los objetos afectados de Analysis Services para realizar consultas.

El procesamiento es el paso, o la serie de pasos, que llenan los objetos de Analysis Services con datos de orígenes de datos relacionales. El procesamiento varía en función del tipo de objeto y la selección de las opciones de procesamiento.

Si se produce un error en el trabajo de procesamiento, la transacción se revierte. Si el trabajo de procesamiento se realiza correctamente, se aplica un bloqueo exclusivo al objeto al confirmar los cambios, lo que significa que el objeto no está disponible temporalmente para consultas o procesamiento.

Durante la fase de confirmación de la transacción, se pueden seguir enviando consultas al objeto, pero se pondrán en cola hasta que la confirmación se complete.

Page 27: Analysis Services

Finalizar la actividad de los usuarios

Es posible que un administrador desee dar por terminada la actividad de los usuarios como parte de la administración de la carga de trabajo. Esto se lleva a cabo cancelando sesiones y conexiones.

Las sesiones se pueden formar automáticamente cuando se ejecuta una consulta (implícito) o definirse en el momento en que las crea el administrador (explícito). Las conexiones son conductos abiertos con los que se pueden ejecutar las consultas.

Tanto las sesiones como las conexiones se pueden terminar aunque estén activas. Por ejemplo, es posible que un administrador desee finalizar el procesamiento de una sesión si dicho procesamiento está tardando demasiado o si han surgido dudas sobre si el comando que se está ejecutando está correctamente escrito.

Page 28: Analysis Services

Terminar sesiones y conexiones

Debido a que no hay interfaz de usuario para administrar sesiones y conexiones, el administrador utiliza el comando Cancelar a través de XMLA EXECUTE METHOD para finalizar una sesión o una conexión.

La finalización de una sesión detiene todos los comandos que se están ejecutando como parte de dicha sesión. La finalización de una conexión cierra su sesión del host. No obstante, Analysis Services no puede cerrar una conexión si no puede realizar un seguimiento de todas las sesiones que ha abierto, por ejemplo, cuando hay varias sesiones abiertas en un escenario HTTP.

Page 29: Analysis Services

DEMOSTRACIÓN Ventas realizadas por Internet

por región y por línea de productos en el mes de febrero de 2006

Page 30: Analysis Services

Analysis Services (Microsoft) VS Business Objects (SAP)

VSTanto Anslysis Services como Bussines Ojects son dos suites de herramientas de Business Inteligence (BI).

Ventajas Analysis Services

o Es de Microsoft, porque es una ventaja, si tenemos como servidores de Base de Datos SQLSERVER, os puedo decir con toda seguridad que no vamos a tener ninguno problema de integración (Microsoft suele cuidar la integración entre sus sistemas).

o Para analizar los informes o reports que hagamos de BI podemos emplear el EXCEL atacando directamente a los CUBOS OLAP.

o La instalación es relativamente sencilla, y en poco tiempo podríamos tener funcionando nuestro Analysis Services.

o Reporting Services de Microsoft es una herramienta muy potente que permite

atacar a cubos OLAP o a BBDD relacionales.

Page 31: Analysis Services

Analysis Services (Microsoft) VS Business Objects (SAP)

Ventajas Business Objects

o La herramienta web, INFOVIEW, para poder ver los informes (o documentos de Web Inteligence como se llaman en BO) está a años luz de distancia de los EXCEL SEVICES de Microsoft. Con INFOVIEW podemos añadir/quitar dimensiones modificar el informe en su totalidad como nos de la santa gana, con los EXCEL SERVICES no se puede modificar el informe.

o En BO podremos cruzar datos de varios universos de una manera muy fácil, no necesitamos andar haciendo cubos virtuales, ni compartir dimensiones ni cosas raras... En el propio informe podremos hacer dos consultas a dos universos diferentes y con que haya una dimensión en común en estos dos universos podemos mostrar la información.

Page 32: Analysis Services

Analysis Services (Microsoft) VS Business Objects (SAP)

Desventajas Analysis Services

o Si queremos cruzar datos de varios CUBOS OLAP (aquí es así como se llaman los repositorios de la información) es muy trabajoso.

o Los EXCEL SERVICES que es la herramienta de visualización web de AS de los informes, no está a la altura del resto de la herramienta.

Desventajas Business Objectso La mayor desventaja es que si vamos a diseñar documentos o reports con el

Infoview tenemos que tener instalado el cliente de JAVA, y es una molestia, porque se cuelga, y da desbordamientos....

o El servidor que se encarga de hacer los envío al correo de informes en PDF, EXCEl... si bien viene integrado, no es tan potente como el Reporting Services solo podemos hacer envíos de los informes que tengamos publicados, no podemos atacar a directamente a una BBDD o a una vista para generar el informe y enviarlo....