Informe Aed Geoestadistica

Embed Size (px)

Citation preview

  • 8/17/2019 Informe Aed Geoestadistica

    1/23

      ANALISIS EXPLORATORIO DE DATOS

      INTRODUCCION

    Para poner en práctica lo aprendido en el curso de geoestadística

    específcamente a nuestro tema el análisis exploratorio de datos se

    ha llevado acabo el presente trabajo que es una aplicación que

    revalidara la teoría ,se basa en el análisis de una data real de una

    yacimiento de muestras obtenidas del sondaje de sus exploraciones

    llamado la data de toromocho en alusión al nombre de la unidad

    minera en un campo de estudio real en minería se lleva a cabo los

    procedimientos que se detallaran más adelante aunque de una

    manera más completa y más minuciosa así este trabajo es una

    aproximación a menor escala del trabajo que se realiza en la minería

    en materia del análisis de sus datos de exploración y que es un

    primordial que se haga lo más preciso posible una mal análisis dará

    malos resultados y por ende signifcara el racaso de las operaciones

    de una unidad minera por ello la importancia del muestreo y el

    análisis e interpretaciones que se haga con estos datos que si bien es

    un análisis más estadístico que geoestadistico ayuda en el propósito

    de lograr establecer la manera como están distribuidas las leyes en el

    yacimiento para poder hacer una buena estimación de los recursos

    así el análisis exploratorio de datos constituye la

    etapa inicial en el proceso deestimación de reservas que

    luego seguirán en otros

    procedimientos como el

    variograma para su

    posterior riging!

  • 8/17/2019 Informe Aed Geoestadistica

    2/23

    "ig! la data analizada proviene de las muestras del sondaje

    EJEMPLO APLICATIVO DEL ANALISIS EXPLORATORIODE DATOS

    Para ello utilizaremos primeramente el #xcel para la evaluación de los datos

    del sondaje y posteriormente el spss, este sot$are estadístico %ediante

    este programa de análisis estadístico se busca evaluar la calidad y

    consistencia de los datos, determinar la distribución de las variables en

    estudio en nuestro caso la ley del cobre y detectar los valores atípicos para

    su posterior modifcación! &os aclara aun más el panorama y tener unamejor visión de nuestra distribución de nuestros datos para ellos tenemos

    '( )(*( *++%+-.+ la cual posee la inormación de los sondajes

    realizados pero nuestro análisis estará basado en el archivo (//(0/ para

    nuestra evaluación de leyes!

    "ig! Podemos apreciar los datos del sondaje de la )(*( *++%+-.+

    -omo podemos notar la data toromocho posee inormación (//(0/,.#()#, P-", /12#0 y un archivo de topograía, estos son el resultado de

    la exploración minera y base del proyecto en general se detalla en cinco

    planillas de datos3

    4 Puntos de ubicación espacial de los sondajes 5.#()#!csv6!

    4 7normación de las leyes del mineral 5(//(0/!csv6!

    4 7normación geológica 5'7*.+!csv6!

    4 )atos topográfcos 5/12#0!csv6!

    4 -oordenadas de la zona 5P1&*+/ 8P/!csv6!

  • 8/17/2019 Informe Aed Geoestadistica

    3/23

  • 8/17/2019 Informe Aed Geoestadistica

    4/23

    fg! (preciamos los ;::< datos que procesaremos para nuestro análisis

    estadístico

  • 8/17/2019 Informe Aed Geoestadistica

    5/23

    Para tener una idea de cómo está distribuido vemos las leyes de cu se hizo

    distribuciones agrupando los datos y observándolos en un gráfco lo mismo

    se hizo pero ordenando las muestras de menor a mayor!

    )e esta manera podemos notar como están distribuidas las leyes así comoya podemos notar la presencia de los outliers valores atípicos que salen al

    hacer los análisis pero que debemos determinar si estos lo son realmente o

    si son solo errores de muestreo o mal digitados o mal analizados como

    muchas veces puede suceder para ello se debe volver a analizar y

    posteriormente eliminarlos o hacer las correcciones del caso!

    (demás Podemos apreciar la gran cantidad de datos que vamos a procesar

    a continuación el análisis estadístico con #xcel con la fnalidad de calcular

    los parámetros para su distribución!

  • 8/17/2019 Informe Aed Geoestadistica

    6/23

    (hora haremos el análisis respectivo para ello contaremos con las

    herramientas estadísticas3

    "ig! +bservamos los datos a partir del cual haremos el análisis estadístico

    .allamos el rango el dato máximo menos el mínimo, el criterio de stuges

    para hallar el numero de intervalos =9>?!?@Alog& obtenemos

    redondeando 9B clases o intervalos tambiCn hallamos la amplitud o periodo

    de cada clase

    "ig! %uestra las demás medidas de dispersión de la estadística clásica de la

    data toromocho

  • 8/17/2019 Informe Aed Geoestadistica

    7/23

    "ig! %uestra la tabla de distribución de recuencias de la data toromocho!

  • 8/17/2019 Informe Aed Geoestadistica

    8/23

    9 @ ? B D E F ; < 9: 99 9@ 9? 9:

    D::

    9:::

    9D::

    @:::

    @D::

    ?:::

    ?D::

    B:::

    histograma- ley CU

    re!"e#!ia

    +btenemos los siguientes resultados sea calculado cada clase con sus

    respectiva amplitud hasta completar el dato máximo para las 9B clases se

    halla el Gi o promedio de cada clase además de su recuencia es decir la

    cantidad de datos entre intervalo de clase lo cual al sumar debemos llegar alos ;::< datos obtenido hallamos tambiCn el hi y .i que son recuencia

    relativa simple y recuencia relativa acumulada respectivamente las cuales

    para confrmar que el cálculo ue bien hecho debe llegar a la unidad!

    (demás de otros datos que se calculan por deecto para los diagramas de

    análisis pero que son de vital importancia para hacer una buena distribución

    de los datos de la data! (demás se calcula la media y la varianza para

    calcular tambiCn el coefciente de asimetría y el de urtosis para la

    completa interpretación del histograma

    "ig! .istograma de recuencias de la data toromocho

     

  • 8/17/2019 Informe Aed Geoestadistica

    9/23

     

    INTERPRETACIONES

    #ste grafco nos da los resultado así podemos apreciar la cantidad de cores

    con su respectiva ley por lo que podemos apreciar de la clase 9 es decir delintervalo de :!::@ a :!?@9 tenemos ?B?: muestras, de la clase @ de

    intervalo de :!?@9 a :!E?< tenemos @;;? muestras y la clase ? de intervalo

    de :!E?< a :!

  • 8/17/2019 Informe Aed Geoestadistica

    10/23

    urtosis (c=F,BB@D es decir es mayor a tres lo que hace nos indica que su

    distribución es de mayor altura que la distribución normal! (demás tenemos

    una distribución log normal!

    "ig! *ipos de distribución de acuerdo a su coefciente de asimetría,

    asimCtrica sesgada a la derecha, simCtrica y asimCtrica sesgada al aizquierda

    "ig! (nálisis de distribución segIn el coefciente de asimetría

    #l sesgo a su vez me indica que los datos tienen una simetría positiva!

    (demás se muestra claramente que tiene una distribución log normal para

    luego normalizarlo a fn de tener una distribución normal con un error de

    estimación confable que puede ser del

  • 8/17/2019 Informe Aed Geoestadistica

    11/23

    "ig! *ipos de distribución segIn el coefciente de urtosis

     *al como de nuestra distribución se obtuvo una 'eptocIrtica es decir de un

    coefciente de asimetría mayor a ? que indica que la distribución tiene

    mayor altura que la distribución normal!

    #l otro análisis consiste en hacer el diagrama de cajas y bigotes o K+G P'+*

    "ig! )iagrama de cajas y bigotes grafco representativo

    "ig! #jemplo de grafca de cajas

    #ste ejemplo cualquiera representativo nos ayudara a comprender lo que se

    busca con este diagrama de cajas que nos permite conocer la localizaciones

    centro de los datos, su dispersión 5el rango intercuartilico6, la simetría de la

    distribución y la más primordial la existencia de datos que se desvían del

    patrón general 5datos atípicos6 los outliers!

    Para este análisis necesitamos los datos siguientes datos mínimo, máximo

    el primer y el tercer cuartil así como la mediana con estos datos que se

    obtienen con #xcel obtenemos la gráfca aunque al procesarlo en el #xcel no

  • 8/17/2019 Informe Aed Geoestadistica

    12/23

    se logra visualizar los outliers cosa por la que necesitamos de la ayuda del

    spss!

    (quí henos considerado usar tambiCn las otras variables del cu lo que son el

    -1/, -1-& 0 -1 que son el cobre soluble, cianurado y recuperable

    respectivamente para un análisis más amplio del diagrama de cajas aunque

    nuestro interCs se centra en el cu total

    -1 -1/ -1-& -1

    :

    :!9

    :!@

    :!?

    :!B

    :!D

    :!E

    :!F

     

    "ig! 8rafca de cajas y bigotes en #xcel de la data toromocho

    (unque quizá la desventaja del procesamiento en #xcel es que no se puedever los outliers por algIn motivo por ello tambiCn se trabajó con el sot$are

  • 8/17/2019 Informe Aed Geoestadistica

    13/23

    estadístico en el cual se puede apreciar el diagrama de cajas con el objetivo

    de visualizar los outliers!

      EVALUACI$N DE LA MORMALIDAD DE

    LOS DATOS-omo obtuvimos una distribución log normal de leyes de -u entonces lo

    siguiente es normalizar nuestros datos es decir llevarlos a una distribución

    normal para ello se lleva a cabo el estudio de la normalidad existen diversos

    mCtodos para la evaluación de la normalidad de un conjunto de datos para

    nuestro caso se creyó conveniente usar un mCtodo sencillo y practico como

    es el mCtodo grafco es hacer el diagrama de cuantiles5LLMplot6 que

    detallaremos pero cabe resaltar que tambiCn se normaliza con el contraste

    de hipótesis o Prueba de normalidad de Nolmogorov que es un poco más

    tediosa pero con el diagrama de cuantiles de orma gráfca podremos

    normalizar nuestra distribución!

      %R&ICO DE CUANTIL '((-PLOT) EN EXCEL

    'a construcción de este grafco de probabilidad normal se realiza a travCs

    de los cuantiles de la normal estándar, de orma que aceptaremos la

    hipótesis de normalidad de nuestros datos siempre que los puntos en el

    grafco tengan un comportamiento Osufcientemente rectilíneo

    8ráfco LML nos permite comparar los cuantiles obtenidos de la muestra

    con los de la distribución teórica! #ste gráfco sirve para determinar si un

    conjunto de datos se ajusta a una distribución normal! 'a normalidad de losdatos será perecta cuando los puntos estCn sobre la línea recta

    "ig!

    %uestra los tipos de grafcas de cuantiles o gráfcos de probabilidad normal

  • 8/17/2019 Informe Aed Geoestadistica

    14/23

    'os elementos undamentales de este grafco de probabilidad son los

    Opuntos de posición grafca 5plotting positions6 aplicado a nuestra data

    toromocho y siguiendo nuestro análisis exploratorio de datos se sigue los

    siguientes pasos3

    Primero disponemos de un conjunto de datos las ;::< muestras del sondajeGi 5i=9, @,?,Q;::

  • 8/17/2019 Informe Aed Geoestadistica

    15/23

    "ig! %uestra el diagrama de cuantiles

      INTERPRETACION

    )e acuerdo al estudio de la normalidad vemos que nuestro resultado ue

    una distribución PlaticIrtica es decir presenta una urtosis dierente a la

    normal en este caso es menor de ?!

    #s importante destacar que esta representación de dispersión de estos

    datos es para lograr la normalidad de los datos lo cual se logra cuando los

    puntos están sobre una línea recta además de que hay ciertos parámetros

    que considera este mCtodo de grafca de cuantiles que otros no toman en

    cuenta pero que al fn de cuentas buscan la normalidad de los datos!

  • 8/17/2019 Informe Aed Geoestadistica

    16/23

      AN&LISIS EN SOT*ARE ESTADISTICO SPSS

    #l sot$are 7K% /P// el cual utilizaremos para hacer el análisis de nuestros

    datos! #ste procesa de una manera sencilla rápida y es muy completa ya

    que te calcula todos los parámetros para la evaluación de la distribución con

    solo cargar la data en el programa! (l dar inicio al spss se nos abrirá una

    ventana elegimos la opción introducir datos aceptamos!

     

    "ig! el sot$are spss en $in F ?@ bits

    Primero hacer el cargado de nuestro datos los ;::< lo cargamos en la

    ventana donde se indica variable y ponemos la opción variable numCrica

  • 8/17/2019 Informe Aed Geoestadistica

    17/23

    "ig! -argado de los ;::< datos en variable numCrico spss

    -omo nuestro caso es univariable solo una variable los datos de las leyes de

    -1 entramos a la opción analizar luego explorar seleccionamos la variable

    seleccionamos y arrastramos la data y entramos a cargado de resultados y

    de orma sencilla nos dará los siguientes resultados3

    "ig! %uestra de los resultado con cada parámetro estadístico

    'a opción explorar nos da un conjunto de datos sobre las leyes de -1 que

    suministramos al spss! #ste programa nos da de orma inmediata cada uno

    de los datos calculados de la tabla de distribución de recuencias mostradasanteriormente con el #xcel entre ellos tenemos el rango, la media, el

  • 8/17/2019 Informe Aed Geoestadistica

    18/23

    mínimo, el máximo, la varianza, la desviación estándar, la asimetría la

    urtosis, la desviación típica entre otras medidas de dispersión estadística

    relacionadas a la variable cu!

    (demás viene anexado a esto una gráfca de tallos y hojas aunque no es

    motivo de nuestro estudio pero vale la pena aclarar que el programa da estegrafca por deecto, además no es muy conocido y utilizado alumnos en la

    evaluación de análisis exploratorio a nivel de minería en el análisis de leyes

    de mineral, no es sino es otra orma de distribución de los datos

    básicamente nos permite obtener simultáneamente una distribución de

    recuencias de la variable y su representación gráfca! Para construirlo basta

    separar en cada dato el Iltimo dígito de la derecha 5que constituye la hoja6

    del bloque de ciras restantes 5que ormará el tallo6!

    "ig! %uestra el diagrama de tallos y hojas herramienta adicional del spss

  • 8/17/2019 Informe Aed Geoestadistica

    19/23

    "ig! %uestra los resultados con sus ubicaciones en el diagrama de cajas con

    spss

    (ntes de analizar a nuestro ejemplo primeramente analicemos que

    inormación nos aporta el diagrama de cajas en el spss que es casi similar al

    #xcel pero que la dierencia está en la manera de analizarlo el spss es más

    completo y permite la observación de los outliers!

    #n este sot$are ya se puede observar los outliers el cual era el objetivo

    para el análisis del diagrama de cajas y bigotes, estos valores atípicos queescapan como datos aislados para luego hacer el análisis respectivo que se

    hacer ante el tratamiento de outliers!

  • 8/17/2019 Informe Aed Geoestadistica

    20/23

    "ig! %uestra el diagrama de cajas y bigotes blox plot en spss de la data

    toromocho

    )e esta manera se puede confrmar los resultados del spss si comparamos

    veremos que concuerda con la data toromocho pues si vemos en la clase 9B

    teníamos un outliers de ley B!BEB que claramente se puede ver en la parte

    alta superior del diagrama asimismo de la clase ; de leyes entre @!@?? a

    @!DD@ teníamos @ posibles outliers que tambiCn podemos visualizar justo

    entre este intervalos de leyes seguido de la clase F de leyes entre 9!

  • 8/17/2019 Informe Aed Geoestadistica

    21/23

      CONCLUSIONES

  • 8/17/2019 Informe Aed Geoestadistica

    22/23

    #l (#) análisis exploratorio de datos es de vital importancia en la minería

    para la estimación de reservas porque es básicamente la interpretación del

    muestreo, punto iniciador del Cxito o racaso de una operación minera! #ste

    análisis es más estadístico pero con el sC quC hace las inerencias deltratamiento de estos datos, hacer la distribución, el organizarlos y

    procesarlos de orma correcta es undamental y nos garantizara el Cxito de

    la secuencia de actividades mineras con efciencia!

    Para eso este análisis estadístico de las muestras recogidas de los datos de

    campo recolectadas de los sondajes, en nuestra ejemplo de aplicación de la

    data toromocho la cual se analizó las muestras se organizó la inormación yse hizo el análisis estadístico obteniCndose una distribución de leyes de

    cobre log normal como era de esperar pues es normal en ciencias de la

    tierra este tipo de distribución! Pero la cual debemos normalizar páralo que

    se utilizó el diagrama de cuantiles esta grafca de probabilidad normal lo

    cual estima a una distribución normal mediante una recta además de ello

    mediante el grafco de cajas y bigotes se pudo observar los datos atípicos

    los outliers los cuales serán evaluados para su tratamiento todo el presente

    análisis se realizó en #xcel y en el sot$are spss para la aplicación de

    nuestra data de leyes de cu de toromocho!

     

    K7K'7+8("7(

  • 8/17/2019 Informe Aed Geoestadistica

    23/23

    +++,mae,".m,es/,,,istri0"!io#es,,,/DISTRI1UCI2N345LO%,o!

    htt.6//+++,s!ielo,!l/s!ielo,.h.7.i8S59:;-

    545