49
UNIVERSIDAD NACIONAL DE ANCASH “Santiago Antúnez de Mayolo” FACULTAD DE CIENCIAS AGRARIAS MANUAL DE ESTADISTICA GENERAL CON 2009

Manualcon Minitab-estadistica General

Embed Size (px)

DESCRIPTION

Estadistica

Citation preview

  • UNIVERSIDAD NACIONAL DE ANCASH

    Santiago Antnez de Mayolo

    FACULTAD DE CIENCIAS AGRARIAS

    MANUAL DE ESTADISTICA GENERAL

    CON

    2009

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    INTRODUCCIN

    La estadstica, ciencia que da soporte a la investigacin cientfica desde el ordenamiento de datos hasta el desarrollo de las diferentes tcnicas como los diseos experimentales que el estudiante como el profesional de Ciencias Agrarias requiere para su desarrollo acadmico como para la investigacin, se hace necesario el conocimiento de software que hagan censillo el desarrollo y su aplicabilidad para el desarrollo de la investigacin, necesaria para encontrar alternativas para el incremento de la produccin y la productividad agropecuaria de nuestra Regin.

    Actualmente el hombre en todas las actividades humanas se esta valiendo de la investigacin cientfica para arrancar los secretos a la naturaleza, a fin de ponerlos al servicio del bienestar humano. Los pases que estn actualmente a la cabeza del mundo dedican mucha atencin e invierten cada ao mayores sumas de dinero para estos trabajos, porque reconocen que es la punta de lanza en el avance tcnico y econmico, y a ello se deben los gigantescos progresos alcanzados en los ltimos tiempos.

    El Ing. Jos Calzada, en su Libro Mtodos estadsticos para la investigacin manifiesta que el personal que se dedica a experimentacin debe reunir condiciones especiales que no son requeridas en otras actividades; siendo las bsicas e indispensables vocacin e inquietud por el estudio.

    En el presente ciclo acadmico 2009-I, presentamos a los alumnos del curso de Experimentacin Agrcola I y a toda la comunidad Santiaguina el presente Manual de Estadstica General con aplicacin del Software estadstico MINITAB (validas en sus versiones 13.0 y 14.0) dando nfasis a la estadstica descriptiva y a los diseos experimentales; Software estadstico ampliamente utilizado para la enseanza de la estadstica aplicada e investigaciones por la UNA La Molina. La primera parte del documento nos muestra el entorno del MINITAB para su fcil aplicacin.

    El Profesor

    2

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    INICIO DE UNA SESIN EN MINITAB:

    Al iniciar una sesin en Minitab, Se ingresar a la siguiente pantalla:

    Ventana Sesin

    En esta ventana aparecern todos los resultados a los procedimientos efectuados con excepcin de los grficos.

    Ventana Worksheet

    En est ventana se ingresarn los datos que se quieran procesar. Es similar a una hoja de clculo organizada en columnas (C1, C2,) y filas numeradas.

    LA BARRA DE MENS

    La Barra de Mens de MINITAB contiene 9 entradas: File, Edit, Manip, Calc, Stat, Graph, Editor, Window y Help, cada una de las cuales tienen varias opciones. Si al lado de la opcin aparece el smbolo entonces ( ), al elegir esta opcin aparecer un sub men de alternativas. Si la opcin termina en tres puntos ( ) entonces aparece una Ventana de Dilogo.

    3

    Barra de Ttulo Barra de Mens

    Barra de Herramientas

    Barra de Estado

    VENTANA SESSION

    VENTANA WORKSHEET

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    El Men Fileste men contiene mayormente opciones que sirven para manipular las hojas de trabajo

    y para guardar e imprimir el contenido de las ventanas de MINITAB. A continuacin se muestra las opciones de ste men

    Las ltimas hojas de trabajo o proyectos que se han usado aparecen al final del men File y pueden ser activados si se selecciona con el Mouse.

    El Men File Contiene las Siguientes OpcionesOpcin Accin

    New Abre un nuevo proyecto o nueva hoja de trabajoOpen Project Abre un nuevo proyecto que ya fue guardadoSave Project Guarda un ProyectoSave Project As Guarda un proyecto con otro nombreProject Description Edita una descripcin del proyectoOpen Worksheet Abre una hoja de trabajo que ya fue guardadaQuery Database(ODBC) Llama a los datos guardados en una Base de Datos Save Current Worksheet Guarda una hoja de trabajoSave Current Worksheet As Guarda una hoja de trabajo con otro nombreClose Worksheet Cierra una hoja de trabajoOpen Graph Abre una grfica de MINITABSave Worksheet As (*) Guarda el contenido de una hoja de trabajoOther Files Llama datos en otro tipo de archivosPrint Worksheet (*) Imprime el contenido de una hoja de trabajoPrint Setup Cambia la configuracin de la impresoraExit Sale de MINITAB(*) estas dos opciones cambian cuando la ventana session o una ventana de grfica est activa

    4

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    El Men Edit

    ste men contiene opciones que permiten editar el contenido de las celdas de las columnas del Worksheet o el contenido de la ventana Session. Cuando se hacen grficas, en el Men Edit aparece la opcin Copy Graph que permite enviar la grfica al Clipboard para luego ser exportada a un procesador de palabras, tal como Word o WordPerfect. La figura nos muestra las opciones de ste men cuando la ventana Worksheet est activa.

    El men Edit cuando la ventana Data est activaOpcin Accin

    Clear Cells Borra el contenido de la celdaDelete Cells Elimina celdasCopy Cells Copia el contenido de las celdasCut Cells Elimina celdasPaste Cells Inserta celdasPaste Link Establece una conexin entre una especificada aplicacin y MINITABLinks Conecta MINITAB con otras aplicacionesSelect all Cells Selecciona todas las celdas de una columnaEdit Last Dialog Llama a la ltima ventana de DilogoCommand Line Editor Abre una ventana donde escribir el comando de lneaPreferences Cambia las especificaciones de MINITAB

    5

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Men Manip

    ste men contiene opciones para manipular todo el contenido de las columnas de una hoja de trabajo. En la siguiente figura se muestran las opciones del men Manip y las alternativas que hay para la opcin Change Data Type.

    Descripcin de las opciones de ManipOpcin Accin

    Subset Worksheet Crea una nueva hoja de trabajo usando una condicin en la hoja de trabajo que se est usandoSplit Worksheet Crea hojas de trabajo basndose en grupos existentes en la hoja de trabajo que se est usandoMerge Worksheets Junta dos hojas de trabajoCopy Columns Copia datos de una columna en otra columnaUnstack Columns Separa una el contenido de una columna en varias columnasSnack Junta el contenido de dos o ms columnas (o filas) en una sola columna (o fila)Transpose Columns Convierte columnas de datos en filasSort Ordena los datos de una columnaRank Da los ordenamientos de los datos de una columnaDelete Rows Elimina filas de una o varias columnas Erase Variables Elimina columnas de datosConcatenate Junta fila por fila el contenido de dos columnasCode Asigna cdigos a la columna

    Change Data TypeCambia el tipo de dato que tiene la columna. Los datos pueden ser: numricos, de texto y de Fecha/Hora

    Display Data Muestra los datos de la hoja de trabajo en la ventana session

    6

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaMen Calc

    Contiene opciones para hacer operaciones aritmticas con las columnas de la hoja de trabajo, tambin es posible obtener al azar un conjunto de datos con una distribucin predeterminada y calcular probabilidades y percentiles de las distribuciones ms conocidas. La ltima entrada del men Calc es Matrices, la cual permite hacer operaciones con matrices. A continuacin se muestran las opciones de ste men y las alternativas de la opcin Probability Distributions.

    Descripcin de las opciones de CalcOpcin Accin

    Calculador Permite hacer operaciones aritmticas con las columnasColumn Statistics Calcula medias estadsticas de una columna Row Statistics Calcula medias estadsticas por filas

    StandarizaEstandariza una columna de datos(por lo general haciendo que la media sea cero y la varianza uno)

    Extract from Data/Time to numeric Extrae un dato horario y lo convierte en numricoExtract from Data/Time to Text Extrae un dato horario y lo convierte en textoMake Patterned Data Genera datos en secuencia con un patrn dadoMake Mesh Data Genera datos que son usados para hacer una mallaMake Indicator Variables Crea variables indicadoras de una columna numricaSet Base Establece el valor inicial para generar nmeros aleatoriosRandom Data Genera datos al azar de varias distribuciones conocidas

    Probability DistributionsDa la funcin de probabilidad, la distribucin acumulada y los percentiles de las distribuciones mas conocidas

    Matrices Permite hacer operaciones con matrices

    7

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaMen Stat

    ste men contiene opciones que permite llevar a cabo la mayora de los procedimientos estadsticos. La siguiente figura nos muestra las opciones de ste men y el sub men de la Opcin Tables.

    Opciones de Stat Opcin Accin

    Basic Statistics

    Incluye clculo de medias estadsticas, pruebas de hiptesis acerca dela media poblacional, de proporciones, de diferencia de medias y de proporciones, clculo de la correlacin, as como pruebas de Normalidad para un conjunto de datos.

    RegresinIncluye anlisis de regresin simple y mltiple, los mtodos para elegir el mejor modelo de regresin. Tambin el plot de los puntos observadosy la lnea de regresin que se ajusta a ellos

    Anova Hace el anlisis de varianza de diseos experimentales bsicosDOE Analiza diseos experimentales avanzadosControl Charts Grficas de control de calidadQuality Tools Ms grficas de control de calidadReability/Survival Incluye los mtodos de anlisis de supervivencia y de confiabilidad

    Multivariate Incluye los mtodos estadsticos multivariados: Componentes Principales,Anlisis Factorial, Anlisis DiscriminanteTimes Series Analiza datos en series de tiempoTables Ordena datos en forma tabular y analiza tablas de contingencia

    Noparametrics Incluye los mtodos estadsticos no paramtricos, los que no requierenla suposicin de Normalidad

    EDA Incluye los mtodos del Anlisis Exploratorio de datos:"stem-and-leaf""boxplots", etcPower and Sample Size Calcula la potencia y el tamao de muestra para varias pruebas estadsticas

    8

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaMen Graph

    ste men contiene opciones que permiten hacer una gran variedad de grficas estadsticas desde histogramas hasta grficas tridimensionales. A continuacin se muestran las opciones de ste men y las opciones de la opcin Character Graphs.

    Opciones de GraphOpcin Accin

    Layout Empieza y termina el arreglo de grficas mltiples en una misma pginaPlot Hace diagrama de puntos y grficas linealesTimes Series Plot Hace grficas para datos en series de tiempoChart Hace grficas de barras para datos cualitativosHistogram Hace un histogramaBoxplot Hace un "Boxplot"Matriz Plot Hace un plot en forma matricial para mostrar la relacin entre varias variablesDraftsman Plot Hace un plot matricial 2 por 2Contour Plot Hace un plot de contorno3D Plot Hace plot en 3 dimensiones3D Wireflame Plot Grafica una superficie en 3 dimensiones usando grids3D Surface Plot Grafica una superficie en 3 dimensiones Dotplot Hace un grfico de puntos de alta resolucinPie Chart Hace grficas circulares

    Marginal Plot Hace un diagrama de puntos acompaado de histogramas, boxplots o dotplots de las variables X y YProbability Plot Hace plots de probabilidadStem-and-Leaf Hace un "Stem-and-Leaf" de un conjunto de datosCharacter Graphs Hace varios tipos de grficas en modo texto

    9

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaMen Editor

    ste men contiene opciones que permiten editar el contenido de las ventanas de session y worksheet. En particular se puede insertar comentarios en los resultados que aparecen en session. Tambin se puede elegir el tipo de letra en que ellos aparecern. Las opciones del men dependen de la ventana que est activa.Cuando la ventana worksheet est activada entonces hay opciones que permiten editar el contenido de las celdas de la hoja de trabajo. A continuacin se muestran las opciones de ste men.

    Opciones del Men EditorOpcin Accin

    Next Command Mueve el cursor al siguiente comando en la ventana de sessionPrevious Command Mueve el cursor al anterior comando en la ventana de sessionEnable Command Language Produce el prompt MTB> de MINITABMake Output Editable Permite que la ventana session pueda ser editadaFind Encuentra un texto en la ventana sessionReplace Reemplaza un texto en la ventana sessionSelect Fonts Selecciona fonts para los ttulos, comentarios y resultadosApply I/O Fonts Aplica un tipo de letra dado a los comandos y resultadosApply Title Fonts Aplica un tipo de letra dado a los ttulosApply Comment Fonts Aplica un tipo de letra dado a los comentarios

    Men Window

    El men Window contiene opciones que permiten organizar las ventanas de MINITAB, ste men aparece en todo programa hecho para windows. A continuacin se muestran las opciones de ste men.

    10

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Opciones del Men WindowOpcin Accin

    Cascade Arregla la ventana de MINITAB para que todas las barras con ttulos aparezcanTile Arregla las ventanas de MINITAB para que todas ellas aparezcan en pantallaMinimize All Reduce todas las ventanas a iconos que son puestos en la parte inferiorRestore Icons Restaura un icono en una ventanaArrange Icons Ordena los conos de MINITAB en la parte inferior de la pantallaRefresh Muestra nuevamente las ventanas de MINITABHide Toolbar Esconde la "Toolbar"Hide Status Bar Esconde la barra de statusManage Graphs Manipula ventanas de grficasClose All Graphs Cierra todas las ventanas grficasSet Graphs Zize/Location Guarda el tamao y la localizacin de la ventana grficaManage Worksheets Imprime, guarda, abre, arregla y cambia nombres a la hoja de trabajo

    Men Help

    ste men contiene opciones que dan ayuda acerca del uso de los comandos de MINITAB. A continuacin se muestran las opciones de ste men.

    11

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Opciones del Men HelpOpcin Accin

    Help Muestra el contenido de la ayuda del MINITABSearch Help Busca ayuda por el tipo de palabra seleccionadoHow to use Help Muestra como usar help en microsoft windowsStatGuide Para usar la gua de MINITABSearch the StatGuide Para buscar en la gua de MINITABHow to use the StatGuide Muestra como usar la gua de MINITABTutorials Da informacin bsica a cerca de lo que usted necesita para empezar a usar MinitabSearch Tutorials Muestra la secuencia de cmo usar Minitab para realizar ciertas accionesSession Command Help Abre el archivo de ayuda de los comandos en MinitabSearch Session Command Help Buscar comandos que se usan en la ventana session de Minitab

    Minitab on the Web Activa el browse del Web y se conecta a MinitabAbout Minitab Da informacin a cerca de la versin y el dueo de Minitab

    INGRESO DE DATOS

    Para ingresar un conjunto de datos correctamente, se deber hacer corresponder a cada

    columna con una variable y a cada fila con una observacin o unidad elemental.

    Ntese que entre los encabezados de columnas y la primera fila existe una fila libre. En esta fila

    se podrn colocar nombres a las variables con las que trabajando. De no colocar un nombre, el

    software asignar por defecto los nombres C1, C2,consecutivamente.

    Los datos que se presentan a continuacin corresponden a un estudio de cuarenta muestras de

    suelos, realizado en el valle de Casma.

    12

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Muestra PH Humedad % de Arcilla Clase Contextual1 7.85 2.10 1 arena2 7.65 3.30 2 arena3 7.60 4.80 4 arena franca4 8.00 3.00 2 arena5 8.20 1.80 1 arena6 7.80 16.90 14 franco limoso7 7.70 2.40 1 arena8 7.25 2.90 1 arena9 8.40 2.20 1 arena10 8.20 3.00 1 arena11 7.50 2.96 1 arena12 7.70 4.60 2 arena13 8.00 4.00 2 arena14 8.40 3.90 1 arena15 8.10 5.50 4 arena16 7.95 5.90 4 arena17 7.75 15.60 4 franco arenoso18 8.00 2.90 1 arena19 7.50 3.10 1 arena20 7.20 19.60 12 franco arenoso21 8.00 18.50 16 franco22 7.80 16.80 26 franco23 8.10 12.60 12 franco arenoso24 8.00 10.10 8 franco arenoso25 8.20 10.50 11 franco arenoso26 8.30 12.10 8 franco arenoso27 8.30 9.10 6 franco arenoso28 9.25 12.90 14 franco arenoso29 9.15 13.60 8 franco arenoso30 8.10 16.50 8 franco arenoso31 8.30 5.50 4 franco arenoso32 8.20 15.50 12 franco arenoso33 8.35 12.90 12 franco arenoso34 8.75 5.90 5 franco arenoso35 8.80 3.40 2 arena36 8.85 2.70 2 arena37 7.85 12.90 8 franco arenoso38 8.05 10.20 8 franco arenoso39 8.20 4.30 4 arena40 8.40 3.60 2 arena

    13

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaGuardando los datos

    Se elige el men File y luego la opcin Save Worksheet As (si es la primera vez que son entrados los datos) o Save Worksheet (si los datos ya han sido entrados anteriormente).

    El archivo quedar guardado automticamente en el subdirectorio Mtbwin. Si se desea guardar el archivo en cualquier otro lugar oprimir la flecha al lado de Guardar en que le llevar al lugar deseado. El archivo guardado se llama familia.mtw. Los datos tambin pueden ser guardados en otro tipo de formato, el cual se elige en Tipo.

    Abriendo un Archivo de Datos

    Los datos que se van a analizar pueden estar de antemano en un archivo, el cual puede estar en formato de MINITAB o en otro tipo de formato, o bien puede haber sido ingresado usando un editor de texto.Para llamar al archivo que est en formato de MINITAB se elige el men File y luego la opcin Open Worksheet.

    14

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    ESTADISTICA DESCRI PTIVA

    En este captulo se desarrollarn todas las tcnicas que se usan para la organizacin y presentacin de datos en tablas y grficos, as como clculos de medidas estadsticas:

    ORGANIZACIN DE DATOS CUANTITATIVOS Tabla de frecuencia:

    Los datos cuantitativo discretos se organizan en tablas, llamadas Tablas de Distribucin de Frecuencia. La primera columna de la tabla contiene los distintos valores que asume la variable ordenados en forma ascendente y las columnas contiguas contienen los distintos tipos de frecuencia.

    Se sigue la secuencia: Stat / Tables / Tally. En la ventana de dialog Tally se elige la variable Porcentaje de Arcilla, y se selecciona todas las opciones de display, como en el grfico.

    El contenido de la ventana session ser el siguiente:

    Tally for Discrete Variables: Porcentaje de Arcilla

    Porcentaje de Arcilla Count CumCnt Percent CumPct 1 10 10 25.00 25.00 2 7 17 17.50 42.50 4 6 23 15.00 57.50 5 1 24 2.50 60.00 6 1 25 2.50 62.50 8 6 31 15.00 77.50 11 1 32 2.50 80.00 12 4 36 10.00 90.00 14 2 38 5.00 95.00 16 1 39 2.50 97.50 26 1 40 2.50 100.00 N= 40

    15

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaInterpretacin:

    Count, representa la frecuencia absoluta. Por ejemplo el porcentaje de arcilla que ms predomina es el 1.CumCnt, representa la frecuencia absoluta acumulada. Por ejemplo 39 de las 40 muestras tienen un porcentaje de arcilla menor o igual que 16.Percent, representa la frecuencia relativa porcentual. Por ejemplo, slo 2.50 % de los porcentajes de arcillas de las muestras es de 26.CumPct, representa la frecuencia relativa porcentual acumulada. Por ejemplo, el 97.50 % de porcentaje de arcilla son menor o igual a 16.

    Histograma

    Un histograma es una representacin grfica que separa los datos en un nmero de intervalos (llamados bins) en el eje X y para cada intervalo dibuja una barra cuya altura corresponde por default al nmero de observaciones (o frecuencia) en el intervalo. Las observaciones que se encuentran en los lmites del intervalo son asignados en el intervalo a la derecha.

    Para el ejemplo utilizaremos la variable PH. Para construir un histograma elegimos la opcin Histograma... del men Graph... donde debemos elegir la variable o variables de las cuales se generar el histograma (se genera una grfica por variable), para lo cual la seleccionamos del lado izquierdo y damos clic sobre el botn de Select; en ese momento aparecer en el rea de Graph variable.

    En la ventanita Graph Variable se escribe la variable cuyo histograma se desea obtener. Al oprimir la flecha al lado Annotation se obtiene las siguientes opciones:

    16

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Si se quieres poner ttulos se elige Title, o para notas al pie Footnote, para poner los valores de la frecuencia absoluta encima de cada barra se elige Data Labels.

    Oprimiendo OK se obtiene el histograma deseado. Minitab elige automticamente el nmero de intervalos de clase, si se desea cambiar el nmero de intervalos de clase, se debe oprimir el botn Options y entrar el nmero de intervalos. Adems se puede ingresar los puntos medios de los intervalos de clase que se desean, al igual que el tipo de frecuencia para la altura de las barras. Por otro lado se puede obtener un Histograma horizontal, eligiendo Transpose X and Y en Options.

    Una vez seleccionadas todas las opciones para histograma se da clic en OK y aparecer la ventana Histogram:

    17

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Interpretacin: El histograma es asimtrico hacia la derecha. No existe mucha variabilidad. Ni hay valores anormales.

    Para ponerle color a nuestro histograma debemos tener activa la ventana, posteriormente nos vamos al men de Editor>Edit y de inmediato nos aparecern dos barras de herramientas donde podemos poner color a nuestro histograma.

    PRESENTACIN DE DATOS CUALITATIVOS

    Grficas de Barras

    Las grficas de barra pueden ser verticales u horizontales. Las grficas de barras se obtienen eligiendo la opcin Chart del men Graph

    18

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja Grficas Circulares

    Este tipo de grfica se usa cuando se requiere tener una idea de la contribucin de cada valor de la variable al total. Para obtener grficas circulares se usa la opcin Pie Chart del Men Graph. La ventana de dilogo de Pie Chart que se muestra a continuacin. La grfica nos permitir ver como se distribuyen las clases contextuales.

    Luego nos muestra la siguiente figura:

    En sta ventana pasamos la variable que queremos que nos salga la grfica como se indica en la figura. Luego pulsamos la opcin y nos muestra la siguiente ventana.

    19

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    En esta ventana le ponemos las opciones indicadas y luego presionamos la opcin y volvemos a la ventana de grfico de Pie y pulsamos

    20

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaGrfica de Stem-and-Leaf (tallos y hojas):

    El diagrama de tallos y hojas es un grfico de barras que, al igual que el Histograma, permite representar la forma de la distribucin de datos cuantitativos.

    Se trata de la combinacin de dos tcnicas, una para graficar y otra para clasificar. Representa los datos de una muestra mediante el empleo de los dgitos que

    constituyen los valores de los datos. Cada dato numrico se divide en dos partes: el (los) dgito (s) principal (es) se convierte (n) en el TALLO. Y el (los) dgito(s) posterior(es) se convierten en la HOJA.

    Los Tallos se escriben a lo largo del eje principal, y por cada porcin de datos se escribe una hoja para demostrar la distribucin de los datos.

    Una ventaja de los diagramas de tallos y hojas es que presentan ms informacin que los histogramas, ya que se conservan los valores iniciales de los datos.

    Para elaborarla se debe:

    Introducir, valores en la celda C1 sin importar el orden. En nuestro ejemplo usaremos los datos ingresados.

    Una vez que se tengan los valores debemos irnos al men Graph>Character Graph>Stem-and-Leaf o seguir la secuencia Stat>EDA>Stem-and-Leaf , y seleccionamos la variable PH.

    La opcin de By Variable la dejamos vaca ya que en este caso no compararemos nuestros Tallos y hojas.

    Seleccione la opcin Trim outliers si desea detectar y suprimir los valores extremos del grfico.

    En la caja de dialogo de Increment debemos poner la distancia que habr entre los tallos. Si deja la opcin en blanco, Minitab asignar los valores.

    Y haga click en el botn OK.

    21

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaEl resultado ser el siguiente:

    Stem-and-Leaf Display: PH

    Stem-and-leaf of PH N = 40Leaf Unit = 0.10

    2 7 22 4 7 55 9 7 66777 14 7 88889 (9) 8 000000111 17 8 222223333 8 8 444 5 8 7 4 8 88 2 9 1 1 9 2

    Diagrama de Cajas

    Es un grfico que, al igual que el histograma y el diagrama de tallos y hojas da informacin sobre la tendencia central, variabilidad, simetra y valores discordantes u outliers de una distribucin. Los lmites de la caja estn dados por el primer y tercer cuartil de los datos. La lnea que divide la caja en dos, corresponde a la mediana. El diagrama de cajas no aporta afirmacin sobre las frecuencias, como s lo hacen el histograma y el diagrama de tallos y hojas, pero es muy til para comparar las distribuciones de dos o ms conjunto de datos.Ahora se realizar un diagrama de cajas para las variables Humedad. Siga los siguientes pasos:

    Haga clic en el men Stat, coloque el cursor sobre la opcin EDA y luego haga clic en la opcin Boxplot

    Seleccione las variables Humedad en el cuadro correspondiente a Y (measurement).

    Haga clic en el botn OK.

    22

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaEl resultado ser el siguiente:

    Interpretacin: La lnea central de la caja representa la Mediana y los datos de la caja representan los Cuartiles. Si la mediana esta bien al centro de la caja, entonces hay simetra. Si la mediana esta a Q3 que a Q1 entonces la asimetra es negativa, de lo contrario la asimetra es positiva. Si la caja no es muy alargada entonces se dice que no hay mucha variabilidad.Si no hay Outliers entonces las lneas laterales de la caja llegan hasta el valor mnimo por abajo, hasta el valor mximo por arriba. Cuando hay Outliers entonces estos aparecen identificados en la figura y las lneas laterales que llegan hasta los valores adyacentes a las fronteras interiores. Si las lneas laterales son bastantes alargadas entonces significa que la distribucin de los datos se acerca lentamente al eje X.

    MEDIDAS DE TENDENCIA CENTRAL

    Las medidas de tendencia central representan el centro de la distribucin de los datos y las medidas de tendencia central ms usuales son la media, la mediana y la moda.MEDIA ARITMETICAEs la suma de todas las observaciones de una poblacin o muestra dividida entre el tamao de la poblacin. Una desventaja es la media es que se ve afectada por valores extremos. Una alternativa a ste problema es la media ponderada o trimedia, que se calcula con los datos restantes tras eliminar un porcentaje dado de los ms grandes y los ms pequeos. MINITAB calcula la trimedia eliminando el 5% de los datos de cada extremo.MEDIANAEs un valor que divide a la muestra en dos partes iguales. Es decir 50 por ciento de los datos de la muestra sern menores o iguales que la mediana y el restante 50 por ciento son mayores o iguales que ella.La mediana no est afectada por los valores extremos sin embargo no recoge la informacin de toda la muestra o poblacin. Para calcular la mediana primero se ordenan los datos de menor a mayor. Si el nmero de datos es impar, entonces la mediana ser el valor central. Si el nmero de datos es par entonces se promedian los dos valores centrales.

    23

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaMODAEs el valor que se repite con mayor frecuencia en la muestra. La moda puede aplicarse tanto a datos cuantitativos como cualitativos.MEDIDAS DE VARIABILIDADLas medidas de variabilidad o de dispersin, permiten conocer el grado de homogeneidad o heterogeneidad de un conjunto de datos.EL RANGOEs la diferencia entre el mayor y el menor valor de la muestra. Mientras mayor sea el rango existe mayor variabilidad. Es una medida inestable pues cambia de valor rpidamente al pasar de una muestra a otra, se ve afectada por valores extremos y no mide la variacin de los datos intermedios.LA VARIANZAEs una medida que da una idea del grado de concentracin de los datos con respecto a la media. Es el promedio de las desviaciones al cuadrado de los datos con respecto a la media.DESVIACIN ESTNDAREs la raz cuadrada positiva de la varianza y tiene la ventaja que est en las mismas unidades de medida que los datos. Se usa para comparar la variabilidad de dos grupos.COEFICIENTE DE VARIACINEs una medida de variacin relativa pues no tiene unidades. Se calcula dividiendo la desviacin estndar entre la media. Se usa para comparar 2 o ms conjuntos de datos, con diferentes unidades de medida o con valores muy diferentes para sus medias. EJEMPLO: Para calcular medidas estadsticas de tendencia central y de variabilidad para un conjunto de datos realizamos lo siguiente.Escoger el men Stat, luego ir a Basic Statistics y a la opcin Display Descriptive Statistics para calcular las medias estadsticas de la variable PH del ejemplo anterior.Luego nos aparece lo siguiente:

    En el que pasamos la variable que deseamos analizar, en este caso la variable PH, y luego pulsamos la opcin y nos muestra la siguiente ventana

    24

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaEn la cual nosotros seleccionamos Graphical Summary y presionamos el botn

    Los resultados aparecern en la ventana session, como sigue:

    25

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaDonde:N: Representa el nmero de datos.Mean: Es la media muestral, y en nuestro ejemplo nos da una media del 8.0925 de PHMedian: Es la mediana, en nuestro ejemplo nos da 8.0750 de PHTrMean: Es la media ponderada del 5%, en nuestro ejemplo nos da 8.0792 de PHStDev: Es la desviacin estndar, en nuestro ejemplo nos da 0.4509SE Mean: Es el error estndar de la media muestral, o sea nS Y los valores restantes representan el Mnimo, el Mximo y los Cuartiles superior (Q3) e inferior (Q1) de cada variable.

    26

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    DISTRIBUCIONES DE PROBABILIDAD

    DISTRIBUCIN BINOMIAL: Un experimento es llamado de Bernoulli si satisface las

    siguientes caractersticas:

    a. En cada repeticin puede ocurrir slo de dos maneras, una de ellas es llamada xito y la

    otra Fracaso.

    b. La probabilidad de xito, representada por p debe permanecer constante cuando el

    experimento es repetido muchas veces.

    c. Las repeticiones de los experimentos deben ser independientes entre s.

    En MINITAB se pueden calcular la funcin de probabilidad (Probability), la funcin de

    distribucin acumulada (Cumulative Probability) y los percentiles (Inverse Cumulative

    Probability) de la Distribucin Binomial para cualquier valor de n y p. Para esto hay que seguir

    la secuencia Calc, Probability y Distributions, Binomial.

    Ejemplo:

    a) Expresar en una tabla de valores la funcin de probabilidad y la funcin de distribucin

    acumulada de la variable aleatoria X: Nmero de preguntas bien contestadas por un

    estudiante que responde al azar un examen tipo seleccin mltiple que consiste de 10

    preguntas, cada una con 4 alternativas de las cuales slo una es correcta.

    b) Usar la tabla anterior para calcular la probabilidad de que el estudiante:

    - Tenga exactamente 3 preguntas buenas

    - Tenga 6 menos preguntas buenas

    - Tenga por lo menos 4 buenas

    Solucin:

    a) Primero hay que poner en una columna que podemos llamarla X, todos los valores

    posibles de la variable. La ventana de dilogo para el clculo de probabilidad acumulada

    (similar es para calcular la probabilidad) y los resultados son como siguen:

    27

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    28

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    b) La probabilidad de tener 3 preguntas bien contestadas es P(3)=0.2502

    La probabilidad de tener 6 menos preguntas bien contestadas es F(6)=0.9964

    La probabilidad de tener por lo menos 4 buenas es por complemento

    P(X4) = 1 - P(X3) = 1 - F(3) = 1 - 0.77588 = 0.23412

    Tambin se puede hallar la probabilidad acumulada para un nmero dado de xitos. Para

    ello en la ventanita de Input Constant se pone el nmero de xitos.

    29

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaDISTRIBUCIN NORMAL: La distribucin Normal o Gaussiana es del tipo continuo y es

    considerada la distribucin ms importante en Estadstica por las numerosas aplicaciones que

    tiene. Su comportamiento es reflejado por la Curva Normal que es la grfica de la siguiente

    ecuacin.

    pi

    2)(

    2

    2

    2)(

    =

    x

    exf

    Donde:

    La media y la desviacin estndar son los parmetros de la distribucin. En MINITAB se pueden calcular la funcin de densidad (Probability Density), la funcin de

    distribucin acumulada (Cumulative probability) y los percentiles (Inverse Cumulative

    probability) de la distribucin Normal para cualquier valor de la media y la desviacin estndar . No se requiere transformacin a una Normal Estndar. Para esto hay que seguir la

    secuencia Calc, Probability y Distributions, Normal

    Ejemplo: En este ejemplo en la columna llamada Z se han puesto 15 valores y se quiere hallar el

    rea a la derecha de dichos valores, las reas sern guardadas en una columna llamada rea. Por

    otro lado en la columna Alpha se han puesto 11 valores de rea y se desea hallar los valores de z

    correspondientes, estos son llamados percentiles. La ventana de dilogo y los resultados son

    como sigue:

    30

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Para hallar los percentiles se elige Inverse Cumulative Probability y se selecciona Alpha en

    Input Column y z(alpha) en Optional Storage.

    31

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega MejaCotejando si hay Normalidad

    Cuando se trata de sacar conclusiones acerca de la poblacin usando los datos de la muestra, se

    asume generalmente que la poblacin es Normal. Cuando no se conoce todos los elementos de la

    poblacin, se debe de usar los datos de la muestra para verificar si efectivamente la poblacin es

    Normal. Existen varias pruebas estadsticas para verificar la Normalidad.

    En MINITAB, primero se elige la opcin Stat, Basic Statistics y luego Test of Normality.

    32

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    En este caso vamos a ver la forma bsica de detectar normalidad, la cual es a travs de Plot de

    Normalidad. El Plot de Normalidad consiste de un diagrama de puntos donde en el eje vertical

    se considera los escores normales y en el eje horizontal los valores de la variable. Si los puntos

    caen cerca de una lnea, entonces se dice que hay Normalidad. En MINITAB ste plot es

    obtenido siguiendo la secuencia Graph, Probability Plot.

    Ejemplo: Usar un plot de Normalidad para verificar si la siguiente muestra proviene de una

    poblacin Normal.

    3.1 0.9 2.8 4.3 0.6 1.4 5.8 9.9 6.3 10.4 0 11.5

    33

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Interpretacin: En el eje horizontal aparecen los escores normales y en el eje vertical las

    probabilidades acumuladas de dichos escores. Los puntos caen cerca de la lnea y todos caen

    dentro de las bandas de confianza, luego se puede concluir que la poblacin de donde proviene la

    muestra es Normal.

    34

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    REGRESIN LINEAL

    1. Regresin Lineal Simple: Supongamos que tenemos datos de dos variables cuantitativas

    continuas X e Y, las cuales se relacionan siguiendo una tendencia lineal significa que los

    puntos estn dispuestos alrededor de una lnea recta, desvindose por una cantidad aleatoria e

    de la misma. Si adems asumimos que se trata de predecir el comportamiento de Y usando X,

    entonces el modelo de regresin lineal simple es de la forma.

    ++= XYDonde:

    Y es la llamada la variable de respuesta o dependiente

    X es la llamada la variable previctoria o independiente es el intercepto de la lnea con el eje Y

    es la pendiente de la lnea de regresin es un error aleatorio, el cual se supone que tiene media 0 varianza constante 2

    y son parmetros desconocidos y para estimularlos se toma una muestra de tamao n de observaciones (Xi, Yi), la variable Y se asume que es aleatoria pero X no necesariamente

    lo es.

    El estimado de de y el estimado de de son hallados usando el mtodo de mnimos cuadrados, que se basa en minimizar la suma de cuadrados de los errores

    ==

    =

    n

    iii

    n

    ii xye

    1

    2

    1

    2 )(

    Usando tcnicas de clculo diferencial para minimizar una funcin de dos variables y se obtienen

    xx

    xy

    SS

    = y xy =

    Las cantidades Sxx, Syy y Sxy aparecen definidas de la siguiente manera:

    =

    =

    =

    n

    i

    n

    ii

    ixx n

    xxS

    1

    1

    2

    2)(

    ;

    =

    =

    =

    n

    i

    n

    ii

    iyy n

    yyS

    1

    1

    2

    2)(

    ;

    =

    = =

    =

    n

    i

    n

    i

    n

    iii

    iixy n

    yxyxS

    1

    1 1

    ))((

    La ecuacin XY += , es llamada la lnea de regresin estimada, para obtener sta lnea en MINITAB se sigue la secuencia: STAT, Regresin, Regresin. Adems, en la salida

    aparecen:

    35

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Ejemplo: Se desea hallar una lnea de Regresin que permita predecir el precio de una chacra

    (Y) basndose en el rea de la misma (X). Se recolectaron 15 datos:

    En sta ventana introducimos la variable de respuesta Y (en Response) y la variable

    independiente X (en Predictors).

    36

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Luego se presiona el botn que permite controlar los resultados que aparecern

    en la ventana session. Hay 4 alternativas para controlar la salida segn se muestra en la

    figura.

    Luego se presiona el botn que permite guardar algunas medidas importantes

    que aparecen en el anlisis de regresin y que posteriormente se pueden usar, por ejemplo en

    el anlisis de residuales.

    37

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Interpretacin de los Coeficientes de Regresin:

    Interpretacin del Intercepto : Indica el valor promedio de la variable de respuesta Y

    cuando X es cero. Si hay seguridad de que la variable predoctora X no puede asumir el valor

    cero, entonces la interpretacin es innecesaria. En el ejemplo anterior, =73,168 indicara

    que si la chacra no tiene rea su precio promedio ser 73,158, lo cual no es muy razonable. Es

    ms conveniente hallar una lnea de regresin que no tenga intercepto.

    Interpretacin de la Pendiente : Indica el cambio promedio en la variable respuesta Y cuando X aumenta en una unidad adicional. En el ejemplo anterior =38.5 dlares.Intervalos de Confianza para el valor medio de Y e Intervalo de Prediccin

    A nivel poblacional para cada valor de la variable X existe una poblacin de valores de Y, la

    cual se asume que se distribuye normalmente con cierta media y varianza constante 2 . Lo

    que se busca es establecer un intervalo de confianza para dicha media asumiendo que la

    relacin entre X e Y es lineal. Dado un valor X0 de la variable X es natural pensar, que un

    estimado del valor medio de las 'Y s es 00 XY += . Usando las propiedades distribucionales de este estimado se puede establecer un intervalo de confianza del

    )%1(100 para el valor medio de todos los valores Y dado que X=X0 es como sigue:

    xxn S

    xxn

    stY2

    0)2,2/1(0

    )(1 +

    Por otro lado muchas veces estamos interesados en estimar solamente un valor de Y

    correspondiente a un valor dado X0. El estimado puntual ser el mismo Y, y usando

    propiedades de Y0-Y0 se obtiene que un intervalo de confianza de (1- )% para el valor

    predicho de Y dado que X=X0 es de la forma:

    xxn S

    xxn

    stY2

    0)2,2/1(0

    )(11

    ++

    Es mas riesgoso hacer predicciones para un solo valor que para un valor medio, por esta razn

    el intervalo de prediccin de Y es mas ancho que el intervalo de confianza para el valor

    medio.

    El botn de la ventana de Regression permite hallar estos intervalos de

    confianza, la siguiente ventana trata de hacer estas predicciones para el ejemplo anterior

    cuando la chacra tiene un rea de 3500 pies cuadrados.

    38

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Luego en la ventana session aparecer el siguiente resultado:

    Interpretacin: Hay un 95% de confianza de que el valor medio de todas las chacras de 3500

    pies cuadrado de rea caiga entre 184,536 y 231,461.

    Hay un 95% de confianza de que el valor de una chacra de 3500 pies cuadrados caiga entre

    169,518 y 246,479.

    As mismo, la opcin Fitted Line Plot del men de Regression permite hallar bandas de

    confianza tanto para el valor predicho como para el valor medio de las Y. Con las bandas de

    confianza se pueden tener intervalos de confianzas para cualquier valor dado de X. Para el

    presente ejemplo se obtiene:

    39

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    40

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Notar que las bandas de confianza son anchas en los extremos y angostas en el centro. En

    realidad las bandas se angostan cuando los valores de X que se toman estn cerca del

    promedio x .

    41

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    DISTRIBUCIONES MUESTRALES

    Uno de los objetivos de la estadstica es saber a cerca del comportamiento de parmetros

    poblacionales tales como: la media ( ), la varianza ( 2 ) o la proporcin ( ). Para ello se extrae una muestra aleatoria de la poblacin y se calcula el valor de un estadstico correspondiente, por

    ejemplo la media muestral ( x ), la varianza muestral ( 2s ) o la proporcin muestral ( p ). El valor

    del estadstico es aleatorio porque depende de los elementos elegidos en la muestra seleccionada

    y por lo tanto el estadstico tiene una distribucin de probabilidad la cual es llamada la

    Distribucin Muestral del Estadstico.

    1. Distribucin de la Media Muestral cuando la Poblacin es Normal

    Si se extraen muestras aleatorias de tamao n de una poblacin infinita que tiene media

    poblacional y varianza 2 , entonces sea cual sea la distribucin de la poblacin se tiene que:

    - La media de las medias muestrales es igual a la media poblacional.

    - La varianza de las medias muestrales es igual a la varianza poblacional dividida por n.

    En consecuencia la desviacin estndar de las medias muestrales (llamado tambin el error

    estndar de la media muestral), es igual a la desviacin estndar poblacional dividida por la

    raz cuadrada de n.

    Si adems la poblacin se distribuye normalmente entonces, la media muestral tambin tiene

    una distribucin normal con la media y varianza anteriormente indicadas. Si la poblacin es

    bastante simtrica entonces, un tamao de muestra mayor que 30 es suficiente para una buena

    aproximacin a la normal. Si la poblacin es bastante asimtrica entonces el tamao de

    muestra debe ser mucho ms grande.

    2. El Teorema de Lmite Central

    Un importante resultado en Probabilidades y Estadstica es el llamado Teorema del Lmite

    Central que dice que si de una poblacin infinita con media y varianza 2 se extraen muestras aleatorias de tamao n, entonces la media muestral se comporta como una variable

    aleatoria normal con media igual a la media poblacional y con varianza igual a la varianza

    poblacional dividida por el tamao de la muestra, siempre que n sea grande. Lo importante de

    este resultado es que es independiente de la forma de la distribucin de la poblacin. Es decir,

    ),(2

    nNx

    42

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Estandarizando, esto es equivalente a:

    n

    xZ

    =

    Si la poblacin fuera finita de tamao N, entonces se aplica el factor de correccin )1()(

    NnN

    al

    error estndar de la media muestral. Pero en la prctica ste factor es omitido a menos que la

    muestra sea lo suficientemente grande comparada con la poblacin, por lo menos un 5% de

    ella.

    En MINITAB se puede tratar de corroborar el Teorema del Lmite Central a travs de un

    proceso de simulacin.

    Ejemplo: Considerar una poblacin consistente de 3, 4, 6, 8, 10, 11, 12, 15, 20. Primero

    calculamos la media y desviacin estndar de dicha poblacin.

    43

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Segundo, extraemos 30 muestras de tamao 4 de dicha poblacin, ejecutando 4 veces la

    siguiente secuencia Calc, Random Data, Simple from columns. Guardar cada una de las 4

    observaciones de las muestras en 4 columnas distintas: Obs1, Obs2, Obs3 y Obs4.

    44

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Tercero, calculamos las medias de todas esas muestras usando la opcin Calc, Row

    Statistics y tratamos de ver grficamente al menos si hay acercamiento a Normalidad. As

    mismo se debe de observar que la media de todas stas medias debera de estar cerca de

    y la varianza cerca de n

    2

    45

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Luego para hallar la media de todas las medias seguimos los siguientes pasos: Stat, Basic

    Statistics, Display Descriptive Statistics, y nos da los siguientes resultados. Tambin

    podemos graficar presionando la opcin

    46

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Luego nos aparecer la siguiente ventana en el que escogemos la opcin marcada con el

    aspa.

    47

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    Interpretacin: Notar que la media de las medias muestrales es 15.500.

    Adems la desviacin estndar de la media muestral es 4.152 mientras que 71.2242.5

    ==

    n

    .

    El histograma est un poco alejado de la normalidad.

    Si se incrementa el tamao de las muestras se puede notar una mejor aproximacin a la

    normal.

    Bibliografa:

    Gua 2 del MINITAB, Minitab Inc. Ed, 2000. Gua del Curso de estadstica General. Editora Universidad Agraria La Molina.

    48

  • UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO Estadstica General Doc. Ing. Hernn Vega Meja

    INDICEIntroduccin ..... 1Inicio de una Sesin en MINITAB ...... 2La Barra de Mens ....... 2

    Men File ... 3El Men Edit . 4El Men Manip .. 5El Men Calc . 6El Men Stat .. 7El Men Graph .. 8El Men Editor .. 9El Men Window .. 9El Men Help .. 10

    Ingreso de Datos .... 11Guardando los datos ....... 13Abriendo un Archivo de Datos ........... 13Estadstica Descriptiva ... 14

    Organizacin de Datos Cuantitativos ... 14Tabla de Frecuencias ...... 14Histogramas .... 15

    Presentacin de Datos Cualitativos ..... 17Grficas de Barras... 17Grficas Circulares ..... 18Grfica de Stem-and-Leaf (tallos y hojas) ...... 20Diagrama de Cajas ...... 21

    Medidas de Tendencia Central ....... 22Media Aritmtica ...... 22Mediana ........ 23Moda ..... 23Medidas de Variabilidad ........... 23El Rango ........ 23La Varianza ....... 23Desviacin Estndar ...... 23Coeficiente de Variacin ........23

    Distribuciones de Probabilidad ....26Distribucin Binomial .......... 26Distribucin Normal ......... 29

    Cotejando si hay Normalidad ......... 31Regresin Lineal ......... 33

    Regresin Lineal Simple ....... 33Interpretacin de los Coeficientes de Regresin ........... 37

    Distribuciones Muestrales ....... 41Distribucin de la Media Muestral cuando la Poblacin es Normal ......... 41El Teorema de Lmite Central ........41

    49