Diapositivas a Primera Parte

1

ESTADISTICA EN QUIMICA ANALITICAESTADISTICA EN QUIMICA ANALITICA

RESULTADOS CUANTITATIVOS ⇒ Deben ser válidos(estimación de errores)

•Precisos

•ExactosADQUISICION

DE DATOS

2

DE DATOS

DISEÑO

EXPERIMENTALANALISIS

MANIPULACION

DE DATOS

DURANTE

DESPUESANTES

CALIDAD CONFIABILIDAD

RESULTADO CONFIABLE

RESULTADO VALIDO

3

VALIDEZ : GRADO AL CUAL UNA

MEDICION (REALIZADA MEDIANTE UN INSTRUMENTO Y/O PROCEDIMIENTO ANALITICO ESPECIFICOS) PRODUCE EL RESULTADO ESPERADO

CLASES DE ERRORESCLASES DE ERRORES

Errores crasos

* Muy graves, abandonar el experimento

Errores aleatorios o indeterminados

* Producen una dispersión de los resultados

4

* Producen una dispersión de los resultados individuales a ambos lados de un valor medio

Errores sistemáticos o determinados

* Concordancia o proximidad al valor real, todos los resultados son erróneos en el mismo sentido (SESGO)

Resultado correcto

a

b

5

c

10.09.7 10.3d

6

ERRORES ALEATORIOS

� Se relacionan con la precisión

� NUNCA se pueden eliminar

Reproducibilidad : Concordancia de los valores cuando las mediciones individuales se realizan en condiciones no repetitivas

7

� Ocasiones diferentes

� Soluciones diferentes

� Variabilidad ambiental

� Material de vidrio diferente

Repetibilidad : Concordancia de los valores cuando las mediciones individuales se realizan en condiciones repetitivas

ERRORES SISTEMÁTICOS

� Se pueden eliminar con controles adecuados de la técnica y el equipo

EXISTE ERROR SISTEMÁTICO?

Se debe de conocer el valor verdadero

⇓⇓⇓⇓

8

verdadero

POCO PROBABLE⇓⇓⇓⇓

Fácil de cometer Fácil de cometer errores sistemáticoserrores sistemáticos

CAUSAS DE ERRORES SISTEMÁTICOS

1. Contaminación por el material usado y reactivos utilizados

2. Lavado incompleto en análisis gravimétrico

9

3. Error del indicador en análisis volumétrico

4. Descalibración de equipos instrumentales (pH-metros, termómetros, cronómetros, monocromadores descalibrados, ect.)

ERRORES SISTEMÁTICOS

Los errores sistemáticos se pueden eliminar o minimizar usando materiales de referencia y métodos estándar

10

Se puede evidenciar un error sistemático analizando el analito por dos métodos no

relacionados

SOLO ERRORES ALEATORIOSSOLO ERRORES ALEATORIOS

ESTADÍSTICA

Herramienta utilizada para discriminar entre las partes sistemática (determinada) y al azar (indeterminada) de

una señal

11

Total Sistemática Al azar

error = ∆ + δ

Objetivo de una medición

POBLACION Y MUESTRA

� POBLACIÓN� Colección completa de objetos que comparten

una o más características

� Número infinito de resultados que, se puede

12

� Número infinito de resultados que, se puede obtener con una infinita cantidad de muestra y en una infinita cantidad de tiempo

� MUESTRAUn subconjunto de una población

Leyes de la estadística

sólo para poblaciones

13

Leyes de la estadística para muestras

La muestra debe ser representativa de la población

MEDIA

� POBLACIÓN:

n

xn

i

n

i∑=

∞→= 1limµ

14

� MUESTRA:

nn ∞→

n

xx

n

i

i∑== 1

DESVIACIÓN ESTÁNDAR

� POBLACIÓN:

n

xn

ii

n

∑=

∞→

−= 1

2)(

limµ

σ

15

� MUESTRA:

nn ∞→

1

)(1

2

−

−=∑

=

n

xxs

n

ii σσσσn-1 en calculadora

DESVIACIÓN ESTANDAR RELATIVA (RSD) [COEFICIENTE DE VARIACIÓN (CV)]

x

sRSD =

16

100% ⋅=x

sRSD

VARIANZA S2

GRADOS DE LIBERTAD

Ejemplo:

• ESCOJA UN TOTAL DE 5 VALORES AL AZAR :

3 5 17 2 10

5 GRADOS DE LIBERTAD

� Número de valores no restringidos

17


• ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8:3 5 17 2


Para obtener un promedio de 8 después de escojer los primeros 4 valores, el 13 y solamente el 13 puede ser el 5 o valor

13

GRADOS DE LIBERTAD• ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8 Y

UNA DESVIACION ESTANDAR DE 6 :3 5 17


Para obtener un promedio de 8 y una desviación estándar de 6, solamente los numeros 3.725 y 11.275 pueden ser el 4oy

3.725 11.275

18

EN GENERAL:

GL= n - m

Grados de libertad

Número de datos

Parámetrosestadísticos calculados

6, solamente los numeros 3.725 y 11.275 pueden ser el 4oy el 5o valores, despues de escojer los primeros 3 numeros

DESVIACIÓN ESTÁNDAR PONDERADA O COMBINADA

Si se tienen varios subconjuntos de datos, se puede obtener una mejor estimación de la desviación estándar de la población mediante la combinación de datos que

usando sólo los datos de un subconjunto.

Se debe suponer que:

� Todas las mediciones presentan la misma fuente de error

19

� Todas las mediciones presentan la misma fuente de error aleatorio

� Todas las muestras deben de tener composición semejante

� Todas las muestras se deben de analizar de la misma forma

� Todas las muestras se extraen aleatoriamente de la misma población (valor común de σ)

Los subconjuntos de datos pueden ser, por ejemplo:

� valores de diversos laboratorios

� datos obtenidos en varios días

� Instrumentos diferentes


20

s1, s2, s3, sk ⇒ desviaciones estándar de los subconjuntos

gl1, gl2, gl3, glk ⇒ grados de libertad de los subconjuntos

La determinación de metil mercurio en peces en un área dela bahía de Buenaventura proporcionó los siguientes datos(a cada muestra se le hicieron tres preparaciones y todasprovienen de la misma población):

EJEMPLO:


21

Muestra Metil mercurio (mg/Kg)

1 1.32 1.23 1.242 2.19 1.97 2.073 1.80 1.83 1.79

Obtener el valor de scombinada (desviación estándar ponderada)

Desviación estándar

Medida de la dispersión de una serie de medidas

respecto a un valor medio

Tablas de frecuencias e

Indica la forma de la distribución alrededor

22

frecuencias e histogramas

distribución alrededor de un valor medio

Muestra de gran tamaño

1. La media de la muestra es una estimación de µ

2. La desviación estándar de la muestra es una estimación de σ

DISTRIBUCIÓN DE MEDIDAS REPETIDAS

En un laboratorio de control de calidad seobtuvieron en los últimos 70 análisis datos del nivelde tensoactivo en un Shampoo (%). Construya unhistograma.

10 17 9 17 18 20 167 17 19 13 15 14 13

23

7 17 19 13 15 14 1312 13 15 14 13 10 1411 15 14 11 15 15 169 18 15 12 14 13 1413 14 16 15 16 15 1514 15 15 16 13 12 1610 16 14 13 16 14 156 15 13 16 15 16 1612 14 16 15 16 13 15

TABLA DE FRECUENCIAS

% Ten. Frecuencia6 17 19 2

10 311 212 413 1014 11

HISTOGRAMA

12

14

16

Fre

cuen

cia

La distribución de las mediciones es cercanamente simétrica con

respecto a la media

24

14 1115 1616 1317 318 219 120 1

0

2

4

6

8

10

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

% TensoactivoF

recu

enci

a

Al aumentar el número de datos la simetría se hace más aparente

LA DISTRIBUCION NORMAL (GAUSSIANA)

25

Distribuciones normales con la misma media pero diferentes

valores de la desviación estándar( ) πσσµ 2]2exp[ 22−−= xy

PROPIEDADES DE LA DISTRIBUCIÓN NORMAL

26

Distribución normal estandarizada

Z=(Xi-µµµµ)/σσσσ

Áreas bajo la curva de Gauss para varios valores de ± z

27


28


29


30


31

F(z), función de distribución acumulativa normal están dar

32

EJEMPLO

Si las medidas repetidas de una valoración sedistribuyen de forma normal con media de 10.15 mL ydesviación estándar de 0.02 mL, encontrar la proporciónde medidas que caen entre 10.12 y 10.20 mL.

*Para 10.12 z= (10.12 – 10.15)/0.02= -1.5

33

*Para 10.12 z= (10.12 – 10.15)/0.02= -1.5

F(-1.5)= 0.0668

*Para 10.20 z= (10.20 – 10.15)/0.02= 2.5

F(2.5)= 0.9938

Proporción de medidas 0.9938 – 0.0668 = 0.927

EJERCICIOS

1- El valor medio del peso de una marca de jabóndurante el año pasado fue de 0,297 kg, sudesviación estándar fue 0,024 kg. Calcule elporcentaje de datos que está comprendidodebajo del límite de especificación de 0,274 kg.

34

2- Con los datos anteriores, calcule el porcentaje de datos comprendidos arriba de 0,347 kg.

3- Se desea que el 12.1 % del voltaje de línea esté pordebajo de los 115 V, ¿cómo habrá que ajustar elvoltaje medio? La dispersión es de σ=1.20 V.

DISTRIBUCIONES LOG-NORMAL

Distribución diferente a la normal al representar lafrecuencia frente a la concentración (u otra característica),pero su frecuencia representada frente al logaritmo de laconcentración (u otra característica) proporciona una curvade distribución normal.

35

Ejemplo: Concentración del anticuerpo inmunoglobulina M en suero de individuos machos

DISTRIBUCIÓN MUESTRAL DE LA MEDIA

� La media de una serie de medidas proporciona unaestimación del valor verdadero, µ, (en ausencia deerrores sistemáticos ).

� Aun sin errores sistemáticos, las medidas individualesvarían por errores aleatorios y es poco probable que sumedia corresponda en forma exacta al valor verdadero.

36

media corresponda en forma exacta al valor verdadero.

� Es más útil proporcionar un intervalo de valores dondesea probable que se encuentre el valor verdadero.

El intervalo depende de:

1. Precisión de las medidas individuales (σ)

2. Número de medidas de la muestra

0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47

0.51 0.52 0.56 0.48 0.49 0.50 0.52 0.49 0.49 0.50

0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47

0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48

0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51

0.506 0.504 0.502 0.496 0.502 0.492 0.506 0.504 0.500 0.486

DISTRIBUCIÓN MUESTRAL DE LA MEDIA

37

Medias de cinco valores con menor dispersión respecto a todos los 50 datos originales

Su desviación estándar es el error estándar de la media e.e.m.

e.e.m.= σσσσ/√√√√n

TEOREMA DEL LIMITE CENTRAL

Aún si la población original no es normalmentedistribuida, la distribución de las medias tiende a sermás normalmente distribuida a medida que n aumenta

CONFIABILIDAD DE UN RESULTADO ANALÍTICO:

38

INTERVALO DE CONFIANZA:Rango dentro del cual se puede asumir razonablementeque se encuentra el valor real a determinada probabilidad.

LÍMITES DE CONFIAZA:Son los valores extremos de ese rango

Resultado analítico = x ± Intervalo de confianza

DISTRIBUCIÓN MUESTRAL DE

LA MEDIA

39

µµµµµµµµ-1.96 * eem µµµµ+1.96 * eem

Intervalo donde se encuentra el 95% de las medias muestrales

� En la práctica se dispone habitualmente de una muestrmuestr a, de media conocida, y se busca un intervalo para µ, el valor verdadero

Si la muestra es grande, σσσσ se puede sustituir por s

40

LIMITES DE CONFIANZA

� Para muestras grandes:1.64 (90%)

z = 1.96 (95%)

2.58 (99%)

Rango dentro del cual se puede asumir razonablementeque se encuentra el valor real a determinada probabilidad.

41

2.58 (99%)

* Si se conoce σ se sustituye por s

� Para muestras pequeñas:GL: grados de libertad

P: probabilidad de que µeste dentro del rango establecido

t= f(GL, P)

Ejercicio:

Se determinó la concentración de plomo en la sangrede 50 niños de una escuela cerca de una carretera conmucho tráfico. La media fue de 10.1 ng/mL y ladesviación estándar fue de 0.6 ng/mL.

a. Calcular el intervalo de confianza de la

42

a. Calcular el intervalo de confianza de laconcentración media de plomo en todos los niñosde la escuela a un nivel de confianza del 95 %.

b. ¿Cuál debería ser el tamaño de la muestra parareducir el rango de confianza a 0.2 ng/mL (es decir,±0.1 ng/mL)?

Ejercicio:

El nivel de alcohol en tres muestras de sangre (%) es:

0.084 0.089 0.079

Calcular el intervalo de confianza al 95 % de nivel de confianza para la media:

43

a. Cuando los tres resultados son la única indicación de la precisión del método

b. Cuando con base en la experiencia propia de cientos de muestras se sabe que s=0.005 % y es buena estimación de las desviación estándar de la población, s→σ

Los límites de confianza se pueden utilizar como una prueba para detectar errores

sistemáticos

Ejemplo:

Se utilizó una solución de 0.1 M de ácido para valorar 10 mL de una solución de NaOH de 0.1 M dando los

44

mL de una solución de NaOH de 0.1 M dando los siguientes volúmenes de ácido:

9.88 10.18 10.23 10.39 10.25 mL

Calcular los límites de confianza de la media al 95 % y utilícelos para decir si existe alguna evidencia de error sistemático.

Límites de confianza de la media geométrica de una distribución log-normal

Ejemplo:

El diámetro de las gotas en un aerosol presenta uncomportamiento log-normal. Los diámetros de 10 gotasde un líquido presentan los siguientes valores enmicrómetros:

45

micrómetros:

3.43 2.56 1.34 1.13 3.56

2.01 2.23 2.78 1.12 1.65

Calcular el intervalo de confianza de la mediageométrica al 95% suponiendo que los diámetros de lasgotas se distribuyen log-normal.

PROPAGACION DEL ERROR ALEATORIO

� Los errores aleatorios se compensan entre sí

� Cada paso de un procedimiento puede tener una incertidumbre en su medida (error aleatorio)

� Al combinar las diferentes mediciones (sumas, restas,

46

� Al combinar las diferentes mediciones (sumas, restas, multiplicaciones, etc.) para calcular una cantidad final, el error aleatorio se propaga y genera una desviación estándar final

Si, (a ± 1) y (b ± 1) el error aleatorio de x NO es ± 2

x = a + b

PROPAGACIÓN DEL ERROR ALEATORIO

Suma o resta :

p, q y r son variables experimentales

47

Ejemplo :

Calcular el peso promedio y su desviación estándar delos siguientes valores: 1.56, 1.68, 2.36 g, cada uno delos pesos con una desviación estándar de ± 0.03.

sp,sq y sr sus desviaciones estándar

Multiplicación o división :


Desviación estándar relativa

48

Ejemplo :

La carga eléctrica se calcula a partir de la expresión Q=I.t,donde I es la corriente en amperios y t el tiempo ensegundos. Calcular la desviación estándar relativa de lacarga si las desviación estándar relativa de la corriente es0.030 y la del tiempo es 0.015

estándar relativa

Elevar a una potencia :


49

Ejemplo :

El producto de solubilidad del sulfato de bario es 1.3 x 10-10,con una desviación estándar de 0.1 x 10-10. Calcular ladesviación estándar de la solubilidad calculada del sulfatode bario en agua.


Logaritmo :



50

Ejemplo :

La ecuación de Nernst describe la relación entre el

potencial y la concentración del analito i expresada como

su actividad ai :

Para n = 1, ¿cuál es el error en E para una ai = 0.53 con

una incertidumbre de ± 0.05 ?

E = Eº - (0.0592/n).log ai

PROPAGACIÓN DE ERRORES SISTEMÁTICOS�El error sistemático tiene lugar en un sentido definido

y conocido.

Suma o resta :

� Los errores sistemáticos pueden ser tanto positivos como negativos y estos signos se deben de incluir

51

∆∆∆∆x = ∆∆∆∆p + ∆∆∆∆q + ∆∆∆∆r +…….

como negativos y estos signos se deben de incluir en el calculo de ∆x

Multiplicación o división :

∆∆∆∆x/x = (∆∆∆∆p/p) + (∆∆∆∆q/q) + (∆∆∆∆r/r) +….

PROPAGACIÓN DE ERRORES SISTEMÁTICOS

Logaritmo :

Elevar a una potencia :

Sin valor absoluto

52

Sin valor absoluto

Ejemplo:Calcular el error sistemático resultante en la molaridad cuando se pesa 4.1212 g de NaOH (balanza con error sistemático de -0.0030 g) y se disuelve con agua hasta un volumen de 100 mL (error sistemático del matraz: +1.5 mL)

PRUEBAS O CONTRASTES DE SIGNIFICACIÓN

�Un procedimiento sistemático que nos permite decidirsi un conjunto de mediciones repetidas muestraevidencia de error sistemático

�Prueba si son significativas las diferencias entre dosresultados (cantidad medida o resultado y la cantidadconocida o real), o se pueden justificar sólo por

53

variaciones aleatorias

�El proposito de una prueba de significación es sacaruna conclusión acerca de una población utilizandodatos provenientes de una muestra

�Se comprueba la veracidad de una hipótesis (hipótesisnula), la cual plantea que un método NO se encuentrasujeto a errores sistemáticos


� La estadística calcula la probabilidad o posibilida d de que la diferencia observada entre la media muestral ,

,y el valor verdadero, µµµµ, se debe solamente a un error aleatorio.x

54

Menor probabilidad que la hipótesis nula

sea verdadera

A menor probabilidad que

ocurra por azar(x-µ)

EjemploEjemplo :En un método para determinar plomo en sangre por absorciónatómica se obtuvierón los siguientes valores para unamuestra estándar que contiene 38.9 ppb de plomo:

38.9 37.4 37.1¿existe alguna evidencia de error sistemático?


55

¿existe alguna evidencia de error sistemático?

la pregunta es si la diferencia entre el resultado y el valor real

es estadísticamente significativa, o si se debe a meras

variaciones fortuitas (al azar)

80.37=x 964.0=s

56

SOLUCIÓN DEL EJEMPLO:PASO 1

Se plantea la hipótesis nula, Ho, de que no hay errorsistemático. Uno no sabe si esta declaración escierta o es falsa, pero será asumida cierta hastaque se pruebe que es falsa

57

PASO 2

Prueba estadística que condensa la información dela muestra en un simple número.

s

nxtcalc

µ−= 98.1

964.0

39.388.37=

−=calct

PASO 3

Comparación con valores críticos tabulados

tcrit = 4.3 (P = 95%, f = 2)

Si tcalc excede el valor crítico, la hipótesis nula se rechaza

Los valores críticos pueden intepretarse como

58

Los valores críticos pueden intepretarse como

valores que son improbables * que sean

excedidos por la prueba estadística (tcalc) si la

hipótesis nula es cierta

* A UN 95% DE CONFIANZA, LA PROBABILIDAD ES MENOR DE 5% (ES DECIR, MENOS QUE 1 EN 20)

PASO 4

Decisión: se retiene la hipótesis nula

No hay evidencia de error sistemático

tcalc < tcrit

1.98 < 4.3

59

No significa que no hay error sistemático, sino que no se ha podido probar su existencia

NOTA IMPORTANTISIMANOTA IMPORTANTISIMALA DECISION DE RETENER LA HIPOTESIS NULA NO SIGNIFICA QUE SE HA DEMOSTRADO QUE

ES CIERTA; SIMPLEMENTE SIMPLEMENTE NONO SE PUDO SE PUDO DEMOSTRAR QUE SEA FALSADEMOSTRAR QUE SEA FALSA

LA HIPOTESIS NULA SE USA LA HIPOTESIS NULA SE USA EN LAS CORTES CRIMINALESEN LAS CORTES CRIMINALES

EL ACUSADO SE ASUME “NO CULPABLE” HASTA QUE

SE DEMUESTRE QUE ES CULPABLE

VEREDICTO “NO CULPABLE” EN CORTE CRIMINAL

60

VEREDICTO “NO CULPABLE” EN CORTE CRIMINAL

LA EVIDENCIA (PRUEBAS DE SIGNIFICACION) INDICA

QUE LA HIPOTESIS NULA DEBE CONSERVARSE

CONCLUSION:

� NO SE HA DEMOSTRADO QUE EL ACUSADO ES INOCENTE...� LO QUE SE HA DEMOSTRADO ES QUE EL ACUSADO ES NO

CULPABLE

COMPARACIÓN DE LAS MEDIAS DE DOS MUESTRAS

Es una forma en la cual los resultados de un muevométodo analítico pueden comprobarse porcomparación de los resultados obtenidos utilizando unsegundo método (de referencia)

61

*Se debe conocer ⇒Método 1 Método 2

s1 s2

n1 n2

x1 x2

_ _

COMPARACIÓN DE LAS MEDIAS DE COMPARACIÓN DE LAS MEDIAS DE DOS MUESTRAS DOS MUESTRAS

CASO I

Si s1 y s2 NO son significativamente diferentes:

Hipótesis nula:Los dos métodos producen el mismo resultado

62

21

21

calc

n1

n1

s

xxt

+

−=

Prueba estadística

21

2

22

2

112

ffsfsf

s++=

f1 grados de libertad método 1 f2 grados de libertad método 2

tcalc tiene (n1+n2-2) grados de libertadEstimación conjunta de la desviación estándar


Ejemplo:

Se compararon dos métodos para la determinación de boro en material vegetal

Método espectrofotométrico (1) Método fluorimétrico (2)

63

S1= 0.3 S2= 0.23

n1= 10 n2= 10

28.0X 1 = 26.25X2

=

¿Estos dos métodos dan resultados cuyas medidas difieren significativamente a un nivel de confianza del 95 %?

Ejemplo:

Se compararon dos métodos para la determinación de cromo en muestras de hierba de centeno:

Método (1) Método (2)

1.48mg/KgX = 2.33mg/KgX =


64

S1= 0.28 S2= 0.31

n1= 5 n2= 5


� ¿Estos dos métodos dan resultados cuyas medidas difieren significativamente a un nivel de confianza del 95 %?

� Si la hipótesis nula fuera verdadera ¿la probabilidad de que la diferencia de las medias se deba al azar será menor de 1 en 100?


CASO II

Si s1 y s2 son significativamente diferentes:

Hipótesis nula:Los dos métodos producen el mismo resultado

Grados de libertad

65

Prueba estadística

2

2

2

1

2

1

21

calc

ns

ns

xxt

+

−= 2

1n

ns

1n

ns

ns

ns

f

2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

−

+

++

+=

Grados de libertad

Se redondea al entero más cercano

Ejemplo:

La siguiente tabla proporciona la concentración de tiol en sangre de dos grupos de voluntarios, el primer grupo es “normal” y el segundo sufre de artritis reumatoide:

Concentracion de tiol (mM)


66

Normal Reumatoide

1.84 2.81

1.92 4.06

1.94 3.62

1.92 3.27

1.85 3.27

1.91 3.76

2.07

Concentracion de tiol (mM)

¿Son los resultados de estas dos muestras significativamente diferentes a una P=0.005?

¿Qué prueba t utilizar?

σ1 = σ2?SI

NO

xx −

CASO II

CASO I

21

21

11nn

s

xxt calc

+

−=

67

2

22

1

21

21

n

s

n

s

xxt calc

+

−=

2

11 2

2

2

22

1

2

1

21

2

2

22

1

21

−

+

++

+

=

n

n

s

n

n

s

n

s

n

s

f 21 fff +=

21

21

222

2112

ff

sfsfs

++=

LA PRUEBA t POR PAREJAS

Circunstancias en las cuales es necesario o deseablehacer una comparacion de medias por parejas

� Circunstancias en las cuales es necesario o deseablehacer una comparación de medias por parejas

� Muestras de origenes diferentes y posiblemente con

68

� Muestras de origenes diferentes y posiblemente conconcentraciones diferentes

� Muestras que se reciben en un período de tiempo largo (sehace necesario eliminar efectos de condicionesambientales variables como temperatura, presión, etc.)

Se asume que cualquier error (sistemático o al azar) es independiente de la concentración

Ejemplo :La siguiente tabla proporciona la concentración de plomo(mg/ml) por dos métodos diferentes para 4 muestras:

Muestra Método 1 Método 2

1 71 76

2 61 68


69

2 61 68

3 50 48

4 60 57

• Los dos métodos proporcionan valores para lasconcentraciones medias de plomo que difieransignificativamente?

Solución al ejemplo :� Se observa la diferencia entre cada par de resultados dados

por los dos métodos

� Hipótesis nula : No existen diferencias significativas en las concentraciones dadas por los dos métodos

Se debe de probar si la media de las diferencias


70

Se debe de probar si la media de las diferencias difiere significativamente de cero

1.75X d −= 4.99sd =

Medias de las

diferencias

Desviación estándar de las

diferencias

Muestras Diferencias

1 -5

2 -7

3 2

4 3

Solución al ejemplo :

µd ⇒⇒⇒⇒ Valor real de las diferencias

µd=0

XXXXμμμμXXXX dddddddddddd −

Prueba estadística

Tiene (n-1)


71

nnnnssssXXXX

nnnnssssμμμμXXXX

ttttdddd

dddd

dddd

dddddddd

calc

calc

calc

calc

=−

=Tiene (n-1) grados de libertad

0.70

0.70

0.70

0.70

44444.99

4.99

4.99

4.99

1.75

1.75

1.75

1.75

ttttcalc

calc

calc

calc

=−

=

tcrit =3.18 (P=0.05, f=3)

tcalc < tcrit

Se acepta la hipótesis nula

Ejemplo :

Se analiza la concentración de paracetamol (% p/p) enpastillas por dos métodos diferentes. Se analizarondiez patillas de diez lotes diferentes para ver si diferíanlos resultados obtenidos por los dos métodos.

Lote Método UV Método IR


72

1 84.63 83.15

2 84.38 83.72

3 84.08 83.84

4 84.41 84.20

5 83.82 83.92

6 38.55 84.16

7 83.92 84.02

8 83.69 83.60

9 84.06 84.13

10 84.03 84.24

� Mediante una prueba t por parejas contrastar si los dos métodos producen resultados significativamente diferentes

LAS PRUEBAS DE UNA Y DOS COLAS

Diferencia de dos mediasen cualquier dirección, nose tiene en cuenta el

DOS COLAS (bilateral) UNA COLA (unilateral)

Se tiene una idea preconcebida sobre el signo de la diferencia

73

se tiene en cuenta elsigno de la diferencia

signo de la diferencia

( ) −+− oooo,,,,μμμμXXXX( )μμμμXXXX−

Se conoce su signoNo se tiene una

idea preconcebida del signo de la

diferencia

DOS COLAS (bilateral) UNA COLA (unilateral)

LAS PRUEBAS DE UNA Y DOS COLAS

Incremento

74

A un n dado yuna determinadaprobabilidad, sedetermina tcrit

95% ⇒ P=0.05

µµµµ +

µµµµ_

Decremento

µµµµ +_

UNA COLA (unilateral)

La probabilidad es la mitad de la probabilidad en una bilateral

0.05 x 2 = 0.10

El tcrit se determina en la columna P = 0.10

Ejemplo :

75

Ejemplo :Se sospecha que una valoración acido-base tiene un error deindicador significativo y tiende a dar resultados con un errorsistemático positivo (sesgo positivo). Para comprobarlo, se utilizauna disolución de ácido exactamente 0.1 M para valorar 25.00 mLde otra disolución de una base, exactamente 0.1 M con lossiguientes resultados (mL):

25.06 25.18 24.87 25.51 25.34 25.41

• Probar la existencia de sesgo positivo en estos res ultados

EL CONTRASTE F PARA LA COMPARACIÓN DE DESVIACIONES ESTÁNDAR

� Las pruebas anteriores (t) comparan medias y detectan errores sistemáticos

� La prueba F compara desviaciones estándar , o sea los errores aleatorios de dos conjuntos de datos

USOS:

76

USOS:

1. Probar si el método A es más preciso que el método B(prueba de una cola). Se tiene una idea predeterminadaque un método es MÁS preciso que el otro.

2. Probar si los métodos A y B difieren en su precisión(prueba de dos colas). No se tiene idea preconcebida decual es más preciso.

antes de una prueba t

� El contraste F considera la razón de las dos varianzas muestrales:

2

2

1

cal ss

F = F siempre debe ser ≥≥≥≥ 1


77

2s

� Se asume que las poblaciones de donde se toman las muestras son normales

H0 : Las desviaciones estándar de las poblacionesno difieren significativamente (la relación devarianzas es próxima a la unidad)

Método (1) Método (2)

S1= 0.28 S2= 0.31

n = 5 n = 5


Ejemplo : Se compararon dos métodos para la determinación de cromo en muestras de hierba de centeno:

� ¿Las varianzas de ambos métodos son significativamente iguales?


78

n1= 5 n2= 5 iguales?

Ejemplo : Se compara un método propuesto para la determinación de la demanda de oxígeno (ppm) en aguas con un método estándar.

Método estándar (1): media: 72 s 1=3.31 n=8

Método propuesto (2): media: 72 s 2=1.51 n=8

¿Es más preciso el método propuesto que el método estándar?

79

CONTRASTE DE DIXON PARA DATOS ANNOMALOS (Contraste Q)

� Es una prueba con la cual se contrastan estadísticamente datos anómalos para determinar si se rechazan o no (para muestras pequeñas, de 3 a 7 datos).

Ho: Todas las medidas provienen de la misma población

(resultado sospechoso - resultado más próximo)Q =

80

(resultado sospechoso - resultado más próximo)rango de resultados

Qcalc=

� Si Qcalc > Qcrit , el resultado sospechoso puede descartarseValores críticos de Q (P=0.05), contraste de dos co las

Tamaño de muestra Valor crítico

4 0.831

5 0.717

6 0.621

7 0.570

Ejemplo:

1. Se obtuvieron los siguientes valores para la concentración de nitrito (ppm) en una muestra de agua de río:

¿Debería rechazarse la última medida sospechosa?

0.403 0.410 0.401 0.380

CONTRASTE DE DIXON PARA DATOS ANNOMALOS (Contraste Q)

81

2. A los datos anteriores se adicionaron otras tres nuevas medidas,

¿Se debería aún mantener el valor 0.380?

0.403 0.410 0.401 0.380 0.400 0.413 0.411

CONTRASTE DE GRUBBS (Contraste G)

� También usado para datos anómalos

Ho: Todas las medidas provienen de la misma población

Gcalc=valor sospechoso - x

s

82

Ejemplo:

Aplicar el contraste de Grubbs a los datos del último ejemplo

s

EjerciciosDatos

ADatos

B

1.84 2.81

1.92 4.06

1.94 3.62

1.92 3.27

1.85 3.27

1.91 3.76

2.07

1. Realizar los contrastes Q y G para el valor 2.07 de los datos A y el valor 2.81 de los datos B, ¿son datos anómalos?

2. Demostrar si las varianzas de los dos grupos de datos difieren significativamente.

83

3. Los siguientes datos proporcionan la recuperación de bromuroadicionado a muestras con contenido vegetal, medido mediante unmétodo de cromatografía gas-líquido. La cantidad de bromuro potásicoañadido a cada vegetal fue la misma.Tomate 777 790 759 790 770 758 764 µµµµg/gPepino 782 773 778 765 789 797 782 µµµµg/ga) Pruebe si la recuperación en los vegetales tiene varianzas que difieran

significativamente.b) Pruebe si las tasas de recuperación media difieren significativamente.

Documents

Diapositivas a Primera Parte