Upload
leidy-cifuentes
View
423
Download
1
Embed Size (px)
Citation preview
1
ESTADISTICA EN QUIMICA ANALITICAESTADISTICA EN QUIMICA ANALITICA
RESULTADOS CUANTITATIVOS ⇒ Deben ser válidos(estimación de errores)
•Precisos
•ExactosADQUISICION
DE DATOS
2
DE DATOS
DISEÑO
EXPERIMENTALANALISIS
MANIPULACION
DE DATOS
DURANTE
DESPUESANTES
CALIDAD CONFIABILIDAD
RESULTADO CONFIABLE
RESULTADO VALIDO
3
VALIDEZ : GRADO AL CUAL UNA
MEDICION (REALIZADA MEDIANTE UN INSTRUMENTO Y/O PROCEDIMIENTO ANALITICO ESPECIFICOS) PRODUCE EL RESULTADO ESPERADO
CLASES DE ERRORESCLASES DE ERRORES
Errores crasos
* Muy graves, abandonar el experimento
Errores aleatorios o indeterminados
* Producen una dispersión de los resultados
4
* Producen una dispersión de los resultados individuales a ambos lados de un valor medio
Errores sistemáticos o determinados
* Concordancia o proximidad al valor real, todos los resultados son erróneos en el mismo sentido (SESGO)
Resultado correcto
a
b
5
c
10.09.7 10.3d
6
ERRORES ALEATORIOS
� Se relacionan con la precisión
� NUNCA se pueden eliminar
Reproducibilidad : Concordancia de los valores cuando las mediciones individuales se realizan en condiciones no repetitivas
7
� Ocasiones diferentes
� Soluciones diferentes
� Variabilidad ambiental
� Material de vidrio diferente
Repetibilidad : Concordancia de los valores cuando las mediciones individuales se realizan en condiciones repetitivas
ERRORES SISTEMÁTICOS
� Se pueden eliminar con controles adecuados de la técnica y el equipo
EXISTE ERROR SISTEMÁTICO?
Se debe de conocer el valor verdadero
⇓⇓⇓⇓
8
verdadero
POCO PROBABLE⇓⇓⇓⇓
Fácil de cometer Fácil de cometer errores sistemáticoserrores sistemáticos
CAUSAS DE ERRORES SISTEMÁTICOS
1. Contaminación por el material usado y reactivos utilizados
2. Lavado incompleto en análisis gravimétrico
9
3. Error del indicador en análisis volumétrico
4. Descalibración de equipos instrumentales (pH-metros, termómetros, cronómetros, monocromadores descalibrados, ect.)
ERRORES SISTEMÁTICOS
Los errores sistemáticos se pueden eliminar o minimizar usando materiales de referencia y métodos estándar
10
Se puede evidenciar un error sistemático analizando el analito por dos métodos no
relacionados
SOLO ERRORES ALEATORIOSSOLO ERRORES ALEATORIOS
ESTADÍSTICA
Herramienta utilizada para discriminar entre las partes sistemática (determinada) y al azar (indeterminada) de
una señal
11
Total Sistemática Al azar
error = ∆ + δ
Objetivo de una medición
POBLACION Y MUESTRA
� POBLACIÓN� Colección completa de objetos que comparten
una o más características
� Número infinito de resultados que, se puede
12
� Número infinito de resultados que, se puede obtener con una infinita cantidad de muestra y en una infinita cantidad de tiempo
� MUESTRAUn subconjunto de una población
Leyes de la estadística
sólo para poblaciones
13
Leyes de la estadística para muestras
La muestra debe ser representativa de la población
MEDIA
� POBLACIÓN:
n
xn
i
n
i∑=
∞→= 1limµ
14
� MUESTRA:
nn ∞→
n
xx
n
i
i∑== 1
DESVIACIÓN ESTÁNDAR
� POBLACIÓN:
n
xn
ii
n
∑=
∞→
−= 1
2)(
limµ
σ
15
� MUESTRA:
nn ∞→
1
)(1
2
−
−=∑
=
n
xxs
n
ii σσσσn-1 en calculadora
DESVIACIÓN ESTANDAR RELATIVA (RSD) [COEFICIENTE DE VARIACIÓN (CV)]
x
sRSD =
16
100% ⋅=x
sRSD
VARIANZA S2
GRADOS DE LIBERTAD
Ejemplo:
• ESCOJA UN TOTAL DE 5 VALORES AL AZAR :
3 5 17 2 10
5 GRADOS DE LIBERTAD
� Número de valores no restringidos
17
5 GRADOS DE LIBERTAD
• ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8:3 5 17 2
4 GRADOS DE LIBERTAD
Para obtener un promedio de 8 después de escojer los primeros 4 valores, el 13 y solamente el 13 puede ser el 5 o valor
13
GRADOS DE LIBERTAD• ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8 Y
UNA DESVIACION ESTANDAR DE 6 :3 5 17
3 GRADOS DE LIBERTAD
Para obtener un promedio de 8 y una desviación estándar de 6, solamente los numeros 3.725 y 11.275 pueden ser el 4oy
3.725 11.275
18
EN GENERAL:
GL= n - m
Grados de libertad
Número de datos
Parámetrosestadísticos calculados
6, solamente los numeros 3.725 y 11.275 pueden ser el 4oy el 5o valores, despues de escojer los primeros 3 numeros
DESVIACIÓN ESTÁNDAR PONDERADA O COMBINADA
Si se tienen varios subconjuntos de datos, se puede obtener una mejor estimación de la desviación estándar de la población mediante la combinación de datos que
usando sólo los datos de un subconjunto.
Se debe suponer que:
� Todas las mediciones presentan la misma fuente de error
19
� Todas las mediciones presentan la misma fuente de error aleatorio
� Todas las muestras deben de tener composición semejante
� Todas las muestras se deben de analizar de la misma forma
� Todas las muestras se extraen aleatoriamente de la misma población (valor común de σ)
Los subconjuntos de datos pueden ser, por ejemplo:
� valores de diversos laboratorios
� datos obtenidos en varios días
� Instrumentos diferentes
DESVIACIÓN ESTÁNDAR PONDERADA O COMBINADA
20
s1, s2, s3, sk ⇒ desviaciones estándar de los subconjuntos
gl1, gl2, gl3, glk ⇒ grados de libertad de los subconjuntos
La determinación de metil mercurio en peces en un área dela bahía de Buenaventura proporcionó los siguientes datos(a cada muestra se le hicieron tres preparaciones y todasprovienen de la misma población):
EJEMPLO:
DESVIACIÓN ESTÁNDAR PONDERADA O COMBINADA
21
Muestra Metil mercurio (mg/Kg)
1 1.32 1.23 1.242 2.19 1.97 2.073 1.80 1.83 1.79
Obtener el valor de scombinada (desviación estándar ponderada)
Desviación estándar
Medida de la dispersión de una serie de medidas
respecto a un valor medio
Tablas de frecuencias e
Indica la forma de la distribución alrededor
22
frecuencias e histogramas
distribución alrededor de un valor medio
Muestra de gran tamaño
1. La media de la muestra es una estimación de µ
2. La desviación estándar de la muestra es una estimación de σ
DISTRIBUCIÓN DE MEDIDAS REPETIDAS
En un laboratorio de control de calidad seobtuvieron en los últimos 70 análisis datos del nivelde tensoactivo en un Shampoo (%). Construya unhistograma.
10 17 9 17 18 20 167 17 19 13 15 14 13
23
7 17 19 13 15 14 1312 13 15 14 13 10 1411 15 14 11 15 15 169 18 15 12 14 13 1413 14 16 15 16 15 1514 15 15 16 13 12 1610 16 14 13 16 14 156 15 13 16 15 16 1612 14 16 15 16 13 15
TABLA DE FRECUENCIAS
% Ten. Frecuencia6 17 19 2
10 311 212 413 1014 11
HISTOGRAMA
12
14
16
Fre
cuen
cia
La distribución de las mediciones es cercanamente simétrica con
respecto a la media
24
14 1115 1616 1317 318 219 120 1
0
2
4
6
8
10
6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
% TensoactivoF
recu
enci
a
Al aumentar el número de datos la simetría se hace más aparente
LA DISTRIBUCION NORMAL (GAUSSIANA)
25
Distribuciones normales con la misma media pero diferentes
valores de la desviación estándar( ) πσσµ 2]2exp[ 22−−= xy
PROPIEDADES DE LA DISTRIBUCIÓN NORMAL
26
Distribución normal estandarizada
Z=(Xi-µµµµ)/σσσσ
Áreas bajo la curva de Gauss para varios valores de ± z
27
Áreas bajo la curva de Gauss para varios valores de ± z
28
Áreas bajo la curva de Gauss para varios valores de ± z
29
Áreas bajo la curva de Gauss para varios valores de ± z
30
Áreas bajo la curva de Gauss para varios valores de ± z
31
F(z), función de distribución acumulativa normal están dar
32
EJEMPLO
Si las medidas repetidas de una valoración sedistribuyen de forma normal con media de 10.15 mL ydesviación estándar de 0.02 mL, encontrar la proporciónde medidas que caen entre 10.12 y 10.20 mL.
*Para 10.12 z= (10.12 – 10.15)/0.02= -1.5
33
*Para 10.12 z= (10.12 – 10.15)/0.02= -1.5
F(-1.5)= 0.0668
*Para 10.20 z= (10.20 – 10.15)/0.02= 2.5
F(2.5)= 0.9938
Proporción de medidas 0.9938 – 0.0668 = 0.927
EJERCICIOS
1- El valor medio del peso de una marca de jabóndurante el año pasado fue de 0,297 kg, sudesviación estándar fue 0,024 kg. Calcule elporcentaje de datos que está comprendidodebajo del límite de especificación de 0,274 kg.
34
2- Con los datos anteriores, calcule el porcentaje de datos comprendidos arriba de 0,347 kg.
3- Se desea que el 12.1 % del voltaje de línea esté pordebajo de los 115 V, ¿cómo habrá que ajustar elvoltaje medio? La dispersión es de σ=1.20 V.
DISTRIBUCIONES LOG-NORMAL
Distribución diferente a la normal al representar lafrecuencia frente a la concentración (u otra característica),pero su frecuencia representada frente al logaritmo de laconcentración (u otra característica) proporciona una curvade distribución normal.
35
Ejemplo: Concentración del anticuerpo inmunoglobulina M en suero de individuos machos
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
� La media de una serie de medidas proporciona unaestimación del valor verdadero, µ, (en ausencia deerrores sistemáticos ).
� Aun sin errores sistemáticos, las medidas individualesvarían por errores aleatorios y es poco probable que sumedia corresponda en forma exacta al valor verdadero.
36
media corresponda en forma exacta al valor verdadero.
� Es más útil proporcionar un intervalo de valores dondesea probable que se encuentre el valor verdadero.
El intervalo depende de:
1. Precisión de las medidas individuales (σ)
2. Número de medidas de la muestra
0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47
0.51 0.52 0.56 0.48 0.49 0.50 0.52 0.49 0.49 0.50
0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47
0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48
0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51
0.506 0.504 0.502 0.496 0.502 0.492 0.506 0.504 0.500 0.486
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
37
Medias de cinco valores con menor dispersión respecto a todos los 50 datos originales
Su desviación estándar es el error estándar de la media e.e.m.
e.e.m.= σσσσ/√√√√n
TEOREMA DEL LIMITE CENTRAL
Aún si la población original no es normalmentedistribuida, la distribución de las medias tiende a sermás normalmente distribuida a medida que n aumenta
CONFIABILIDAD DE UN RESULTADO ANALÍTICO:
38
INTERVALO DE CONFIANZA:Rango dentro del cual se puede asumir razonablementeque se encuentra el valor real a determinada probabilidad.
LÍMITES DE CONFIAZA:Son los valores extremos de ese rango
Resultado analítico = x ± Intervalo de confianza
DISTRIBUCIÓN MUESTRAL DE
LA MEDIA
39
µµµµµµµµ-1.96 * eem µµµµ+1.96 * eem
Intervalo donde se encuentra el 95% de las medias muestrales
� En la práctica se dispone habitualmente de una muestrmuestr a, de media conocida, y se busca un intervalo para µ, el valor verdadero
Si la muestra es grande, σσσσ se puede sustituir por s
40
LIMITES DE CONFIANZA
� Para muestras grandes:1.64 (90%)
z = 1.96 (95%)
2.58 (99%)
Rango dentro del cual se puede asumir razonablementeque se encuentra el valor real a determinada probabilidad.
41
2.58 (99%)
* Si se conoce σ se sustituye por s
� Para muestras pequeñas:GL: grados de libertad
P: probabilidad de que µeste dentro del rango establecido
t= f(GL, P)
Ejercicio:
Se determinó la concentración de plomo en la sangrede 50 niños de una escuela cerca de una carretera conmucho tráfico. La media fue de 10.1 ng/mL y ladesviación estándar fue de 0.6 ng/mL.
a. Calcular el intervalo de confianza de la
42
a. Calcular el intervalo de confianza de laconcentración media de plomo en todos los niñosde la escuela a un nivel de confianza del 95 %.
b. ¿Cuál debería ser el tamaño de la muestra parareducir el rango de confianza a 0.2 ng/mL (es decir,±0.1 ng/mL)?
Ejercicio:
El nivel de alcohol en tres muestras de sangre (%) es:
0.084 0.089 0.079
Calcular el intervalo de confianza al 95 % de nivel de confianza para la media:
43
a. Cuando los tres resultados son la única indicación de la precisión del método
b. Cuando con base en la experiencia propia de cientos de muestras se sabe que s=0.005 % y es buena estimación de las desviación estándar de la población, s→σ
Los límites de confianza se pueden utilizar como una prueba para detectar errores
sistemáticos
Ejemplo:
Se utilizó una solución de 0.1 M de ácido para valorar 10 mL de una solución de NaOH de 0.1 M dando los
44
mL de una solución de NaOH de 0.1 M dando los siguientes volúmenes de ácido:
9.88 10.18 10.23 10.39 10.25 mL
Calcular los límites de confianza de la media al 95 % y utilícelos para decir si existe alguna evidencia de error sistemático.
Límites de confianza de la media geométrica de una distribución log-normal
Ejemplo:
El diámetro de las gotas en un aerosol presenta uncomportamiento log-normal. Los diámetros de 10 gotasde un líquido presentan los siguientes valores enmicrómetros:
45
micrómetros:
3.43 2.56 1.34 1.13 3.56
2.01 2.23 2.78 1.12 1.65
Calcular el intervalo de confianza de la mediageométrica al 95% suponiendo que los diámetros de lasgotas se distribuyen log-normal.
PROPAGACION DEL ERROR ALEATORIO
� Los errores aleatorios se compensan entre sí
� Cada paso de un procedimiento puede tener una incertidumbre en su medida (error aleatorio)
� Al combinar las diferentes mediciones (sumas, restas,
46
� Al combinar las diferentes mediciones (sumas, restas, multiplicaciones, etc.) para calcular una cantidad final, el error aleatorio se propaga y genera una desviación estándar final
Si, (a ± 1) y (b ± 1) el error aleatorio de x NO es ± 2
x = a + b
PROPAGACIÓN DEL ERROR ALEATORIO
Suma o resta :
p, q y r son variables experimentales
47
Ejemplo :
Calcular el peso promedio y su desviación estándar delos siguientes valores: 1.56, 1.68, 2.36 g, cada uno delos pesos con una desviación estándar de ± 0.03.
sp,sq y sr sus desviaciones estándar
Multiplicación o división :
PROPAGACIÓN DEL ERROR ALEATORIO
Desviación estándar relativa
48
Ejemplo :
La carga eléctrica se calcula a partir de la expresión Q=I.t,donde I es la corriente en amperios y t el tiempo ensegundos. Calcular la desviación estándar relativa de lacarga si las desviación estándar relativa de la corriente es0.030 y la del tiempo es 0.015
estándar relativa
Elevar a una potencia :
PROPAGACIÓN DEL ERROR ALEATORIO
49
Ejemplo :
El producto de solubilidad del sulfato de bario es 1.3 x 10-10,con una desviación estándar de 0.1 x 10-10. Calcular ladesviación estándar de la solubilidad calculada del sulfatode bario en agua.
Desviación estándar relativa
Logaritmo :
PROPAGACIÓN DEL ERROR ALEATORIO
Desviación estándar relativa
50
Ejemplo :
La ecuación de Nernst describe la relación entre el
potencial y la concentración del analito i expresada como
su actividad ai :
Para n = 1, ¿cuál es el error en E para una ai = 0.53 con
una incertidumbre de ± 0.05 ?
E = Eº - (0.0592/n).log ai
PROPAGACIÓN DE ERRORES SISTEMÁTICOS�El error sistemático tiene lugar en un sentido definido
y conocido.
Suma o resta :
� Los errores sistemáticos pueden ser tanto positivos como negativos y estos signos se deben de incluir
51
∆∆∆∆x = ∆∆∆∆p + ∆∆∆∆q + ∆∆∆∆r +…….
como negativos y estos signos se deben de incluir en el calculo de ∆x
Multiplicación o división :
∆∆∆∆x/x = (∆∆∆∆p/p) + (∆∆∆∆q/q) + (∆∆∆∆r/r) +….
PROPAGACIÓN DE ERRORES SISTEMÁTICOS
Logaritmo :
Elevar a una potencia :
Sin valor absoluto
52
Sin valor absoluto
Ejemplo:Calcular el error sistemático resultante en la molaridad cuando se pesa 4.1212 g de NaOH (balanza con error sistemático de -0.0030 g) y se disuelve con agua hasta un volumen de 100 mL (error sistemático del matraz: +1.5 mL)
PRUEBAS O CONTRASTES DE SIGNIFICACIÓN
�Un procedimiento sistemático que nos permite decidirsi un conjunto de mediciones repetidas muestraevidencia de error sistemático
�Prueba si son significativas las diferencias entre dosresultados (cantidad medida o resultado y la cantidadconocida o real), o se pueden justificar sólo por
53
variaciones aleatorias
�El proposito de una prueba de significación es sacaruna conclusión acerca de una población utilizandodatos provenientes de una muestra
�Se comprueba la veracidad de una hipótesis (hipótesisnula), la cual plantea que un método NO se encuentrasujeto a errores sistemáticos
PRUEBAS O CONTRASTES DE SIGNIFICACIÓN
� La estadística calcula la probabilidad o posibilida d de que la diferencia observada entre la media muestral ,
,y el valor verdadero, µµµµ, se debe solamente a un error aleatorio.x
54
Menor probabilidad que la hipótesis nula
sea verdadera
A menor probabilidad que
ocurra por azar(x-µ)
EjemploEjemplo :En un método para determinar plomo en sangre por absorciónatómica se obtuvierón los siguientes valores para unamuestra estándar que contiene 38.9 ppb de plomo:
38.9 37.4 37.1¿existe alguna evidencia de error sistemático?
PRUEBAS O CONTRASTES DE SIGNIFICACIÓN
55
¿existe alguna evidencia de error sistemático?
la pregunta es si la diferencia entre el resultado y el valor real
es estadísticamente significativa, o si se debe a meras
variaciones fortuitas (al azar)
80.37=x 964.0=s
56
SOLUCIÓN DEL EJEMPLO:PASO 1
Se plantea la hipótesis nula, Ho, de que no hay errorsistemático. Uno no sabe si esta declaración escierta o es falsa, pero será asumida cierta hastaque se pruebe que es falsa
57
PASO 2
Prueba estadística que condensa la información dela muestra en un simple número.
s
nxtcalc
µ−= 98.1
964.0
39.388.37=
−=calct
PASO 3
Comparación con valores críticos tabulados
tcrit = 4.3 (P = 95%, f = 2)
Si tcalc excede el valor crítico, la hipótesis nula se rechaza
Los valores críticos pueden intepretarse como
58
Los valores críticos pueden intepretarse como
valores que son improbables * que sean
excedidos por la prueba estadística (tcalc) si la
hipótesis nula es cierta
* A UN 95% DE CONFIANZA, LA PROBABILIDAD ES MENOR DE 5% (ES DECIR, MENOS QUE 1 EN 20)
PASO 4
Decisión: se retiene la hipótesis nula
No hay evidencia de error sistemático
tcalc < tcrit
1.98 < 4.3
59
No significa que no hay error sistemático, sino que no se ha podido probar su existencia
NOTA IMPORTANTISIMANOTA IMPORTANTISIMALA DECISION DE RETENER LA HIPOTESIS NULA NO SIGNIFICA QUE SE HA DEMOSTRADO QUE
ES CIERTA; SIMPLEMENTE SIMPLEMENTE NONO SE PUDO SE PUDO DEMOSTRAR QUE SEA FALSADEMOSTRAR QUE SEA FALSA
LA HIPOTESIS NULA SE USA LA HIPOTESIS NULA SE USA EN LAS CORTES CRIMINALESEN LAS CORTES CRIMINALES
EL ACUSADO SE ASUME “NO CULPABLE” HASTA QUE
SE DEMUESTRE QUE ES CULPABLE
VEREDICTO “NO CULPABLE” EN CORTE CRIMINAL
60
VEREDICTO “NO CULPABLE” EN CORTE CRIMINAL
LA EVIDENCIA (PRUEBAS DE SIGNIFICACION) INDICA
QUE LA HIPOTESIS NULA DEBE CONSERVARSE
CONCLUSION:
� NO SE HA DEMOSTRADO QUE EL ACUSADO ES INOCENTE...� LO QUE SE HA DEMOSTRADO ES QUE EL ACUSADO ES NO
CULPABLE
COMPARACIÓN DE LAS MEDIAS DE DOS MUESTRAS
Es una forma en la cual los resultados de un muevométodo analítico pueden comprobarse porcomparación de los resultados obtenidos utilizando unsegundo método (de referencia)
61
*Se debe conocer ⇒Método 1 Método 2
s1 s2
n1 n2
x1 x2
_ _
COMPARACIÓN DE LAS MEDIAS DE COMPARACIÓN DE LAS MEDIAS DE DOS MUESTRAS DOS MUESTRAS
CASO I
Si s1 y s2 NO son significativamente diferentes:
Hipótesis nula:Los dos métodos producen el mismo resultado
62
21
21
calc
n1
n1
s
xxt
+
−=
Prueba estadística
21
2
22
2
112
ffsfsf
s++=
f1 grados de libertad método 1 f2 grados de libertad método 2
tcalc tiene (n1+n2-2) grados de libertadEstimación conjunta de la desviación estándar
COMPARACIÓN DE LAS MEDIAS DE DOS MUESTRAS
Ejemplo:
Se compararon dos métodos para la determinación de boro en material vegetal
Método espectrofotométrico (1) Método fluorimétrico (2)
63
S1= 0.3 S2= 0.23
n1= 10 n2= 10
28.0X 1 = 26.25X2
=
¿Estos dos métodos dan resultados cuyas medidas difieren significativamente a un nivel de confianza del 95 %?
Ejemplo:
Se compararon dos métodos para la determinación de cromo en muestras de hierba de centeno:
Método (1) Método (2)
1.48mg/KgX = 2.33mg/KgX =
COMPARACIÓN DE LAS MEDIAS DE DOS MUESTRAS
64
S1= 0.28 S2= 0.31
n1= 5 n2= 5
1.48mg/KgX = 2.33mg/KgX =
� ¿Estos dos métodos dan resultados cuyas medidas difieren significativamente a un nivel de confianza del 95 %?
� Si la hipótesis nula fuera verdadera ¿la probabilidad de que la diferencia de las medias se deba al azar será menor de 1 en 100?
COMPARACIÓN DE LAS MEDIAS DE DOS MUESTRAS
CASO II
Si s1 y s2 son significativamente diferentes:
Hipótesis nula:Los dos métodos producen el mismo resultado
Grados de libertad
65
Prueba estadística
2
2
2
1
2
1
21
calc
ns
ns
xxt
+
−= 2
1n
ns
1n
ns
ns
ns
f
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
−
+
++
+=
Grados de libertad
Se redondea al entero más cercano
Ejemplo:
La siguiente tabla proporciona la concentración de tiol en sangre de dos grupos de voluntarios, el primer grupo es “normal” y el segundo sufre de artritis reumatoide:
Concentracion de tiol (mM)
COMPARACIÓN DE LAS MEDIAS DE DOS MUESTRAS
66
Normal Reumatoide
1.84 2.81
1.92 4.06
1.94 3.62
1.92 3.27
1.85 3.27
1.91 3.76
2.07
Concentracion de tiol (mM)
¿Son los resultados de estas dos muestras significativamente diferentes a una P=0.005?
¿Qué prueba t utilizar?
σ1 = σ2?SI
NO
xx −
CASO II
CASO I
21
21
11nn
s
xxt calc
+
−=
67
2
22
1
21
21
n
s
n
s
xxt calc
+
−=
2
11 2
2
2
22
1
2
1
21
2
2
22
1
21
−
+
++
+
=
n
n
s
n
n
s
n
s
n
s
f 21 fff +=
21
21
222
2112
ff
sfsfs
++=
LA PRUEBA t POR PAREJAS
Circunstancias en las cuales es necesario o deseablehacer una comparacion de medias por parejas
� Circunstancias en las cuales es necesario o deseablehacer una comparación de medias por parejas
� Muestras de origenes diferentes y posiblemente con
68
� Muestras de origenes diferentes y posiblemente conconcentraciones diferentes
� Muestras que se reciben en un período de tiempo largo (sehace necesario eliminar efectos de condicionesambientales variables como temperatura, presión, etc.)
Se asume que cualquier error (sistemático o al azar) es independiente de la concentración
Ejemplo :La siguiente tabla proporciona la concentración de plomo(mg/ml) por dos métodos diferentes para 4 muestras:
Muestra Método 1 Método 2
1 71 76
2 61 68
LA PRUEBA t POR PAREJAS
69
2 61 68
3 50 48
4 60 57
• Los dos métodos proporcionan valores para lasconcentraciones medias de plomo que difieransignificativamente?
Solución al ejemplo :� Se observa la diferencia entre cada par de resultados dados
por los dos métodos
� Hipótesis nula : No existen diferencias significativas en las concentraciones dadas por los dos métodos
Se debe de probar si la media de las diferencias
LA PRUEBA t POR PAREJAS
70
Se debe de probar si la media de las diferencias difiere significativamente de cero
1.75X d −= 4.99sd =
Medias de las
diferencias
Desviación estándar de las
diferencias
Muestras Diferencias
1 -5
2 -7
3 2
4 3
Solución al ejemplo :
µd ⇒⇒⇒⇒ Valor real de las diferencias
µd=0
XXXXμμμμXXXX dddddddddddd −
Prueba estadística
Tiene (n-1)
LA PRUEBA t POR PAREJAS
71
nnnnssssXXXX
nnnnssssμμμμXXXX
ttttdddd
dddd
dddd
dddddddd
calc
calc
calc
calc
=−
=Tiene (n-1) grados de libertad
0.70
0.70
0.70
0.70
44444.99
4.99
4.99
4.99
1.75
1.75
1.75
1.75
ttttcalc
calc
calc
calc
=−
=
tcrit =3.18 (P=0.05, f=3)
tcalc < tcrit
Se acepta la hipótesis nula
Ejemplo :
Se analiza la concentración de paracetamol (% p/p) enpastillas por dos métodos diferentes. Se analizarondiez patillas de diez lotes diferentes para ver si diferíanlos resultados obtenidos por los dos métodos.
Lote Método UV Método IR
LA PRUEBA t POR PAREJAS
72
1 84.63 83.15
2 84.38 83.72
3 84.08 83.84
4 84.41 84.20
5 83.82 83.92
6 38.55 84.16
7 83.92 84.02
8 83.69 83.60
9 84.06 84.13
10 84.03 84.24
� Mediante una prueba t por parejas contrastar si los dos métodos producen resultados significativamente diferentes
LAS PRUEBAS DE UNA Y DOS COLAS
Diferencia de dos mediasen cualquier dirección, nose tiene en cuenta el
DOS COLAS (bilateral) UNA COLA (unilateral)
Se tiene una idea preconcebida sobre el signo de la diferencia
73
se tiene en cuenta elsigno de la diferencia
signo de la diferencia
( ) −+− oooo,,,,μμμμXXXX( )μμμμXXXX−
Se conoce su signoNo se tiene una
idea preconcebida del signo de la
diferencia
DOS COLAS (bilateral) UNA COLA (unilateral)
LAS PRUEBAS DE UNA Y DOS COLAS
Incremento
74
A un n dado yuna determinadaprobabilidad, sedetermina tcrit
95% ⇒ P=0.05
µµµµ +
µµµµ_
Decremento
µµµµ +_
UNA COLA (unilateral)
La probabilidad es la mitad de la probabilidad en una bilateral
0.05 x 2 = 0.10
El tcrit se determina en la columna P = 0.10
Ejemplo :
75
Ejemplo :Se sospecha que una valoración acido-base tiene un error deindicador significativo y tiende a dar resultados con un errorsistemático positivo (sesgo positivo). Para comprobarlo, se utilizauna disolución de ácido exactamente 0.1 M para valorar 25.00 mLde otra disolución de una base, exactamente 0.1 M con lossiguientes resultados (mL):
25.06 25.18 24.87 25.51 25.34 25.41
• Probar la existencia de sesgo positivo en estos res ultados
EL CONTRASTE F PARA LA COMPARACIÓN DE DESVIACIONES ESTÁNDAR
� Las pruebas anteriores (t) comparan medias y detectan errores sistemáticos
� La prueba F compara desviaciones estándar , o sea los errores aleatorios de dos conjuntos de datos
USOS:
76
USOS:
1. Probar si el método A es más preciso que el método B(prueba de una cola). Se tiene una idea predeterminadaque un método es MÁS preciso que el otro.
2. Probar si los métodos A y B difieren en su precisión(prueba de dos colas). No se tiene idea preconcebida decual es más preciso.
antes de una prueba t
� El contraste F considera la razón de las dos varianzas muestrales:
2
2
1
cal ss
F = F siempre debe ser ≥≥≥≥ 1
EL CONTRASTE F PARA LA COMPARACIÓN DE DESVIACIONES ESTÁNDAR
77
2s
� Se asume que las poblaciones de donde se toman las muestras son normales
H0 : Las desviaciones estándar de las poblacionesno difieren significativamente (la relación devarianzas es próxima a la unidad)
Método (1) Método (2)
S1= 0.28 S2= 0.31
n = 5 n = 5
1.48mg/KgX = 2.33mg/KgX =
Ejemplo : Se compararon dos métodos para la determinación de cromo en muestras de hierba de centeno:
� ¿Las varianzas de ambos métodos son significativamente iguales?
EL CONTRASTE F PARA LA COMPARACIÓN DE DESVIACIONES ESTÁNDAR
78
n1= 5 n2= 5 iguales?
Ejemplo : Se compara un método propuesto para la determinación de la demanda de oxígeno (ppm) en aguas con un método estándar.
Método estándar (1): media: 72 s 1=3.31 n=8
Método propuesto (2): media: 72 s 2=1.51 n=8
¿Es más preciso el método propuesto que el método estándar?
79
CONTRASTE DE DIXON PARA DATOS ANNOMALOS (Contraste Q)
� Es una prueba con la cual se contrastan estadísticamente datos anómalos para determinar si se rechazan o no (para muestras pequeñas, de 3 a 7 datos).
Ho: Todas las medidas provienen de la misma población
(resultado sospechoso - resultado más próximo)Q =
80
(resultado sospechoso - resultado más próximo)rango de resultados
Qcalc=
� Si Qcalc > Qcrit , el resultado sospechoso puede descartarseValores críticos de Q (P=0.05), contraste de dos co las
Tamaño de muestra Valor crítico
4 0.831
5 0.717
6 0.621
7 0.570
Ejemplo:
1. Se obtuvieron los siguientes valores para la concentración de nitrito (ppm) en una muestra de agua de río:
¿Debería rechazarse la última medida sospechosa?
0.403 0.410 0.401 0.380
CONTRASTE DE DIXON PARA DATOS ANNOMALOS (Contraste Q)
81
2. A los datos anteriores se adicionaron otras tres nuevas medidas,
¿Se debería aún mantener el valor 0.380?
0.403 0.410 0.401 0.380 0.400 0.413 0.411
CONTRASTE DE GRUBBS (Contraste G)
� También usado para datos anómalos
Ho: Todas las medidas provienen de la misma población
Gcalc=valor sospechoso - x
s
82
Ejemplo:
Aplicar el contraste de Grubbs a los datos del último ejemplo
s
EjerciciosDatos
ADatos
B
1.84 2.81
1.92 4.06
1.94 3.62
1.92 3.27
1.85 3.27
1.91 3.76
2.07
1. Realizar los contrastes Q y G para el valor 2.07 de los datos A y el valor 2.81 de los datos B, ¿son datos anómalos?
2. Demostrar si las varianzas de los dos grupos de datos difieren significativamente.
83
3. Los siguientes datos proporcionan la recuperación de bromuroadicionado a muestras con contenido vegetal, medido mediante unmétodo de cromatografía gas-líquido. La cantidad de bromuro potásicoañadido a cada vegetal fue la misma.Tomate 777 790 759 790 770 758 764 µµµµg/gPepino 782 773 778 765 789 797 782 µµµµg/ga) Pruebe si la recuperación en los vegetales tiene varianzas que difieran
significativamente.b) Pruebe si las tasas de recuperación media difieren significativamente.