X
1 X
2 X
3 X
4 X
5
X
6
d
w (rango)
d = X
6 – X
5
w = X
6 – X
1
Q =
d
w
Si Q > Q
Crít., se rechaza X
6
Si Q < Q
Crít., se acepta X
6
Representación:
Dato anómalo
o atípico
Valor
mínimo
Valor
máximo
Valores críticos para el cociente de rechazo, Q, a diferentes niveles de confianza
Adaptado de D. B. Rorabacher, Anal. Chem., 63(1991) 139.
Procedimiento para su aplicación
1.Ordene los datos de menor a mayor.
2.Identifique el valor sospechoso (X
c).
3.Calcule la diferencia entre el número sospechoso y su más cercano vecino (x
v) se divide entre el rango del conjunto (w),
es decir, la diferencia entre el valor más alto y el más bajo.
4.Calcule el valor de Q.
5.Determine el valor crítico (Q
Crít), valores de Q tabulados para un número dado de observaciones a niveles diferentes de
confianza (90, 95 y 99%).
6.Comparar valores y decida; (a) si el valor de Q calculado es igual o mayor a Q
crít., el dato sospechoso se puede rechazar.
(b) Por otro lado, si el valor de Q es menor a Q
crít., el dato se debe conservar.
Referencias Bibliográficas
Christian, G. (2009). Química Analítica (Sexta ed.). México: McGraw-Hill/Interamericana Editores, S. A. de C. V.
CONALEP. (2012). Análisis químico de la materia. México D. F., México: Secretaria de Educación Pública.
Harris, D. (2016). Análisis Químico Cuantitativo (Tercera ed.). Barcelona, España: REVERTÉ.
Miller, J. N., & Miller, J. C. (2002). Estadística y Quimiometría para Química Analítica (Cuarta ed.). Madrid, España: Pearson
Educación S.A.
Skoog, D., West, D., Holler, F., & Crouch, S. (2015). Fundamentos de química analítica (Novena ed.). México D.F., México:
Cengage Learning Editores, S.A. de C.V.
@jlcastros78 Micro Clases de Castro José Luis Castro Soto José Luis Castro Soto Micro Clases de Castro
Ciudad Bolívar, Venezuela Código: InfoEstQui-01 / Revisión: 00
Test de Dixon (Test – Q)
#MicroClasesDeCastro / Marzo, 2021 / Por: José Luis Castro Soto
Se debe agregar, que existen una amplia gama de pruebas
estadísticas para determinar si un dato se debe rechazar.
En todas estas pruebas se establece un intervalo dentro
del cual deben caer las observaciones estadísticamente
significativas. La dificultad en todas ellas estriba en
determinar cuál debe ser el intervalo. Si es demasiado
pequeño, entonces se rechazarán datos perfectamente
válidos; y si es demasiado grande, entonces se retendrán
mediciones erróneas en una proporción demasiado alta.
La experiencia y el sentido común pueden servir como
base práctica para juzgar la validez de un dato anómalo. A
menudo, un analista experimentado adquiere una buena
idea de la precisión que se debe esperar con un método
particular, y reconocerá cuándo es sospechoso un valor
específico.
Número de observaciones
(N)
QCrít. (Rechazar si Q > QCrít.)
90% de confianza 95% de confianza 99% de confianza
3 0,941 0,970 0,994
4 0,765 0,829 0,926
5 0,642 0,710 0,821
6 0,560 0,625 0,740
7 0,507 0,568 0,680
8 0,468 0,526 0,634
9 0,437 0,493 0,598
10 0,412 0,466 0,568
15 0,338 0,384 0,475
20 0,300 0,342 0,425
25 0,277 0,317 0,393
30 0,260 0,298 0,372
Ejemplo Nº 1
Durante un análisis del agua potable de una ciudad, para determinar el arsénico proporcionó valores de 5,64; 5,61; 5,91;
5,69 y 5,70 ppm. Unos de los valores parece ser anormal; ¿debería rechazarse dicho valor a un nivel de confianza de 90%?
Generalmente, se considera inapropiado y en algunos casos poco ético
el descartar sin razón el dato. Sin embargo, el resultado cuestionable,
también llamado dato atípico, discordante o anómalo, puede ser
resultado de un error no detectado. Por esto, es importante desarrollar
un criterio para decidir si el dato se debe conservar o se debe rechazar.
Introducción
Hay ocasiones cuando se realiza una serie de análisis de réplicas, es
posible que el conjunto de datos contenga uno (o posiblemente más)
datos cuestionable o no coherente con los restantes, es decir, que
difiera notablemente y de forma inexplicable de los otros, incluso que
parezca estar fuera del intervalo de los errores aleatorios que podrían
ser producidos por el procedimiento. Por desgracia, no hay criterios
uniformes que se puedan usar para decidir si un dato atípico se pueda
atribuir a un error accidental más que a una variación casual.
No se puede negar lo tentador que es eliminar los valores
extremos del conjunto de datos porque alterarán la
estadística de modo desfavorable; es decir, aumentan la
desviación estándar (s) y la varianza (s
2
), medidas de la
dispersión, y pueden alterar la media reportada.
Sin embargo, la única base confiable para el rechazo
ocurre cuando es posible decidir que se pudo haber
cometido un error específico al obtener el resultado
dudoso. Ningún resultado debe retenerse en casos en los
que ha ocurrido un error conocido en su obtención.
El Test-Q o Prueba Q: Prueba de rechazo de un dato cuestionable o sospechoso
Teniendo en cuenta, que no existe una regla universal para decidir si un dato se debe conservar o se debe rechazar. Sin
embargo, el Test - Q o prueba Q, que es considerada como un método simple y estadísticamente apropiado que nos ayuda a
tomar la decisión de retener o descartar un dato para un determinado número de observaciones, con el objeto de garantizar
una distribución normal o gaussiana al conjunto.
Ejemplo Nº 2
Se obtuvieron los siguientes valores para la concentración de nitrito (mg·L
-1
) en una muestra de agua de rio: 0,403: 0,410;
0,401 y 0,380. La última medida aparenta ser sospechosa, ¿debería ser rechazada?
5,6 5,7 5,8 5,9 6,0
5,61
5,64
5,69
5,91
Paso a paso:
1.Ordene los datos de menor a mayor (5,61; 5,64; 5,69;
5,70 y 5,91.
2.Identifique el dato sospechoso (5,91 ppm).
3.Difiere al valor más cercano; d = 5,91-5,70 = 0,21
ppm.
4.El rango es: w = 5,91–5,61 = 0,30 ppm.
5.Por tanto, Q = 0,70.
6.El valor Q
Crit- para cinco observaciones es 0,642 a un
nivel de confianza de 90%.
7.Como el Q > Q
Crit-, el test justifica el rechazo del dato
atípico.
Q =
Cálculos:
Q =
5,91 - 5,61
5,91 - 5,70
0,21
0,30
0,70
=
d
w
=
0,70 > 0,642
(Puede rechazar el dato)
Q = 0,70 Q
Crit. = 0,642
d
w
(1)
(2)
(3)
5,70
Valor atípico
Conclusión
Algunos sostienen que nunca se debe descartar nunca un dato a menos que se sepa que existe un error en el procedimiento
que condujo a esa medida particular. Otros repiten la medida sospechosa varias veces más, para asegurarse mejor si la
medida realmente está o no fuera de lo esperable. La decisión depende de uno, y es por tanto una cuestión personal. Lo
mejor es repetir la medida varias veces para aumentar la probabilidad de que la decisión tomada es correcta. Pero, de no
quedar más alternativas, debemos recurrir al Test - Q.
Recomendaciones para tratar datos atípicos
Para el tratamiento de un conjunto de datos en el que hay un valor sospechoso, es decir, si una de las observaciones es
bastante diferente de las otras del conjunto y si la precisión es considerablemente peor que la esperada, se sugiere:
1.Si es posible, estimar la precisión que podría ser esperada de manera razonable en el procedimiento para asegurarse de
que el dato atípico es realmente cuestionable.
2.Examinar cuidadosamente todos los datos relacionados con el dato atípico para determinar si es posible que un error
bruto afectara dicho valor.
3.Repetir el análisis si se cuenta con disponibilidad de muestra y tiempo. Una concordancia entre datos nuevos y los datos
del análisis original que parecen ser válidos le va a dar peso a la noción de que el dato atípico debe ser rechazado. Más
aún, si se indica conservar el resultado, el dato atípico tendrá poco efecto en la media de un conjunto de datos más
grande.
4.Si no se pueden obtener nuevos datos, aplicar la prueba Q al conjunto existente para observar si el resultado dudoso
debe ser rechazado o conservado basándose sobre pruebas estadísticas.
5.Si la prueba Q indica que el dato debe conservarse, considere reportar la mediana del conjunto, en lugar de la media para
un pequeño conjunto de datos. La mediana tiene la gran virtud de permitir la inclusión de todos los datos en un conjunto
sin estar sujeta a la influencia de un dato atípico. Más aún, la mediana de un conjunto de tres mediciones distribuido de
manera normal proporciona una mejor estimación del valor correcto que la media del conjunto después de que el dato
atípico ha sido descartado.
En esta prueba, la relación Q se calcula determinando el
valor absoluto de la diferencia del resultado cuestionable o
sospechoso “x
c“ y su vecino más cercano “x
v”, al cual
llamamos “d”, y se divide entre el rango (w) del conjunto.
Q =
w
x
c - x
v
=
w
d
Agradecimientos
A los participantes del Laboratorio de Química de la Universidad Politécnica Territorial del Estado Bolívar (UPTEB): Alejandro
Saavedra, Génesis Miranda, Karlenis Salas, Oranjelin Guzmán, Rosanny Pérez, Yuber Pérez y Ze Manue Bolívar, por
participar y facilitar las fotografías empleadas en este recursos.
Paso a paso:
1.Ordene los datos de menor a mayor (0,380; 0,401;
0,403 y 0,410)
2.Identifique el dato sospechoso (0,380 mg·L
-1
).
3.Difiere al valor más cercano; d = 0,380 - 0,401 =
0,021 mg·L
-1
.
4.El rango es: w = 0,410 - 0,380 = 0,030 mg·L
-1
.
5.Por tanto, Q = 0,7.
6.El valor Q
Crit- para cuatro (4) muestras es 0,829 a un
nivel de confianza de 95%.
7.Como el Q < Q
Crit-, el test no justifica el rechazo del
dato, por tanto debe aceptarse la medida.
Q =
Cálculos:
Q =
0,410 - 0,380
0,380 - 0,401
0,021
0,03
0,7
=
d
w
=
0,7 < 0,829
(No rechazar el dato)
Q = 0,7 Q
Crit. = 0,829
0,380 0,410 0,390 0,400
d
w
(1)
(2)
(3)
Valor atípico
Es importante destacar, que el seleccionar un criterio para rechazar un resultado
sospechoso tiene sus peligros;
1.Establecer un estándar muy estricto, sería muy difícil rechazar un resultado atípico y
se corre el riesgo de retener este valor, el cual tendría un efecto en la media.
2.Establecer un límite muy blando, con el cual se rechaza fácilmente el valor atípico,
se podría estar descartando un valor que por derecho propio pertenece al conjunto
y, por lo tanto, se introduce un sesgo en los datos.
Casos especiales:
Considere, que para tres (3) mediciones con dos (2) de
los puntos idénticos o muy cercanos. En ese caso, la
prueba casi siempre indica rechazo del tercer valor, sin
importar la magnitud de la desviación, porque “d” es igual
a “w”, y Q es siempre igual a 1.
Observe
Q =
4,6 – 4,5
4,6 – 4,5 0,1
0,1
1,0 =
d
w
= =
•Para los valores: 4,5; 4,5 y 4,6
Q =
9,0 – 4,5
9,0 – 4,5 4,5
4,5
1,0 =
d
w
= =
•Para los valores: 4,5; 4,5 y 9,0
Lo mismo se aplica, obviamente, para tres (3) puntos de
datos idénticos en cuatro (4) mediciones, y así
sucesivamente. En este sentido, no debe aplicarse la
prueba Q.