Prueba de normalidad Prueba de Anderson-Darling López Beltrán Miguel Armando Noviembre 2011
La prueba de Anderson-Darling es utilizada para probar si un conjunto de datos muéstrales provienen de una población con una distribución de probabilidad continua específica (por lo general la distribución normal). La prueba de Anderson-Darling se basa en la comparación de la distribución de probabilidades acumulada empírica (resultado de los datos) con la distribución de probabilidades acumulada teórica (definida en H0).
HIPÓTESIS: H : Las variables aleatorias en un estudio siguen una distribución normal (µ, σ ). H a : Las variables aleatorias en un estudio no siguen una distribución normal (µ, σ ).
ESTADÍSTICO DE PRUEBA: El estadístico de A 2 esta dado por la siguientes formula:
Creación de la primera y segunda columna: 1 2 i (2i-1) 1 1 2 3 3 5 4 7 5 9 6 11 7 13 8 15 9 17 10 19 11 21 12 23 13 25 14 27 15 29 16 31 17 33 18 35 19 37 20 39
Los datos se ordenan de menor a mayor (3) y de mayor a menor (4). 3 4 Y i Y n+1-i 16 97 19 91 22 90 29 88 30 86 30 79 45 77 55 75 57 66 58 65 65 58 66 57 75 55 77 45 79 30 86 30 88 29 90 22 91 19 97 16
Determinar Z de las columnas 3 y 4. Donde : ẋ : dato muestral. µ : media muestral. Σ : desviación estándar. Z = ẋ - µ σ _______ 5 6 Z i Z n+1-i -1.5117 1.3934 -1.4041 1.1782 -1.2965 1.1423 -1.0455 1.0706 -1.0096 0.9989 -1.0096 0.7478 -0.4716 0.6761 -0.1130 0.6043 -0.0412 0.2815 -0.0054 0.2457 0.2457 -0.0054 0.2815 -0.0412 0.6043 -0.1130 0.6761 -0.4716 0.7478 -1.0096 0.9989 -1.0096 1.0706 -1.0455 1.1423 -1.2965 1.1782 -1.4041 1.3934 -1.5117 Nota: los valores de la columna 6 son los mismos que la columna 5, solo están ordenados inversamente.
Los valores para las columnas de 7 y 8, son obtenidos de la tabla de distribución normal acumulada. En Excel utiliza la función : = DISTR.NORM (valor, media, desviación estándar, Acum) Valor: valor cuya distribución se desea obtener. Media: media aritmética de la distribución. Desviación estándar: desviación estándar de la distribución. Acum: Valor lógico que determina la forma de la función. Argumento VERDADERO para obtener la distribución acumulada.
7 8 F( Yi ) F(Y n+1-i ) 0.0653 0.9182 0.0801 0.8806 0.0974 0.8733 0.1479 0.8578 0.1563 0.8411 0.1563 0.7727 0.3186 0.7505 0.4550 0.7272 0.4836 0.6109 0.4979 0.5970 0.5970 0.4979 0.6109 0.4836 0.7272 0.4550 0.7505 0.3186 0.7727 0.1563 0.8411 0.1563 0.8578 0.1479 0.8733 0.0974 0.8806 0.0801 0.9182 0.0653 ** Con la utilización de un software ya no es necesario las columnas 5 y 6.
9 10 LN(F(Yi)) LN (1-F(Y n+1-i )) -2.7288 -2.5041 -2.5240 -2.1256 -2.3290 -2.0662 -1.9112 -1.9507 -1.8557 -1.8393 -1.8557 -1.4815 -1.1438 -1.3883 -0.7874 -1.2990 -0.7266 -0.9438 -0.6974 -0.9089 -0.5158 -0.6889 -0.4929 -0.6608 -0.3186 -0.6070 -0.2870 -0.3836 -0.2579 -0.1700 -0.1731 -0.1700 -0.1534 -0.1601 -0.1354 -0.1025 -0.1271 -0.0835 -0.0853 -0.0675 Las columna 9 y 10 se determina con logaritmos neperiano, para columna 9 se determina directo ( LN (<valor columna 7>)) y columna 10 se determina LN ((1 - <valor columna 8>)) posteriormente se determina el resultado del logaritmo neperiano.
La ultima columna de la tabla se determina con la siguiente formula: 11 S i -0.2616 -0.6974 -1.0988 -1.3517 -1.6628 -1.8355 -1.6459 -1.5648 -1.4198 -1.5260 -1.2649 -1.3267 -1.1570 -0.9053 -0.6204 -0.5318 -0.5171 -0.4163 -0.3897 -0.2980
Se suman los valores de Si (Columna 11): = -20.4916 Aplicación del estadístico de Anderson-Darling: A 2 = - N – S A 2 = -(20) – ( -20.4916) = 0.491563
CONCLUSIONES: El valor estadístico (A 2 = 0.4916 ) es menor al valor critico (A 2 critico = 0.752), por lo tanto no se rechaza la hipótesis nula. Por lo tanto los datos observados tienen una naturaleza de distribución normal.
Referencias: http://es.scribd.com/doc/57801491/Metodos-de-ajuste-de-curvas http://www.elosiodelosantos.com/sergiman/div/tablnorm.html http://www.spcforexcel.com/anderson-darling-test-for-normality http://www.theriac.org/DeskReference/viewDocument.php?id=60&SectionsList=3 http://www.itl.nist.gov/div898/handbook/eda/section3/eda35e.htm Marqués dos Santos, María José; Estadística Básica: un enfoque no parametrico , Universidad Nacional Autonoma de México, Facultad de Estudios Superiores Zaragoza.