Pruebas de normalidad: Prueba de Anderson-Darling

83,921 views 17 slides Apr 10, 2012
Slide 1
Slide 1 of 17
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17

About This Presentation

Prueba de Anderson


Slide Content

Prueba de normalidad Prueba de Anderson-Darling López Beltrán Miguel Armando Noviembre 2011

La prueba de Anderson-Darling es utilizada para probar si un conjunto de datos muéstrales provienen de una población con una distribución de probabilidad continua específica (por lo general la distribución normal). La prueba de Anderson-Darling se basa en la comparación de la distribución de probabilidades acumulada empírica (resultado de los datos) con la distribución de probabilidades acumulada teórica (definida en H0).

HIPÓTESIS: H : Las variables aleatorias en un estudio siguen una distribución normal (µ, σ ). H a : Las variables aleatorias en un estudio no siguen una distribución normal (µ, σ ).

ESTADÍSTICO DE PRUEBA: El estadístico de A 2 esta dado por la siguientes formula:

EJEMPLO Basado en Excel

20 números al azar: 19 55 30 79 97 75 65 90 77 22 45 16 57 66 30 91 88 58 29 86 Sacar media y desviación estándar: µ = 58.75 σ = 26.83 α = 0.05 Valor critico = 0.752 Procedimiento:

Creación de la primera y segunda columna: 1 2 i (2i-1) 1 1 2 3 3 5 4 7 5 9 6 11 7 13 8 15 9 17 10 19 11 21 12 23 13 25 14 27 15 29 16 31 17 33 18 35 19 37 20 39

Los datos se ordenan de menor a mayor (3) y de mayor a menor (4). 3 4 Y i Y n+1-i 16 97 19 91 22 90 29 88 30 86 30 79 45 77 55 75 57 66 58 65 65 58 66 57 75 55 77 45 79 30 86 30 88 29 90 22 91 19 97 16

Determinar Z de las columnas 3 y 4. Donde : ẋ : dato muestral. µ : media muestral. Σ : desviación estándar. Z = ẋ - µ σ _______ 5 6 Z i Z n+1-i -1.5117 1.3934 -1.4041 1.1782 -1.2965 1.1423 -1.0455 1.0706 -1.0096 0.9989 -1.0096 0.7478 -0.4716 0.6761 -0.1130 0.6043 -0.0412 0.2815 -0.0054 0.2457 0.2457 -0.0054 0.2815 -0.0412 0.6043 -0.1130 0.6761 -0.4716 0.7478 -1.0096 0.9989 -1.0096 1.0706 -1.0455 1.1423 -1.2965 1.1782 -1.4041 1.3934 -1.5117 Nota: los valores de la columna 6 son los mismos que la columna 5, solo están ordenados inversamente.

Los valores para las columnas de 7 y 8, son obtenidos de la tabla de distribución normal acumulada. En Excel utiliza la función : = DISTR.NORM (valor, media, desviación estándar, Acum) Valor: valor cuya distribución se desea obtener. Media: media aritmética de la distribución. Desviación estándar: desviación estándar de la distribución. Acum: Valor lógico que determina la forma de la función. Argumento VERDADERO para obtener la distribución acumulada.

7 8 F( Yi ) F(Y n+1-i ) 0.0653 0.9182 0.0801 0.8806 0.0974 0.8733 0.1479 0.8578 0.1563 0.8411 0.1563 0.7727 0.3186 0.7505 0.4550 0.7272 0.4836 0.6109 0.4979 0.5970 0.5970 0.4979 0.6109 0.4836 0.7272 0.4550 0.7505 0.3186 0.7727 0.1563 0.8411 0.1563 0.8578 0.1479 0.8733 0.0974 0.8806 0.0801 0.9182 0.0653 ** Con la utilización de un software ya no es necesario las columnas 5 y 6.

9 10 LN(F(Yi)) LN (1-F(Y n+1-i )) -2.7288 -2.5041 -2.5240 -2.1256 -2.3290 -2.0662 -1.9112 -1.9507 -1.8557 -1.8393 -1.8557 -1.4815 -1.1438 -1.3883 -0.7874 -1.2990 -0.7266 -0.9438 -0.6974 -0.9089 -0.5158 -0.6889 -0.4929 -0.6608 -0.3186 -0.6070 -0.2870 -0.3836 -0.2579 -0.1700 -0.1731 -0.1700 -0.1534 -0.1601 -0.1354 -0.1025 -0.1271 -0.0835 -0.0853 -0.0675 Las columna 9 y 10 se determina con logaritmos neperiano, para columna 9 se determina directo ( LN (<valor columna 7>)) y columna 10 se determina LN ((1 - <valor columna 8>)) posteriormente se determina el resultado del logaritmo neperiano.

La ultima columna de la tabla se determina con la siguiente formula: 11 S i -0.2616 -0.6974 -1.0988 -1.3517 -1.6628 -1.8355 -1.6459 -1.5648 -1.4198 -1.5260 -1.2649 -1.3267 -1.1570 -0.9053 -0.6204 -0.5318 -0.5171 -0.4163 -0.3897 -0.2980

1 2 3 4 5 6 7 8 9 10 11 i (2i-1) Y i Y n+1-i Z i Z n+1-i F(Yi) F(Y n+1-i ) LN(F(Yi)) LN(1-F(Y n+1-i )) S i 1 1 16 97 -1.5117 1.3934 0.0653 0.9182 -2.7288 -2.5041 -0.2616 2 3 19 91 -1.4041 1.1782 0.0801 0.8806 -2.5240 -2.1256 -0.6974 3 5 22 90 -1.2965 1.1423 0.0974 0.8733 -2.3290 -2.0662 -1.0988 4 7 29 88 -1.0455 1.0706 0.1479 0.8578 -1.9112 -1.9507 -1.3517 5 9 30 86 -1.0096 0.9989 0.1563 0.8411 -1.8557 -1.8393 -1.6628 6 11 30 79 -1.0096 0.7478 0.1563 0.7727 -1.8557 -1.4815 -1.8355 7 13 45 77 -0.4716 0.6761 0.3186 0.7505 -1.1438 -1.3883 -1.6459 8 15 55 75 -0.1130 0.6043 0.4550 0.7272 -0.7874 -1.2990 -1.5648 9 17 57 66 -0.0412 0.2815 0.4836 0.6109 -0.7266 -0.9438 -1.4198 10 19 58 65 -0.0054 0.2457 0.4979 0.5970 -0.6974 -0.9089 -1.5260 11 21 65 58 0.2457 -0.0054 0.5970 0.4979 -0.5158 -0.6889 -1.2649 12 23 66 57 0.2815 -0.0412 0.6109 0.4836 -0.4929 -0.6608 -1.3267 13 25 75 55 0.6043 -0.1130 0.7272 0.4550 -0.3186 -0.6070 -1.1570 14 27 77 45 0.6761 -0.4716 0.7505 0.3186 -0.2870 -0.3836 -0.9053 15 29 79 30 0.7478 -1.0096 0.7727 0.1563 -0.2579 -0.1700 -0.6204 16 31 86 30 0.9989 -1.0096 0.8411 0.1563 -0.1731 -0.1700 -0.5318 17 33 88 29 1.0706 -1.0455 0.8578 0.1479 -0.1534 -0.1601 -0.5171 18 35 90 22 1.1423 -1.2965 0.8733 0.0974 -0.1354 -0.1025 -0.4163 19 37 91 19 1.1782 -1.4041 0.8806 0.0801 -0.1271 -0.0835 -0.3897 20 39 97 16 1.3934 -1.5117 0.9182 0.0653 -0.0853 -0.0675 -0.2980

Se suman los valores de Si (Columna 11): = -20.4916 Aplicación del estadístico de Anderson-Darling: A 2 = - N – S A 2 = -(20) – ( -20.4916) = 0.491563

CONCLUSIONES: El valor estadístico (A 2 = 0.4916 ) es menor al valor critico (A 2 critico = 0.752), por lo tanto no se rechaza la hipótesis nula. Por lo tanto los datos observados tienen una naturaleza de distribución normal.

Referencias: http://es.scribd.com/doc/57801491/Metodos-de-ajuste-de-curvas http://www.elosiodelosantos.com/sergiman/div/tablnorm.html http://www.spcforexcel.com/anderson-darling-test-for-normality http://www.theriac.org/DeskReference/viewDocument.php?id=60&SectionsList=3 http://www.itl.nist.gov/div898/handbook/eda/section3/eda35e.htm Marqués dos Santos, María José; Estadística Básica: un enfoque no parametrico , Universidad Nacional Autonoma de México, Facultad de Estudios Superiores Zaragoza.