Algunos ejemplos para prueba de hipótesis

VenArroyo 25,413 views 19 slides Jun 05, 2015
Slide 1
Slide 1 of 19
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19

About This Presentation

Algunos ejemplos que pueden realizar en excel para la Prueba de Hipótesis


Slide Content

SEMINARIO DE TESIS II

Prueba de hipotesis

Profesor: Jacinto Arroyo

Es necesario construir mentalmente un hipótesis
a teórica y someterla a la prueba de las mediciones
7 14 experimentales.

, (Max Planck)

Pruebas de Hipotesis

Una manera de hacer inferencia, es haciendo una afirmación acerca del
valor que el parámetro de la población bajo estudio puede tomar.

Esta afirmación, puede estar basada en alguna creencia o experiencia
pasada, que será contrastada con la evidencia que nosotros obtengamos a
través de la información contenida en la muestra. Esto es a lo que llamamos
PRUEBA DE HIPÓTESIS.

Una hipótesis comprende cuatro componentes:
Hipótesis nula

Hipótesis alternativa

+ Estadística de prueba

+ Región de rechazo

Pruebas de Hipotesis

+» La Hipótesis Nula, denotada como H, , siempre especifica un solo valor si la
hipótesis es simple del parámetro de la población.
+ On conjunto de valores si es compuesta (es lo que se quiere desacreditar)

Ho: 4= Ho | Ho: US Ho| Ho: HZ Mo

La hipótesis alternativa, denotada como H,, es la que responde nuestra pregunta,
la que se establece en base a la evidencia que tenemos. Puede tener cuatro
formas:

Ay: u= ih Hy: U > Uo Hy: H< Mo CEA

Pruebas de Hipotesis

Como las conclusiones a las que lleguemos se basan en una muestra, hay
posibilidad de que nos equivoquemos.
Dos decisiones correctas son posibles:
= Rechazar H, cuando es falsa
= No rechazar H, cuando es verdadera
Dos decisiones incorrectas son posibles:
Rechazar H, cuando es verdadera
No rechazar H, cuando es falsa

Tamaño de los errores al tomar una decisión incorrecta en una prueba de Hipótesis

IN CE Tante

Rechazamos Ho Error Tipico | Decisión correcta
Plerror Tipo 1) = a
No rechazamos Ho Decisión correcta Error Típico Il
Plerror Tipo Il) = B

Pruebas de Hipotesis

La probabilidad de cometer un error Tipo | se conoce como Nivel de
Significancia, se denota como à y es el tamaño de la región de rechazo.
El complemento de la región de rechazo es 1-a y es conocido como el
Coeficiente de Confianza.

En una prueba de Hipótesis de dos colas la región de no rechazo
corresponde a un intervalo de confianza para el parámetro en cuestión.

La región de rechazo es el conjunto de valores tales que si la
prueba estadística cae dentro de este rango, decidimos
rechazar la Hipótesis Nula

Su localización depende de la forma de la Hipótesis alternativa:

Si Hy: u > u. entonces la región se encuentra en la cola
derecha de la distribución de la estadística de prueba

Pruebas de Hipotesis

Si H,: uU < u, entonces la región se encuentra en la
cola izquierda de la distribución de la estadística de “y
prueba

Si H,: u # u, entonces la región se divide en dos
partes, una parte estará en la cola derecha de la
distribución de la estadística de prueba y la otra en la

cola izquierda de la distribución de la estadítica de 4
prueba.

> Conclusiones de una Prueba de Hipótesis

Q Si rechazamos la Hipótesis Nula, concluimos que “Hay suficiente
evidencia estadística para inferir que la hipótesis nula es falsa”

Q Sino rechazamos la Hipótesis Nula, concluimos que “no hay suficiente
evidencia estadítica para inferir que la hipótesis nula es falsa”

Ejemplos

ANALISIS DE LA VARIANZA

ANOVA

SUMA DE CUADRADOS

GRADOS DE
LIBERTAD

CUADRADO MEDIO

F

F PE
SCfactor =), tS

cM factor =

SCfactor

CMfactor
CMerror

SCerror = > 2 IE

"Mfactor =

Ejemplo1

Se tiene resultados de observaciones de
cuatro puntos (pueden ser también
experimentos)

Punto1 Punto2 Punto3 Punto 4
6 10 ©)
7 E)
8 ©)

¿Estos datos nos permiten suponer que los puntos son
iguales?

Se prueba la hipótesis
Ho: Ha = Hg = He = Ho

Es decir que bajo Ho, se supone que el promedio de observaciones
de puntos de las poblaciones formadas de los cuatro puntos es el

mismo.

SUMA DE CUADRADOS

GRADOS DE
LIBERTAD

CUADRADO MEDIO

f

scfactor =), oF _ Ox"

n

cM factor =

SCfactor

CM factor
CMerror

SCError

A Œ
SCerror = y x) nm CMfactor =
Ki n-e

Grados de
Libertad

Suma de
cuadrados

Cuadrado
medio

Fuente

D

PARTE 1 (FACTOR)

PARTE 2 (ERROR)

Puntol

Punto2

Punto3

Punto4 |

Punto2 | Puntos [SUMATORIA]

6

8
9
9

6
7
3

10

3
9
3

2 (Cy 1024

441

1156

729

» AAA

2/3 256

6) (Suma x)*2

x)?
n

6/7

12996

866.4 X

877.2-866.4

cuente | Sumade)
vente | cuadradi

Grados de
Libertad

Cuadrado
medio

Factor 10.8
Error 2.84

3
En

3.60
2.07

Total

¡<=número de columnas

26 100 253
4 36 230
64 25 251
36 17
49 49

SUMA DE OS CUADRADOS DE X 300

900-877.2

Suma de Gradosde Cuadrado

ms cuadrados Libertad medio

Factor 10.8 3.60

Error 22.8 2.07
Total

Se busca el valor crítico en la tabla de distribución F

caida Tabla D.9: VALORES CRÍTICOS DE LA DISTRIBUCIÓN F (0,05)

área a la derecha del valor crítico = 0,05

Grados de libertad del Numerader

2 = s 7 8 5 10 u 2

19,000 13,296 19,330 Wan 193% 19405 19412
85 2 678 “8,768

So ss Sas sas

asie AS 470

317 46 4060 4007
3313

Se ubica el valor crítico en la curva

F (3, 11, 0.05 ) =3.587

Se ubica la estadística de prueba y se toma
la decisión

DECISIÓN: No se rechaza Ho, por lo tanto, el promedio de observaciones
de los 4 puntos es el mismo.

ANOVA DE LA REGRESION

Tabla ANOVA
Fuentes de [| Sumas de Cuadrados | Grados de Cuadrados
Variación libertad medios

Regresión | SCR., =D) (Y = 1 MCR,

SCE
Error SCE =Y (y n-2 [MCE =
n Z
E SCT
Total SCT = (vi a n-1 GT

EJEMPLO

10.0
9.9 Modelo estadistico
9.0 ant) x= yy Ecuación
9.0 r2
aa Dy yy j
4.8 m
8.3

11.5

14.5

16.6

18.0

18.3

18.8

20.4

21.0

20.9

20.0

16.2

14.2

14.0

124

119

10.2
9.0

5625 ano) x=) y
en DIENEN

7225

7225
7396 24a +326.8b

7396 326.8a + 4978.3b = 16640.3
132.3 4761
210.3 2209
275.6 1849
324.0 1296
334.9 1156 b= -4.5161
353.4 1024
416.2 961
441.0 841 609
436.8 784
400.0 841 580
262.4 1600 648
201.6 2500 710
196.0 3249 798
151.3 4225 799.5
141.6 5776 904.4
104.0 6084 795.6
810 6448 722.7

a= 119.715

y = 119.71-4.5161x

1397.3 4978.3 926411 16640.3
58.2

(Wen Yorom)“ Yost = -4.5161x + 119.71
0:20 266.6 |

4.00 2816

0.00 434, = =
3522 434, > (Woo) = (Y, — Ypro)? = (79-58.2)? |

= 201 6431
= 144.79 1585.0
e 14.24 5763
7 150 913 |
® i 16.

= 3.04 1817 {
= 392.1
= 9.40 447.6
x 548.2

(Y-Yost)*=(Yi-Yos)?=(75-75)?

Vest Ypro)=( Vest ~ Ypro)”=(47-58.2)*]

» ses oa
= 1112.2 rats :
= 1082.2 ‘Total
= 8313
a 136.2
5
F
=
7
23 78
5

SUM 326.8 13973 13972 112891 5125 107767
PRO = aI

Tabla ANOVA

Fuentes de
Variación

Sumas de Cuadrados

Grados de
libertad

Cuadrados
medios

Regresión

SCR

eg

=E(G-5)

MCReg

Error

SCE = Y (ui 1

SCE
MCE = LE

Total

SCT = Y (y;

yy

SCT
n — 1

x

Y x

XY Yest

V-Yoro)” _ (N-Yes)”_ | Vest Yprm)”

SUM 326.8 1397.3

PRO

4978.3
58.2

16640.3 13

ANOVA

11289. 512.5

Fuente
Regresión
Error

Suma de cuadrados

Grados de libertad

Cuadrado medio

512.5

1.
2

10776.7
233

Total

11289.1

23

0.9546

ANOVA

Fuente Suma de cuadrados Grados de

libertad Cuadrado medio

ex

Regresión
Error

1.
2

10776.7
23.3

23

0.9546

0.9546

EL CONTRASTE DE REGRESION|

Fijado un nivel de significación a , se rechaze Ha ai Fun, > Fan

462.6 > 4.3009

Distribución F (w= DOS en Ta cola derecha) Contras

530

ANOVA
Fuente Suma de cuadrados Grados de libertad Cuadrado medio
1 10776.7
23.3

Regresion
Error

Valores aos del
coeficiente de corre:

pearson 9770 lación de Pearson.

COEFICIENTE DE DETERMINACIÓN

Estadístico que representa la proporción de variación

explicada por la regreción

[Es una medida relativa del grado de asociación lineal entre = e y

ask 5 El modelo no explica nada de y a partir de 2

msi SCT = Ajuste perfecto: y depende funcionalmente
dex

Un valor de R? cercano a 0 = Baja capacidad explicativa de la recta.

# Un valor de R! próximo a 1= Alta capacidad explicativa de la recta.
Tags