Muestreo estratificado (1)

MichaelStivenDiaz 1,905 views 25 slides Nov 11, 2016
Slide 1
Slide 1 of 25
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25

About This Presentation

muestreo


Slide Content

11/11/16 1
Escuela Nacional de Estadística e
Informátia
Muestreo I
Muestreo Aleatorio Estratificado
Prof. Willer David Chanduvi Puicón

Muestreo Aleatorio EstratificadoMuestreo Aleatorio Estratificado
2
11/11/16
En muchas ocasiones es conveniente dividir a la población en grupos o estratos
para mejorar la eficiencia del muestreo o bien obtener resultados desagregados
por dominios de estudio.
La población de estudio, formada por N unidades, se divide en L estratos, los
cuales constituyen una población, es decir, no se solapan y la unión de todos ellos
es el total.
La muestra estratificada se obtiene seleccionando unidades de cada uno de
los L estratos de forma independiente en cada estrato.
Los estratos, para mejorar la eficiencia del diseño, se forman en función de
variables altamente correlacionadas con las variables en estudio, tales como nivel
socioeconómico, tamaño de la localidad, giro de empresas, etc.
h
N

Muestreo Aleatorio EstratificadoMuestreo Aleatorio Estratificado
Si la selección en cada estrato es aleatoria simple, el muestreo se denomina Muestreo
Aleatorio Estratificado (MAE).
Su principal objetivo es mejorar la precisión de las estimaciones reduciendo los
errores de muestreo. Minimiza la varianza de los estimadores mediante la creación de
estratos lo más homogéneos posible entre sus elementos y lo más heterogéneo entre
estratos.
Es eficiente en poblaciones heterogéneas.
Reduce el costo del muestreo al reducir los tamaños de muestra sin perder precisión.
Forma parte de los diseños de muestras complejas.
Administrativamente el muestreo estratificado facilita la designación de supervisiones y
equipos de campo que controlen y ejecuten la encuesta de cada región o estrato.
3
11/11/16

4
11/11/16
Población
........
n = n
1 +
n
2 + n
3 +.........+ n
L
n
1
n
2
n
3
n
L-1
n
L
Muestreo Aleatorio EstratificadoMuestreo Aleatorio Estratificado

5
11/11/16
Muestreo Aleatorio EstratificadoMuestreo Aleatorio Estratificado
1
L
h
h
N N
=

1
L
h
h
n n
=

Supuestos del muestreo estratificadoSupuestos del muestreo estratificado
HOMOGENEIDAD:HOMOGENEIDAD:
Entre elementos de un mismo estrato
HETEROGENEIDAD:HETEROGENEIDAD:
Entre estratos
INDEPENDENCIA:INDEPENDENCIA:
Entre estratos al seleccionar la muestra
6
11/11/16

El número de estratos:El número de estratos:
No se debe pensar que aumentando notablemente el número
de estratos se obtienen altos beneficios. En la práctica el
aumento mas allá de 6 estratos produce pocas ganancias en
la reducción de las varianzas.
Definido por criterio del investigador
Calculado por fórmula teórica:
donde,

costo por unidad de muestra
costo por estratificación
7
11/11/16
e
n
C
2nC
L=
:
n
C
:
e
C

Formación de los estratosFormación de los estratos
Método de DaleniusMétodo de Dalenius
Cuando se tiene una variable cuantitativa de estratificación, se puede
determinar los límites de los intervalos para cada estrato.
Método ClusterMétodo Cluster
Cuando se tienen varias variables de estratificación, se puede formar
estratos de elementos similares en base a las medidas de distancia
entre elementos.
A criterio del investigadorA criterio del investigador
Cuando se forman estratos por dominios geográficos, por dominios
temáticos, etc, que favorecen el análisis de la muestra.
8
11/11/16

Método de DaleniusMétodo de Dalenius
Dalenius (1957), diseñó un método para determinar los mejores límies para
estratos cuando se dispone de datos correspondientes a una variable cuantitativa
para toda la población.
Los resultados son muy buenos cuando la variable de estratificación está
altamente correlacionada con la variable de interés.
Este método tiende a minimizar la varianza del estimador.
Se requiere de manera preliminar contar con una gran cantidad de estratos
estrechos (intervalos de clase)
9
11/11/16

Método de DaleniusMétodo de Dalenius
Ejemplo:
En un estudio de múltiples propósitos se
necesita seleccionar una muestra de 400
abonados de Lima Metropolitana. Una de
las variables más importantes es el gasto
en tráfico telefónico.
Se decidió por utilizar L=5 estratos.
Luego, obtenemos los límites:
706.62x2=1413.24
706.62x3=2119.86
706.62x4=2826.48
706.62x5=3533.11
10
11/11/16
62.706=
5
3533.11

Procedimiento de Selección
1° Preparar el marco muestral tal que contenga la
variable que identifica el estrato al que pertenece
cada unidad del marco
2° Seleccionar la muestra aleatoria (simple con o sin
reemplazo, sistemática, etc) de forma
independiente en cada estrato
3° La muestra estratificada es la unión de todas las
muestras obtenidas de cada estrato
11
11/11/16

Muestreo Aleatorio EstratificadoMuestreo Aleatorio Estratificado
MASsr en cada estratoMASsr en cada estrato
1.En el estrato h, las selecciones no son independientes
2.El número de muestras posibles en el estrato h es:
3.Cada muestra posible de tamaño es seleccionada con
probabilidad
4.La fracción o tasa de muestreo en cada estrato es:
5.La probabilidad de inclusión de primer orden en cada estrato es
6.El peso muestral o factor de expansión en cada estrato es:
12
11/11/16
( )
!
! !
h
h
N h
n
h h h
N
C
n N n
=
-
h
n
1
h
h
N
n
C
h
h
h
n
f
N
=
h
hi
h
n
N
p=
h
hi
h
N
w
n
=

EjemploEjemplo
Considerando la variable sexo como variable de estratificación, seleccionar una
muestra estratificada de 200 fichas clínicas del archivo “sífilis”. Utilice MAS sr en
cada estrato, 100 fichas por cada estrato.
Procedimiento con SPSS:
Analizar / Muestras complejas / Seleccionar una muestra
13
11/11/16

Procedimiento de EstimaciónProcedimiento de Estimación
El estimador del total poblacional esta dado por:
Debido a la independencia, la varianza es:
El estimador de la varianza es:
14
11/11/16
µ µ
1
L
h
h
T T
=

µ µ
1
( ) ( )
L
h
h
V T V T
=

µµ µµ
1
( ) ( )
L
h
h
V T V T
=

Procedimiento de estimación de mediasProcedimiento de estimación de medias
Un estimador general para la media poblacional esta dado por:
La varianza teórica del estimador anterior es:
La varianza estimada del estimador anterior es:
15
11/11/16
µ
µ
µ µ µ
1 1 1
1 1
L L L
h
h hh h
h h h
T
T N W
N N N
m m m
= = =
= = = =å å å
µ µ2
1
( ) ( )
L
hh
h
V W Vm m
=

µ µ2
1
( ) ( )
L
hh
h
v W vm m
=

$ $
m

Procedimiento de estimación de proporcionesProcedimiento de estimación de proporciones
Un estimador general para la proporción poblacional P está dado por:
La varianza teórica del estimador anterior es:
La varianza estimada del estimador anterior es:
16
11/11/16
µ µ µ
1 1
1
L L
h h
h h
h h
P N P W P
N
= =
= =å å
µ µ2
1
( ) ( )
L
h
h
h
V P W V P
=

µ µ2
1
( ) ( )
L
h
h
h
v P W v P
=

$ $

EjemploEjemplo
Con la muestra aleatoria estratificada seleccionada en el ejemplo anterior ,
determine las siguientes estimaciones:
Promedio de días de curación de la enfermedad
Promedio de días de curación de la enfermedad, según sexo.
Promedio de días de curación de la enfermedad, según raza.
Proporción de pacientes con diagnóstico SRAS
Total de pacientes con diagnóstico SRAL
Total de pacientes con diagnóstico SRAL, según raza.
17
11/11/16

Tamaño de muestraTamaño de muestra
¿Cuál es el tamaño de muestra n? y ¿cómo afijar el tamaño de muestra a
cada estrato?
Existen muchas maneras de dividir el tamaño de muestra total entre los
estratos. (afijación de la muestra).
Cada división diferente puede originar una precisión diferente para el
estimador.
¿Qué factores influyen en el mejor esquema de afijación?
La variabilidad de las observaciones dentro de cada estrato.
El número total de elementos de cada estrato.
El costo de obtener una observación de cada estrato.
18
11/11/16

Tamaño de muestra: AfijacionesTamaño de muestra: Afijaciones
Afijación Óptima (costo, varianza y tamaño del estrato).
Afijación de Neyman (varianza y tamaño del estrato).
Afijación Proporcional (tamaño del estrato)
Afijación uniforme (igual en cada estrato)
Afijación Proporcional Valoral (Total X del estrato)
Afijación óptimo relativo (proporcional al coeficiente de variación del
estrato).
Afijación desproporcional (no proporcional)
19
11/11/16

Tamaño de muestra: Afijación de NeymanTamaño de muestra: Afijación de Neyman
Consiste en determinar los valores de tal que para un tamaño de muestra
, la varianza del estimador sea mínima.
También es llamada afijación de varianza mínima.
Con MASsr en cada estrato:
Se obtienen los valores óptimos de que minimiza la función:
20
11/11/16
h
n
n
h
n
µ µ
2 2
2 2 2 2
1 1 1 1
(1 ) 1
( ) ( )
L L L L
h h h
hh h h h h
h h h h h h
f W S
V W V W S W S
n n N
m m
= = = =
-
= = -å å å å
µ
2 2
2
1 1 1 1
1
( )
L L L L
h h
h h h h
h h h h h
W S
V n n W S n n
n N
m l l
= = = =
é ù é ù
F= + - = - + -
ê ú ê ú
ë û ë û
å å å å

Tamaño de muestra . Afijación de Neyman:Tamaño de muestra . Afijación de Neyman:
El valor óptimo de resulta:
Con este se obtiene la varianza mínima del estimador:
El tamaño de muestra para un margen de error E con un nivel de confianza
es:
21
11/11/16
h
n
h
n
n
h h
h
h h
W S
n n
W S
é ù
=ê ú
ê úë ûå
2
2
min
1 1
1 1
L L
h h h h
h h
V W S W S
n N
= =
é ù
= -
ê ú
ë û
å å
( )
2
21
h h
h h
WS
n
D WS
N
=
+
å
å

Tamaño de muestra. Afijación de NeymanTamaño de muestra. Afijación de Neyman
Cuando se estiman proporciones o prevalencias se utilizan las fórmulas:
22
11/11/16
( )
2
(1 )
1
(1 )
h h h
h h h
W P P
n
D W P P
N
-
=
+ -
å
å
(1 )
(1 )
h h h
h
h h h
W P P
n n
W P P
é ù -
=ê ú
-ê úë ûå

Tamaño de muestra. Afijación proporcionalTamaño de muestra. Afijación proporcional
Consiste en repartir el tamaño de muestra en forma proporcional al
tamaño de los estratos de la población. Es decir:
Con MASsrMASsr en cada estrato, el proporcional genera una varianza del
estimador dado por:

23
11/11/16
n
h
n
h
h h
N
n n nW
N
æ ö
= =
ç ¸
è ø
2
2
1
1 1
L
h h
h
Vprop W S
n N
=
æ öæ ö
= -
ç ¸ ç ¸
è ø è ø
å

Tamaño de muestra. Afijación proporcionalTamaño de muestra. Afijación proporcional
El tamaño de muestra para un margen de error E con un nivel de confianza
es:
La afijación de Neyman es similar a la afijación proporcional, cuando las varianzas
en los estratos son iguales. Por lo tanto, la afijación proporcional es conveniente
cuando las varianzas son casi iguales en todos los estratos.
24
11/11/16
n
2
21
h h
h h
WS
n
D WS
N
=
+
å
å

Tamaño de muestra. Afijación proporcionalTamaño de muestra. Afijación proporcional
Cuando se estiman proporciones o prevalencias se utilizan las fórmulas:
25
11/11/16
h
h h
N
n n nW
N
æ ö
= =
ç ¸
è ø
(1 )
1
(1 )
h h h
h h h
WP P
n
D WP P
N
-
=
+ -
å
å
Tags