20110915190432_170527737478 (1基于开源代码构建水色遥感数据处理系统——以HY-1CD为例).ppt

LiAndy9 0 views 72 slides Sep 26, 2025
Slide 1
Slide 1 of 72
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64
Slide 65
65
Slide 66
66
Slide 67
67
Slide 68
68
Slide 69
69
Slide 70
70
Slide 71
71
Slide 72
72

About This Presentation

基于开源代码构建水色遥感数据处理系统——以HY-1CD为例


Slide Content

第四章 分层抽样
第四章 分层抽样第四章 分层抽样
①分层抽样的概念及特点
②抽样标准误差的计算
③抽样数目在各层的分配
本章重点:

第四章 分层抽样
先将总体各单位划分为 若干组(层) ,然后
从各组中按 随机原则 分别抽取一定数目的单位
构成样本,以样本观测结果推断各组的数量特
征和总体数量特征的一种抽样组织形式。
第一节 分层抽样概述
一、概念:
其随机性体现在:层内各单位有相同被抽
中的机会(一般情况下),层与层之间相互
独立。(对层而言是全面调查)

第四章 分层抽样
不仅要求知道总体单位数 N和具体名录,而
且要求掌握至少一个可用以分层的标志的全面
资料。即对于某一标志而言。总体 N个单位的
特征都是可知的。
二、特点:
1.分层抽样要求事先对总体有较多的了解。
用以分层的标志通常有两类:
①与调查标志密切相关的标志。
②调查标志本身的过去资料。

第四章 分层抽样
所以,分层抽样的样本代表性高低,取决于层
内样本对层的代表性,与层间差异无关。因此,
分层抽样要求尽量扩大层间差异,缩小层内差异。
即尽量将层内差异转化为层间差异。为此, 要选
好分层标志。并适当增加分层数。
2.分层抽样对层而言是全面调查,对层
内单位而言是非全面调查。
当总体内部层界越明显,越适合分层抽样,效
果也越好。此外,还可与其他抽样组织形式(整
群、等距)结合,提高抽样效果。
3.适合于调查标志在各单位的分布差异大
的总体。

第四章 分层抽样
(二)作用
1.分层抽样的 抽样效率较高 ,也就是说分层
抽样的估计精度较高。
比较定额抽样,与分层抽样有何区别?
与简单随机样本比较,分层样本在总体中的
分布更为均匀,不会出现偏于某一部分的不平
衡情况,在实际工作中受欢迎。
将相近的单位归为一层,且每一层必有若干
单位抽中,所以,避免了样本明显偏高或偏
低情况。
①分类②确定每类抽选比例③主观抽样

第四章 分层抽样
有时调查的目的不仅要推算总体指标,可能
还要推算各层的指标。
2.分层抽样不仅能对总体指标进行推算,
而且能对各层指标进行推算。
例如,一次全国性抽样调查,若以省为层,
则调查后既可得到有关全国的数据,又可得到
各省的数据,这一点大受各级政府领导的欢迎
,也便于部门统计。
可使我
们获得关于总体内部较多的 信息。

第四章 分层抽样
例如,某
项全国范围的大型抽样调查,要
编制
全国范围的抽样框往往是一件非常困难的
事,
但如果抽样按行政区划或行 业分层后,可
以调
动各级主管部门的积极性,分头编制抽样

并实施抽样的组织和调查工作。为了组织调
查的
方便,各层可以 根据层内的特点,分别 采
用不同的抽样
方法。
3.层内抽样
方法可以不同,而且便于抽样工
作的组织。

第四章 分层抽样
二、使用
场合与分层原则

据分层抽样的特点,分层 除了可以提 供子总
体指标和便于调查的组织实
施外,通常,使用分
层抽样的主要目的是为了提高估计的精度。为


利用分层抽样的特点,在一 项抽样调查 项目中

往往反复 使用分层抽样 方法。
在对层进行具体划分时,通常
考虑如下原则:
通常按调查对
象的不同类 型进行划分。这时,
分层抽样能
够对每一类的目标量进行估计。
1.层内单
元具有相同性 质。

第四章 分层抽样
通常用于分层的指标有行政区划、
地理位置、
海拔
高度、行 业、经济发达程 度、企业规模 、
家庭收入水
平、性别等。
2.使层间单
元的差异尽可能大。从而 达到提
高抽样估计精度的目的。
3.既按类
型又按层内单 元标志值相近的原则
进行多重分层,同时
达到实现估计层 值以及提
高估计精度的目的。
4.抽样组织实
施的方便。通常按行政 管理机

设置进行分层。

第四章 分层抽样
例如,对全国
范围汽车运输 的抽样调查,调查
目的不仅要推算全国
货运汽车完 成的运量,还要
推算不同
经济成分(国有、 集体、个体) 汽车完
成的
运量。为组织的 方便,首先将货运汽车 总体
按省分层,
由各省运输管理 部门负责省内的调查
工作
;各省再将省内拥有的汽车按经济成分分层

为提高抽样效率, 再按吨位对汽车分层。
又如,某高
校对学生在宿舍使用电脑的情况进
行调查,
根据经验,本科生和研究生拥 有电脑

状况差异较大,因此,在抽样 前对学生按本
科生
和研究生进行分层是有必要的。

第四章 分层抽样
第二节 分层抽样的简单估计
设X
ij为第i层第j个单位的标志
值(
i=1,2…
k,j=1,2…N
i), 为层内样本均
值, 为层

值, 为样本均 值, 为总体均 值, 为层总值
, 为总体总
值,则有:
iXix
x X iT
X
TX
iij
n
i nxx
i

一、层和总体体
参数的估计量。
iij
N
i
NNX
i

(即总体分为 k层,第i层有N
i
个单位,ΣN
i
=N)

第四章 分层抽样
nxnnxx
ii
K
iij
nKi
















ii
Ni
j
ijiT
XNXX 
1
NxNNxX
ii
K
iij
NiK













iiij
NiK
T xNxX 

第四章 分层抽样

面六个式子中,只有 和 可通过样本资料计
算,其
余四个都需要估计。在简单估计下,各
估计量为:
i
xx
iiiTii xNXxX 
ˆˆ
XNxNX
ii
K
T
ˆˆ

stii
K
ii
K
xNxNNXNX 记为
ˆˆ

第四章 分层抽样
容易证
明, 是 的无偏估计量。
进一
步可得 也是 的无偏估计量。
X
ˆ
 
XNxNE
NxENNxNEXE
ii
K
ii
K
ii
K








ˆ
TX
ˆ
TX
ii
WNN 
i
ii
K
xWX
ˆ
X
(第 层单位数
占总体
单位数的比重)
如果

则:

第四章 分层抽样

们知道,纯随机抽样的抽样误差,是按总体

差计算的,对于分层抽样, 由于对各层而言
是全面调查,
故层间不存在抽样误差 问题。所
以,其抽样
方差等于平均层内 方差。
2


222
Pi
 
二、分层抽样简单估计的抽样标准误
如果我
们对总体方差 进行分解,可得
总体
方差
=平均层内
方差
+层间

第四章 分层抽样
其中:

iiii nfx
22
1 
iii Nnf
 
 
iiii
K
ii
K
ii
nfW
XWxWX
22
2222
1

)(
)()
ˆ
(


在不重
复抽样下, 根据前一章公式可知
也就是说,每一层可
看作一个子总体。
所以:

式在重复抽样下,则 设有(
1-f
i)

第四章 分层抽样
[例3
.1]
调查某
地区的居民奶制品年消费支 出,

居民户为抽样单 元,根据经济及收入水平将居
民户
划分为
4层,每层按简单随机抽样抽取 1
0

,调查获得如下数据(单位: 元),如表
3
.1
。估计
该地区居民奶制品年消费 总支出及估计的
标准差。
表3
.1
样本
户奶制品年消费支 出
见教材P44页

第四章 分层抽样
???
思考问题 :
如何计算与估计
该地户均奶制品消费支
出?即如何计算样本
户户均奶制品消费

出?


1:
40
40
1
40
1



i
i
i
i x
n
x
x

第四章 分层抽样


2:
i
i
x
N
N
x



3:
i
i
i
x
N
n
x

应该采
用哪种算法?

第四章 分层抽样
总体比例的估计


iipWP
总体比例
P的估计为:
对于一般的分层抽样,
P的方差为:

 )()(
iipVWpV
2
对于分层随机抽样,
P的方差为:


i
ii
ii
n
QP
fWpV )()( 1
2

第四章 分层抽样
的一个无偏估计为: )p(V



1
1
2
i
ii
ii
n
qp
fWpv )()(


3.2】
在例
3.1的调查中,同时调查了
居民
户拥家庭电脑
的情况, 获得如下数据(单位:

),如表
3.2。估计
该地区居民拥有家庭电脑
的比例及估计的标准差。
见教材P46页

第四章 分层抽样
如果按等比例抽样,即各层抽取的单位数

样本
n的比重等于
该层单位数 占总体
N的
比重。
即:
i
n
i
N
i
ii
W
N
N
n
n

 
iii
K
nfWX
222
1 )(
ˆ
则:
22 1
1 
n
f
nWf
ii
)(
)(


)()( Nnffn
N
n
W
n
n
iii
i
i
i
i
K







 
2
1
等比例分层抽样

第四章 分层抽样














n
PPW
n
PP
P
n
W
n
X
i
K
ii
K
)()(
)
ˆ
(
)
ˆ
(
11
22



这样我
们就可得出等比例分层抽样的抽样平
均误差
公式
:

复抽样

第四章 分层抽样
不重
复抽样

















)1(
1
1
)1(
)
ˆ
(
1
1)
ˆ
(
2
2
PPW
n
f
f
n
PP
P
W
n
f
f
n
X
i
K
ii
K




实际
应用中,以层内样本 方差代替总

方差。

第四章 分层抽样
例:某市有商店250家,按以往销售 额分为大,中,小 三类。现抽 50
家进行季度销售 额调查,测得各层的样本 均值
ix和样本方差
2
i
S如下:
分层
商店

wi
各层抽样
数 ni
样本均值
(万元)ix
样本方差
(万元)
2
i
S
大型商店 25 0.1 5 1700 2800
中型商店 75 0.3 15 800 6985
小型商店 150 0.6 30 120 10850
 250 1.00 50 —— ——
要求以95.45%的保证程度 对该市平均每家商店 的季销售额作区间估
计,

第四章 分层抽样
解:本
题中
,. NNnn20fff
ii321 
是等比例分配的分层抽样。
万元9211
501085060698530280010201
1
1
2
2
.
)...)(.(
)()()
ˆ
(





ii
i
SW
n
f
f
n
X


)(
...
ˆ
万元482
1206080030170010


ii
K
xWxX
84232 .)
ˆ
( Xtt
x
估计区间为 [48
2±23.84]
万元

第四章 分层抽样
此时,各层抽样比 也相等:

、各层应抽单位数 的确定
确定
最简单常用的 方法,它只考虑 各层单位

占总体
N的比重大小这一因
素。
in
i
n
i
N
nwNnNn
N
N
n
n
iii
ii

if
f
N
n
N
n
f
i
i
i

(1)比例分配
法。

第四章 分层抽样

于没考虑不同层有不同 变异程度,而是 把
它们
同等看待了。事实 上,变异程度大的层 应
多抽样本,
变异程度小的层 应少抽样本,若某

没有变异,只需抽
??单位就
够了。
???
比例分配
法的缺陷:
所以,此
法不能使抽样精度 达到最高。

第四章 分层抽样

法同时考虑了各层单位数和各层标准差两
个因
素。它在给定条件下,所确定的 能使估
计量的
方差达到最小。
i
n
nn
i

min)
ˆ
(
2
X
)()
ˆ
( nnXQ
i
 
2
(2)N
eyman

奈曼)分

即在
约束条件

立目标函数:

使
即: )()( nn
n
f
N
N
Q
i
i
i
i
i
 

2
2
2
1

第四章 分层抽样











i
2
i
2
2
i
i
2
i
2
2
i
i
2
i
i
i
2
2
i
i
2
i
i2
2
i
NN
N
nN
N
nN
n
1
N
N
n
f1
N
N



)(
)(
求 关于 的偏导,并
令其等于
0,得:

Q
i
n
0
2
2
2
2





i
ii
i nN
N
n
Q
NNn
iii

由于:
nNNn
iii  

NnN
ii所以:

第四章 分层抽样
按此
法确定的 ,有 最小的估计量 方差为:
ii
ii
i
N
N
nn




i
n















i
i
i
i
i
N
n
f
N
N
W
 
 
N
W
n
W
f
nN
N
X
iiii
i
i
ii
22
2
2
2
2
1








ˆ

入①有:

请同学们自己 去推导)

第四章 分层抽样
若各层的标准差相等,则有:
nW
N
N
n
N
N
n
N
N
nn
i
i
i
i
ii
ii
i 






即为比例分配。
???最优
分配可能可能出现 的情况 吗?
ii
Nn

第四章 分层抽样
△某
些层需要超过
1
00%
抽样时的


在某
些特殊情形,例如某 些层的方差特别
大,按
最优分配方法,这些层有可能 需要超
过1
00%
抽样,即 。ii
Nn
此时的
处理办法 (
?):提出
你自己的思
路来!
对这
些层进行
1
00%
抽样,然后将
剩下的

分配的样本是 再按最优分配公式在其余层
内分配。
解决
思路:

第四章 分层抽样

最优分配公式,若有某层(不 妨记为第
1层)

最优分配样本量 ,则 令实际抽样量:
iiNn
11Nn
1Nn
i
ii
ii
i
N
N
Nnn



 )(
1
步骤
如下:
对其
余各层
:
(i 2)


仍有
:
如:
22Nn

第四章 分层抽样


: 2211 ,NnNn 
ii
ii
i
N
N
NNnn



 )(
21 (i 3)


到类似情况同样 处理,直到所有分配的样
本量都不
超过为止。
而此时
最优分配达到的最小方差公式②需
作相
应的修改,对于那些作全面调查的层,

产生抽样误应,因此方差只来自实际抽样
的层。

第四章 分层抽样
 
,)(
22
2
N
W
n
W
x
iiii 






其中 为仅对
最后实际分配 的层求和,
为这
些层中抽样的样本量之和。
 iiNn
n

些层需要超过
1
00%
抽样时

修正之例:

第四章 分层抽样
例:某个总体分为四层,资料如下,

n
=80,
问如何进行各层样本分配( 奈曼分
配)?
层 N
i S
i N
iS
i n
i
1
2
3
4
5
10
200
400
400
500
10
20
2000
5000
2000
8000
9.41
23.53
9.41
37.65
∑ 615 17000 80

第四章 分层抽样
计算
步骤如下:
1、按
正常公式计算
n列
于表的右列。其中
1
、2层均
超过各自的层中所 包含的单元数,必

进行修正。
2、

n
1
=
N
1
=5,然后将
剩下待分配的样本量
n-
N
1=75仍
按奈曼分配公式分配到
2
—4
层,结果是

22
25
15000
5000
75 Nn 
3、
再令 ,然后将剩下
65个样本单
元仍

奈曼分配公式分配到
3
—4
层,结果是:
10
22
Nn
33
13
10000
2000
65 Nn 

第四章 分层抽样
44
52
10000
8000
65 Nn 
因此
最终结果是:
5;1
0
;13;5
2
此时的估计量
方差达到最小值:
591734759006764
20
615
400
10
615
200
615
1
20
615
400
10
615
200
65
1
22
...
)(
)(
min


V

第四章 分层抽样
考察
, 、 和调查费用
C三
个因素。即要在
调查总
费用既定、各层单位调查 费用不同的
条件
下,所确定的 能使估计量的 方差达到最
小。
i
N
i
i
n
ii
k
cncc 
0
)(
2
st
x

三)经济分配法(最优分配)
其中C为总调查
费用,
C
0为
固定费用,
C
i为第层的单位调查
费用。
也就要在
约束条件 :
下,
使 最
小。

第四章 分层抽样

立目标函数:
)()(
0
ccncxVQ
ii
k
xt
 
求偏导并
令其为
0得:
0
2
2
2
2



i
i
ii
i
C
n
Q
N
N
n
Q

iiii cWn 
iii
K
i cwnn 

由于
两式相

iii
iii
iii
iii
i
cN
cN
n
cW
cW
nn






若各层单位调查

用相等,则 该
式同与
奈曼分配
得:
得:

第四章 分层抽样

经济方法 确定的估计量的 方差为:
若各层单位调查
费用相等,则 上式等同于
奈曼
分配。
iiist
nfxV
2
1)()( 
i
ii
i
ii
N
W
n
W
2222


N
W
cW
n
cW
ii
iii
iii
2


 


第四章 分层抽样
例:
设某总体
N
=5000
,分
三层,资料如下表。
n=
100

问在三种分配方法下的
n
i以及估计量


.


Ni i
ix
ic(单位调
查费用)
Ⅰ 1500 12 10 5
Ⅱ 2200 28 28 6.2
Ⅲ 1300 51 45 8
 5000 — —— ——

结果
请同学们自己 计算。

第四章 分层抽样

1n
2n
3
n )(
2
stx
等比例分配 30 44 26 10.43
最优分配 13 42 45 8.30
经济分配 14 44 42 8.36

计算结果如下:

第四章 分层抽样
在等比例分配
法下,各层 应抽单位数为:
26260100
44440100
3030100
33
22
11



.
.
.
nWn
nWn
nWn
估计量的
方差为:
43.10
100/)5126.02844.0123.0(%)21()(
222


st
xV

第四章 分层抽样

奈曼分配法下,各层 应抽单位数为:
13
)511300282200121500/(121500100
/
111


  ii
NNnn 

理可得:
4542
32
 nn
估计量

差为
30.8
5000
]5126.02844.0123.0[
100
]5126.02844.0123.0[
)(
222
2





st
xV

第四章 分层抽样

最优分配法下,各层 应抽单位数为:
14
)
8
5126.0
2.6
2844.0
5
123.0
/(
5
123.0
100
111
111
1









cW
cW
nn



理可得:
4244
32
 nn

第四章 分层抽样
36.8
5000
)5126.02844.0123.0
)85126.02.62844.05123.0(
100
)
8
5126.0
2.6
2844.0
5
123.0
(
)(
222










stxV
估计量
方差为:

第四章 分层抽样
① 相差不大时


见对于相同的
n,在不同分配
法下,有
不同的n
i和不同的估计量
方差 。

事实上,当各层 相差不大时, 经济分配法
意义
不大。
)(
st
xV
i
c
i
同时,在多数情况下,
奈曼分配法也无多大 “
优势”

???
② 未
知要用
S来
代替时。

难以保证奈曼 分配法一定优于比例分配 法
i

第四章 分层抽样
样本量的确定
一、一般
公式
令n
i=nw
i,其中w
i已经
选定
,于是当

差V给
定时
,可
由以下公式
:





L
i
i
i
i
L
i
i
i
i
L
i
i
i
i
i
S
N
W
S
n
W
S
n
f
WV
1
2
2
1
2
2
1
221



L
i
i
i
i
L
i
i
i
i
S
W
W
N
S
w
W
n
1
2
2
1
2
2
11
得到确定样本
量的一般
公式
为:
N
SW
V
w
SW
n
ii
i
ii




2
22

第四章 分层抽样
当按比例分配时,
实际工作中, n的计算可分两
步走
,先计算
:

iiWw
N
SW
V
SW
n
ii
ii




2
2
V
SW
n
ii

2
0
然后进行
修正:
N
n
n
n
0
0
1

第四章 分层抽样
当按N
eyman
分配



ii
ii
i
SW
SW
w








2
2
2
2
ii
ii
ii
ii
SWNV
SWN
N
SW
V
SW
n
)()(
当按
最优分配
(经济
分配
)时,由
下式
:

N
SW
cSW
n
cSW
V
ii
iii
iii
2








2
ii
iiiiii
SWNV
CSWCSWN
n
))(/(

第四章 分层抽样
例:某总体 N
=5000
,分
三层,资料如下

分层 N
i σ
i C
i
1
2
3
1000
2700
1300
100
212
510
2
6
10
125
265
530
合计 5000------------
iX
要求在总体均
值估计量方差不超过
3
50

前提下,分别计算比例分配、 奈曼分配

最优(经济)分配下的样本 容量。

第四章 分层抽样

据表中资料可计算得到:
728103/
26720506)(
93896306
26.054.02.0
2
2
321







iiiiii
iiii
ii
CWCW
WXXW
WX
WWW



255
938963505000
938965000





n

第四章 分层抽样
194
938963505000
2675000
2





n
204
938963505000
7281035000





n
奈优比 nnn 

第四章 分层抽样
四、分层抽样简单估计的效果分


V

V

V
nfV /
2
1

一般情况下,对于相同的 n,

≤≤
因为:
 nWfV
ii/
2
1 

第四章 分层抽样
而:  
2
21
Xx
N
ij
Nik

   
21
XXXx
N
iiij
Ni
j
k
i

      
iij
N
ii
k
ii
Nik
iij
Nik
XxXx
N
Xx
N
Xx
N

211 22
 
2
211
XXN
N
N
N
ii
k
ii
k
 
 
22
2
2
p
iiii XXWW




即层内平均
方差
+层间

第四章 分层抽样
从而:
   
2
22 1
1 XXWW
n
f
nfV
iiii


 /

 
2
ii XXW
n
f1
V 



显然

V

V≥

第四章 分层抽样
又因为:
  NWNWV
iii
//
22


21
iiW
n
f
V 



NWnW
ii
//
22
 
22
22
)(
)(

 nWnWVV
iiii奈比
])([
22
 EED
而:


0 )(D
当各层标准差相等时,等
号成立。

外, 一般介于 与 之间。

V

V

V

第四章 分层抽样
分层抽样的其他
问题:
一、
什么时采用分层抽样

前所述,分层抽样的效果一般 优于纯随
机抽样,因而在实际中得到
广泛应用。但是
否任
何一次抽样都 应该采用分层抽样 呢?这

涉及到以下 几个问题:

、如果说分层抽样的效果 优于纯随机抽
样,
那么从所增加的 人力财力 与所提高的抽
样精度对比
上看是否值得?

第四章 分层抽样
如果分层抽样并不
需要增加什么费用,

者说所增加的 费用有限,那么只要其他
条件
适合,就可 采用分层抽样组织形式。
如果分层抽样在
方差上下降的幅度不大

那么有时从工作简便性 考虑,即使分层
抽样不会增加
费用,也宁可采用纯随机抽
样。

第四章 分层抽样

、分层抽样的效果是 否一定优于纯随抽样?
当层间
方差大,层内 方差小,即分层合 理时
,分层抽样效果
优于纯随机抽样 ;但如果分
层标志选
择不当,造成分层极不合理时,可
能会
发生相反的情况。所以不是 任何分层的
分层抽样都有好的效果。

第四章 分层抽样

、如果不 采用分层抽样, 纯随机抽样的估
计精度是
否达到事先所 设计的要求?
这是从抽样推断的实际
需要来考虑的。有时
,分层抽样所能提高的精度可能是
很有限的,

为了达到事先设计的精度要求或尽量提高抽
样精度,
哪怕是一点点, 那么在样本容量不能
增加的情况下,分层抽样是必要和
值得的。

第四章 分层抽样
二、如何选
择分组标志?
  
为了使分层抽样的层间 方差尽量大,选 择好分层
标志是关
键中的关键。如果分层标志选 择有误,就可
能使分层抽样的误差比
纯随机抽样的还要大。例:
男 300320150160165170
女 315320155120
某总体
由6名男职工和4名女职工组成,月奖

(元)分别为
:(n=5).
容易
计算
:
25.6361
5.217
2


总体方差
总体均值X

第四章 分层抽样
1、在
纯随机抽样下估计量 方差为:
868.706
)1(
)(
2



 
Nn
nN
xV
2、按工资高低分两层,每次抽取 50%
的单位,其估计量
方差为:
高 320320315300
低 165170155120150160
583.22
)1(
)(
2



 ii
ii
ii
st W
Nn
nN
xV 
说明分层抽样的效果较好。

第四章 分层抽样
3、按性别分层进行分层抽样,每层

抽50%的单位,估计量
方差为:
38.799
)1(
)(
2



 ii
ii
ii
st
W
Nn
nN
xV 
估计量
方差比纯随机抽样的还大,这样
的分层抽样是
很不好的。
分层抽样中选
择好分组标志的关 键是让
调查标志分层后的层间
方差达到最大。提
出以下
几点思路:

第四章 分层抽样
1、如果具
备调查标志的全面的过去资料,
而且
变化不会太大,那么以调查标志本身的
过去资料
来分层是值得提倡的。
例如某省以
县为单位进行 粮食总产量分
层抽样调查,
那么就可以按各 县过去的粮

总产量资料进行分层。
2、尽量
利用自然分层标志。

居民按居住地域标志分为 城镇居民和
农村
居民两层;土地按自然耕作条件分层等。

第四章 分层抽样
3、
充分利用那些能决定调查标志数量差
异的
品质标志。
例如:
职业往往能决定收入高低,因此 职业
标志作为
居民收入 抽样调查的分层标志是合适
的。

如,居民的性别差异能决定个 人消费支出
结构的差异,因此以性别标志作为
居民消费支
出结构调查的分层标志也是合适的。

先选择品质标志的另一个理由是:其标志
表现较数量标志少得多,界
限也易确定。
4、在多个可
供选择的数量标志中, 应选择

个与调查标志相关 系数之绝对值最大者。

第四章 分层抽样

、分几层
分层标志选好后的
问题是,如何确定分层数。
分层数的多少与分层抽样效果有关。
思考
???:

正常情况下,层数多少与层

方差及抽样效果有何关 系?

于总体方差可分解为层内 方差与层间 方差
两部分,所以,
正常情况下 ,分层数越多,层

方差就会越大,分层抽样的效果就会越好。
所以,在样本单位数既定和不增加调查
费用(或
增加不多)的情况下,尽量多
地分层是可取的。

这并不意味着分层数可以无 限多。两个原因:

第四章 分层抽样
其一:因为当层数
达到一定时,估计量 方
差下
降的速度就变得很慢,这时再增加层数的
意义
就不大。
其二:分层越
细,工作量就越大, 费用也
不可能不增加。因此当层数
达一定量时, 再分
层的
费用会大幅度上升,与所提高的精度相比
可能会得不
偿失。
对于按
自然标志分层的总体, 自然层数通
常就是
理想的和有效的层数。
因为这种分层
轮廓清晰 、层次分明,即与
实际情况相
符,又能体现性 质差异,并且 基

上现成可用。

第四章 分层抽样

采用现代多 元统计分析方法中的聚类分

与判别分析法来确定层界和层数。 但要注

以下几个问题:
若是按数量标志分层,而层界较
难确定时,
可用
什么现代统计分 析方法解决?
1、
聚类、判别分析要与定性分 析相结合,避
免以数量
上的小距离把不同性质的单位归为
一类。例如:计划 99
%
与1
01%
;5
9
与60

2、要与
传统统计分 析法相结合, 灵活分层,

拘泥与数量框框。
3、要具
备一定的现代计算 技术条件。

第四章 分层抽样
小结
  
本章介绍了分层抽样 理论及若干相关 问题
。分层抽样
技术在实际中 应用非常广泛,几乎
所有的大
型抽样调查 项目都要用到分层抽样 技

,有时与其他抽样 方法结合反复使用。人们
之所以
喜欢分层抽样 技术主要是因为便于 项目
的组织与
管理,同时,其抽样效率通常比简单
随机抽样要高。
  
与简单随机抽样相比,分层抽样在抽样之
前需
要对总体抽样 框进行分层,这个过 程有时
是现成的,有时
需要增加额外的工作量,而且
有时可能是相当
费时费事的。在推算时 需要知
道各层的层
权或层的大小。
Tags