我不太明白如何使用CHARLS的sample weight,因为没有直接标明PSU。
如果使用以下的STATA/SAS code,我们需要在cluster和strata里需要用哪几个变数,或者直接不用,因为weights计算过程已经包括这些了?
svyset ???? [pweight=ind_weight_ad2], strata(??)
svy, subpop(females): tab var1 var2
proc surveyfreq;
cluster ????;
strata ??;
tables females*var1*var2;
weight ind_weight_ad2;
run;
谢谢
Sample weights usage
Re: Sample weights usage
CHARLS是多阶段的PPS聚类抽样,权重是每个家户或个体抽样概率的倒数,在实际处理中需要cluster到哪个层面是由研究的需要而定。
-
- 帖子: 9
- 注册时间: 周五 1月 29, 2016 4:36 am
Re: Sample weights usage
谢谢项目组的回答。econwang 写了:CHARLS是多阶段的PPS聚类抽样,权重是每个家户或个体抽样概率的倒数,在实际处理中需要cluster到哪个层面是由研究的需要而定。
如果我现在看的是全部个体户,而且因为社区是第一阶段的PSU, 根据PSU数据里的变量和对用户使用手册,我是这样理解权重使用的。
如果我查看baseline sample, 应该使用
proc surveyfreq;
cluster area type urban_ubs;
strata communityID;
tables females*var1*var2;
weight ind_weight_ad2;
run;
如果是longitudinal sample, 应该使用
proc surveyfreq;
cluster area type urban_ubs;
strata communityID;
tables females*var1*var2;
weight INDV_L_weight;
run;
如果有理解不对的地方,希望可以被指正。谢谢