Sample weights usage

回复
luzhang714
帖子: 9
注册时间: 周五 1月 29, 2016 4:36 am

Sample weights usage

帖子 luzhang714 » 周四 2月 18, 2016 10:10 am

我不太明白如何使用CHARLS的sample weight,因为没有直接标明PSU。

如果使用以下的STATA/SAS code,我们需要在cluster和strata里需要用哪几个变数,或者直接不用,因为weights计算过程已经包括这些了?

svyset ???? [pweight=ind_weight_ad2], strata(??)
svy, subpop(females): tab var1 var2

proc surveyfreq;
cluster ????;
strata ??;
tables females*var1*var2;
weight ind_weight_ad2;
run;

谢谢

econwang
Administrator
Administrator
帖子: 57
注册时间: 周三 1月 13, 2016 4:55 pm

Re: Sample weights usage

帖子 econwang » 周二 2月 23, 2016 2:41 pm

CHARLS是多阶段的PPS聚类抽样,权重是每个家户或个体抽样概率的倒数,在实际处理中需要cluster到哪个层面是由研究的需要而定。

luzhang714
帖子: 9
注册时间: 周五 1月 29, 2016 4:36 am

Re: Sample weights usage

帖子 luzhang714 » 周三 2月 24, 2016 2:33 am

econwang 写了:CHARLS是多阶段的PPS聚类抽样,权重是每个家户或个体抽样概率的倒数,在实际处理中需要cluster到哪个层面是由研究的需要而定。
谢谢项目组的回答。
如果我现在看的是全部个体户,而且因为社区是第一阶段的PSU, 根据PSU数据里的变量和对用户使用手册,我是这样理解权重使用的。
如果我查看baseline sample, 应该使用

proc surveyfreq;
cluster area type urban_ubs;
strata communityID;
tables females*var1*var2;
weight ind_weight_ad2;
run;

如果是longitudinal sample, 应该使用
proc surveyfreq;
cluster area type urban_ubs;
strata communityID;
tables females*var1*var2;
weight INDV_L_weight;
run;

如果有理解不对的地方,希望可以被指正。谢谢

回复