Sample weights usage

luzhang714 · 帖子由 **luzhang714** » 周四 2月 18, 2016 10:10 am

我不太明白如何使用CHARLS的sample weight，因为没有直接标明PSU。

如果使用以下的STATA／SAS code，我们需要在cluster和strata里需要用哪几个变数，或者直接不用，因为weights计算过程已经包括这些了？

svyset ？？？？ [pweight=ind_weight_ad2], strata(？？)
svy, subpop(females): tab var1 var2

proc surveyfreq;
cluster ？？？？;
strata ？？;
tables females*var1*var2;
weight ind_weight_ad2;
run;

谢谢

帖子由 **econwang** » 周二 2月 23, 2016 2:41 pm

CHARLS是多阶段的PPS聚类抽样，权重是每个家户或个体抽样概率的倒数，在实际处理中需要cluster到哪个层面是由研究的需要而定。

luzhang714 · 帖子由 **luzhang714** » 周三 2月 24, 2016 2:33 am

econwang 写了：CHARLS是多阶段的PPS聚类抽样，权重是每个家户或个体抽样概率的倒数，在实际处理中需要cluster到哪个层面是由研究的需要而定。

谢谢项目组的回答。
如果我现在看的是全部个体户，而且因为社区是第一阶段的PSU, 根据PSU数据里的变量和对用户使用手册，我是这样理解权重使用的。
如果我查看baseline sample, 应该使用

proc surveyfreq;
cluster area type urban_ubs;
strata communityID;
tables females*var1*var2;
weight ind_weight_ad2;
run;

如果是longitudinal sample, 应该使用
proc surveyfreq;
cluster area type urban_ubs;
strata communityID;
tables females*var1*var2;
weight INDV_L_weight;
run;

如果有理解不对的地方，希望可以被指正。谢谢

中国健康与养老追踪调查数据论坛
CHARLS FORUM for DATA USERS

Sample weights usage

Sample weights usage

Re: Sample weights usage

Re: Sample weights usage