分页: 1 / 1

Sample weights usage

发表于 : 周四 2月 18, 2016 10:10 am
luzhang714
我不太明白如何使用CHARLS的sample weight,因为没有直接标明PSU。

如果使用以下的STATA/SAS code,我们需要在cluster和strata里需要用哪几个变数,或者直接不用,因为weights计算过程已经包括这些了?

svyset ???? [pweight=ind_weight_ad2], strata(??)
svy, subpop(females): tab var1 var2

proc surveyfreq;
cluster ????;
strata ??;
tables females*var1*var2;
weight ind_weight_ad2;
run;

谢谢

Re: Sample weights usage

发表于 : 周二 2月 23, 2016 2:41 pm
econwang
CHARLS是多阶段的PPS聚类抽样,权重是每个家户或个体抽样概率的倒数,在实际处理中需要cluster到哪个层面是由研究的需要而定。

Re: Sample weights usage

发表于 : 周三 2月 24, 2016 2:33 am
luzhang714
econwang 写了:CHARLS是多阶段的PPS聚类抽样,权重是每个家户或个体抽样概率的倒数,在实际处理中需要cluster到哪个层面是由研究的需要而定。
谢谢项目组的回答。
如果我现在看的是全部个体户,而且因为社区是第一阶段的PSU, 根据PSU数据里的变量和对用户使用手册,我是这样理解权重使用的。
如果我查看baseline sample, 应该使用

proc surveyfreq;
cluster area type urban_ubs;
strata communityID;
tables females*var1*var2;
weight ind_weight_ad2;
run;

如果是longitudinal sample, 应该使用
proc surveyfreq;
cluster area type urban_ubs;
strata communityID;
tables females*var1*var2;
weight INDV_L_weight;
run;

如果有理解不对的地方,希望可以被指正。谢谢