关于2013年数据权重和多出样本的两个问题?

回复
xiaolongbao
帖子: 2
注册时间: 周三 5月 31, 2017 9:01 pm

关于2013年数据权重和多出样本的两个问题?

帖子 xiaolongbao » 周三 5月 31, 2017 9:15 pm

项目组的老师好!

关于数据有以下两个问题:
(1)2013年比2011年多了一些样本,在使用手册中提到了refresh sample。想请问多出的部分是wave1没访问到后来wave2访到了,以及refresh的?怎么refresh的?能否保证样本的全国代表性?
(2)权重有cross-section和longitudinal两种,cross-section的权重有几百例是missing的,想问是什么情况?

谢谢!

econwang
Administrator
Administrator
帖子: 55
注册时间: 周三 1月 13, 2016 4:55 pm

Re: 关于2013年数据权重和多出样本的两个问题?

帖子 econwang » 周四 6月 08, 2017 3:53 pm

xiaolongbao 写了:项目组的老师好!

关于数据有以下两个问题:
(1)2013年比2011年多了一些样本,在使用手册中提到了refresh sample。想请问多出的部分是wave1没访问到后来wave2访到了,以及refresh的?怎么refresh的?能否保证样本的全国代表性?
(2)权重有cross-section和longitudinal两种,cross-section的权重有几百例是missing的,想问是什么情况?

谢谢!
  1. refresh sample 2011年用户手册有说明,是指在2011年不满45岁,但是到了2013年达到45岁的样本,这些样本在11年做了记录,但是没有访问,13年的cross section样本同样具有全国代表性
  2. cross section样本与longitudinal样本的问题,这个release note 有说明,13年不但追踪了11年抽中的样本以及refresh sample, 还纠正了11年应答样本中发现的错误

xiaolongbao
帖子: 2
注册时间: 周三 5月 31, 2017 9:01 pm

Re: 关于2013年数据权重和多出样本的两个问题?

帖子 xiaolongbao » 周六 6月 10, 2017 2:08 pm

econwang 写了:
xiaolongbao 写了:项目组的老师好!

关于数据有以下两个问题:
(1)2013年比2011年多了一些样本,在使用手册中提到了refresh sample。想请问多出的部分是wave1没访问到后来wave2访到了,以及refresh的?怎么refresh的?能否保证样本的全国代表性?
(2)权重有cross-section和longitudinal两种,cross-section的权重有几百例是missing的,想问是什么情况?

谢谢!
  1. refresh sample 2011年用户手册有说明,是指在2011年不满45岁,但是到了2013年达到45岁的样本,这些样本在11年做了记录,但是没有访问,13年的cross section样本同样具有全国代表性
  2. cross section样本与longitudinal样本的问题,这个release note 有说明,13年不但追踪了11年抽中的样本以及refresh sample, 还纠正了11年应答样本中发现的错误
好的,谢谢!

IL1008
帖子: 5
注册时间: 周四 1月 09, 2020 9:25 pm

Re: 关于2013年数据权重和多出样本的两个问题?

帖子 IL1008 » 周三 9月 15, 2021 10:24 am

您好老师,打扰您了,想请教您是如何使用CHARLS weight应用在计算中的。
因为weight现在可以达到好几万,不知道如何使用,想请教老师这一块的内容~

sgwwc
小萌新
小萌新
帖子: 12
注册时间: 周日 9月 27, 2020 1:28 pm
来自: CHARLS

Re: 关于2013年数据权重和多出样本的两个问题?

帖子 sgwwc » 周三 9月 15, 2021 7:51 pm

想要直观地理解 weight 权重变量,可以将权重看成每一个受访者对应于全国水平下的同年龄及个人特征相似的人口。比如说,3万权重就相当于对应全国的3万人口。在使用 Stata 进行加权统计时,直接将 pweights 变量设为权重变量即可。

回复