请问为什么在Demographic Background和大多数数据中Obs都是18000多,而family infomation数据中只有10000多个Observation?是因为家庭数是10000户左右、而个人受访者一般为家庭户中受访者与受访者配偶的缘故吗?
另外,在居住偏好变量中 cg001_w2_1 有10000多个,而受访者配偶的回答 cg001_w2_2 只有2000多,是什么原因呢?
多谢
Family_Information
Re: Family_Information
关于楼主的第一个问题,我有一样的疑问。并且想加问一个问题,如果家庭信息是家庭模块受访者统一回答的,那么如果我需要把该受访者的子女、父母、兄弟信息以及该受访者配偶的子女、父母、兄弟信息分别对应到个人受访者数据上,是不是应该用householdID和ID一起来merge?如果两者都吻合,就同时是家庭受访者和个人受访者,如果只有householdID吻合,ID不吻合,那这个个人受访者就是该家庭受访者的配偶?
多谢!!
多谢!!
Re: Family_Information
- family information是家庭模块,由两个受访者之中的一个回答,所以观测值远小于个人模块,该模块的ID即回答这个模块的人的个人ID, 通过家户ID可以和其他模块匹配
- 居住安排中的配偶部分,由于这道题不允许代理,在访问家庭模块时,大部分家庭只有一个受访者在场,所以配偶部分缺失比较严重
Re: Family_Information
多谢!econwang 写了:
- family information是家庭模块,由两个受访者之中的一个回答,所以观测值远小于个人模块,该模块的ID即回答这个模块的人的个人ID, 通过家户ID可以和其他模块匹配
- 居住安排中的配偶部分,由于这道题不允许代理,在访问家庭模块时,大部分家庭只有一个受访者在场,所以配偶部分缺失比较严重