分页: 1 / 1

数据偏向农村问题

发表于 : 周五 3月 03, 2017 11:29 pm
blingwu
老师您好,我在使用stata处理数据的时候发现,平均年龄在45到65岁之间的家庭的户主有77%是农村户口。这与实际的农村人口占比差别太大,请问数据库是否偏向农村呀?有什么办法解决这问题吗?如果偏向农村那么做出来的结果就不是那么准确了。谢谢老师解答!

Re: 数据偏向农村问题

发表于 : 周三 4月 19, 2017 5:41 pm
econwang
CHARLS数据是全国代表性的,加权后能够反映全国人口的分布,当然也包括城乡分布,农村占比高是因为总体中农村户籍占比就很高。

Re: 数据偏向农村问题

发表于 : 周三 4月 19, 2017 7:46 pm
blingwu
econwang 写了:CHARLS数据是全国代表性的,加权后能够反映全国人口的分布,当然也包括城乡分布,农村占比高是因为总体中农村户籍占比就很高。
老师您好,谢谢您为我解答。可是我国在2011年的城镇率就已经达到了51.27%,也就是说,城镇人口数量已经超过了农村人口数量,就算没有大量超过,但是CHARLS的样本里面有77%是农村人口,农村人口数量远远超过城镇人口数量,所以感觉跟整体情况不是很符合。

Re: 数据偏向农村问题

发表于 : 周四 4月 20, 2017 6:27 pm
econwang
blingwu 写了:
econwang 写了:CHARLS数据是全国代表性的,加权后能够反映全国人口的分布,当然也包括城乡分布,农村占比高是因为总体中农村户籍占比就很高。
老师您好,谢谢您为我解答。可是我国在2011年的城镇率就已经达到了51.27%,也就是说,城镇人口数量已经超过了农村人口数量,就算没有大量超过,但是CHARLS的样本里面有77%是农村人口,农村人口数量远远超过城镇人口数量,所以感觉跟整体情况不是很符合。
两个问题你没有搞清楚,第一,你这里引用的总体城镇率是指居住地,而CHARLS的77%是指户口,你需要用同样的定义来对比,基于居住地来看,CHARLS中大概百分之四十多的人居住在城市。第二,CHARLS代表的是45岁及以上的人口,不能用总体人群进行对比,显然中老年人的城镇率更低。

Re: 数据偏向农村问题

发表于 : 周五 4月 21, 2017 12:55 pm
blingwu
econwang 写了:
blingwu 写了:
econwang 写了:CHARLS数据是全国代表性的,加权后能够反映全国人口的分布,当然也包括城乡分布,农村占比高是因为总体中农村户籍占比就很高。
老师您好,谢谢您为我解答。可是我国在2011年的城镇率就已经达到了51.27%,也就是说,城镇人口数量已经超过了农村人口数量,就算没有大量超过,但是CHARLS的样本里面有77%是农村人口,农村人口数量远远超过城镇人口数量,所以感觉跟整体情况不是很符合。
两个问题你没有搞清楚,第一,你这里引用的总体城镇率是指居住地,而CHARLS的77%是指户口,你需要用同样的定义来对比,基于居住地来看,CHARLS中大概百分之四十多的人居住在城市。第二,CHARLS代表的是45岁及以上的人口,不能用总体人群进行对比,显然中老年人的城镇率更低。
老师说得有道理,很受启发!感谢老师答疑解惑!