老受访者:根据2013年《CHARLS Wave2 Main Questionnaire》,老受访者不回答da007问题,而是针对每一种慢性病询问两个问题:
1. DA007\_W2\_1:“上一次的访问记录显示您患有/没有 [加载慢性病], 这个记录对吗?”
1. Agree 上次访问记录正确
2. Disagree 上次访问记录错误
2. DA007\_W2\_2:“自上次访问以后(过去两年),是否有医生曾经告诉过您有以下这些慢性病?”
具体询问规则如下:
表1. da007_w2模块询问规则
这两个问题的回答结合2011年访问数据zda007、zda008,才能判定该受访者是否慢性病患者。但判定逻辑存在重叠空间:
1. (ZDA007 = Yes OR ZDA008 = Yes) 受访者上次访问时报告患有慢性病
2. (ZDA007 = not yes OR ZDA008 = not yes) 受访者上次访问时报告没有患有加载慢性病
当zda007和zda008一个是yes,一个是no的时候,这两条判据都成立。
表2. 高血压病患者在zda007、zda008问题的分布
以1号慢性病高血压病为例,有3465+97=3562个受访者的回答,同时符合两种判定条件。
表3. 访问者实际行为统计
对zda007[1] = yes,zda008[1]=not yes的数据进行统计后发现,大部分访问者按照慢性病患者处理,有9名访问者按照非慢性病患者处理。其它十三种慢性病的数据分布也类似。
DA007提问规则
Re: DA007提问规则
2. (ZDA007 = not yes OR ZDA008 = not yes) 受访者上次访问时报告没有患有加载慢性病
个人怀疑此判据属于笔误,OR应为AND。但是在实地访问和数据处理时应用的逻辑如何不得而知
对zda007[1] = yes,zda008[1]=not yes的数据进行统计后发现,大部分访问者按照慢性病患者处理,有9名访问者按照非慢性病患者处理。其它十三种慢性病的数据分布也类似。
此项是否可能是因为da007和zda007,以及da008和zda008存在差异?由于手边没有stata无法亲自验证
Re: DA007提问规则
ZDA007_i_!=1 OR ZDA008_I_!=1, 受访者上次访问时报告未患病,此处OR为笔误,应为AND。
“对zda007[1] = yes,zda008[1]=not yes的数据进行统计后发现,大部分访问者按照慢性病患者处理,有9名访问者按照非慢性病患者处理。其它十三种慢性病的数据分布也类似。”-------zda007=yes, 应该是按照慢性病患者处理,系统再次确认记录是否正确,正确的话跳过,不正确的话认为其是非慢病患者,则会询问自上次访问过后是否又患该病。zda007_1_==1 & zda008_1_!=1 & da007_w2_1_1_==2者中有23人回答自上次访问后又被医生诊断患该病。
对于表3一些9个有数据的情况,可能存在访员发现错误后返回修正答案的情况,错填的数据无法自动删除仍然存在系统中。
“对zda007[1] = yes,zda008[1]=not yes的数据进行统计后发现,大部分访问者按照慢性病患者处理,有9名访问者按照非慢性病患者处理。其它十三种慢性病的数据分布也类似。”-------zda007=yes, 应该是按照慢性病患者处理,系统再次确认记录是否正确,正确的话跳过,不正确的话认为其是非慢病患者,则会询问自上次访问过后是否又患该病。zda007_1_==1 & zda008_1_!=1 & da007_w2_1_1_==2者中有23人回答自上次访问后又被医生诊断患该病。
对于表3一些9个有数据的情况,可能存在访员发现错误后返回修正答案的情况,错填的数据无法自动删除仍然存在系统中。