在对某一样本个体进行追踪分析时,我发现其在各轮调查中的慢性病报告状态存在疑点。具体表现为:
r1stroke = 1(第一轮调查报告患有中风)
r2stroke = 1(第二轮调查仍报告患有中风)
r3stroke = 1(第三轮调查仍报告患有中风)
但 r4stroke = 0(第四轮调查报告未患中风)
考虑到中风通常被视为不可逆的慢性疾病,这一“从有到无”的状态转变在逻辑上存在疑点。我查阅了相关的用户手册和数据编码说明,尚未找到对这一现象的官方解释。
因此,想向贵团队咨询以下问题:
这种前后不一致的记录,是否有特定的官方解释?(例如:是受访者自报数据的正常波动、数据清洗或编码规则的调整、受访者中途失访后重新参与时的记录差异,还是其他原因?)
贵团队是否有关于中风等慢性病变量的官方数据清洗建议或处理指南?例如,是否推荐使用前向填充法(一旦报告患病,即假设后续轮次仍患病)来处理此类不一致?