Memo_健康不平等与分位数回归(UQR-RIF)方法

Cai J, Coyte P C, Zhao H. Decomposing the causes of socioeconomic-related health inequality among urban and rural populations in China: a new decomposition approach[J]. International journal for equity in health, 2017, 16(1): 128.
摘要:这篇论文偏RIF计量应用。研究发现,自1989年到2006年间,健康地位均值无论城乡都有下降,农村居民的健康地位分数高于城市居民。同时发现,中国存在有利于富人的健康不平等。无论城乡,收入和初中教育作为减少健康不平等的主要因素,年龄增长、不健康生活方式与贫穷家庭环境,则增加了健康不平等。医疗保险对城乡的健康不平等有相反作用,会影响城市人口的不平等程度较低,而农村人口的不平等程度更高。

背景:研究目的是探索,过去二十年间中国城乡的,社会经济地位如何影响了健康不平等。
方法:使用1991年至2006年间的CHNS六期数据,无条件分位数回归模型中的Firpo、Fortin和Lemieux(2009)的再中心化影响函数(recentered influence function, RIF)回归分解方法,分解中国的社会经济相关的健康不平等。健康地位来源于自评健康分数(self-rated health, SRH)。分城乡进行数据分析。
结论:这些发现表明,减少与社会经济相关的健康不平等的有效途径不仅是增加收入和改善获得医疗保健服务的机会,而且要注重改善生活方式和家庭环境。具体而言,对于农村人口来说,改进医疗保险的设计,实施更全面的一揽子保险计划,有效地针对农村贫困人口尤为重要,此外有必要全面推广农村抽水马桶和自来水。对于城市人口来说,除了促进普及中等教育外,还应提倡健康的生活方式,包括控制酒精等措施。

(一)变量:SRH与New Health Score

问卷中自测健康(SRH)有四个水平(差、一般、良好和优秀)。利用Van Doorslaer和Jones提出的方法,将SRH的类别变量转化为0-1尺度上的连续变量。完成这个转变有三个步骤。首先,使用有序probit模型对一组协变量(包括人口统计学和社会经济相关变量)进行回归分析。第二,用线性指数预测来预测健康分数。第三,通过使用以下公式,可以将有序probit模型的预测健康分数重新调整到[0,1]区间:

$H_{i}=\frac{h_{i}^{*}-\min \left(h_{i}^{*}\right)}{\max \left(h_{i}^{*}\right)-\min \left(h_{i}^{*}\right)}$

其中,人口统计学变量为性别、世代(18-33、33-43、43-56、56+)、民族、婚姻、家庭成员数量;社会经济相关变量为家庭人均年收入、是否工作、教育(类别变量)。$H_{i}$越大,受访者越健康。
此外,模型中其他变量为生活方式(是否吸烟、是否饮酒、BMI、是否自来水、是否抽水马桶、地区、调查年份、是否医保)

(二)社会经济相关的健康不平等

一个特别的衡量指标是集中度指数,它被广泛用于衡量社会经济相关的健康不平等。标准集中度指数(CI)在下面用CI表示,可以写成:

$C I=\frac{2}{n \mu} \sum_{i=1}^{n} h_{i} R_{i}-1$

$H_{i}$是New health score,$R_{i}$个体$i$在收入分布中的位置。$\mu$是New health score的均值,$N$是样本大小。Ci处于[0,1]区间,正的Ci意味着好的健康更多集中于高收入群体,也就是有利于富人的健康不平等。

(三)RIF回归分解

Wagstaff分解方法存在潜在的问题。所以Heckley等人提出了一种新的方法“RIF回归”方法来分解社会经济相关的健康不平等。RIF最初来自影响函数(IF)。Firpo等人发展了RIF和RIF回归的概念。Heckley等人进一步提出了RIF回归分解法来分解社会经济相关的健康不平等(集中指数CI)。集中指数CI的分解分两步进行:
首先,计算集中指数的RIF;其次,对RIF用一组协变量作回归,得出协变量对RIF的边际影响。假设因变量和自变量之间是线性关系,即RIF是普通最小二乘(OLS)回归中的因变量,其系数等于协变量X对集中指数CI的边际影响。这被称为RIF-CI-OLS分解。因此,遵循Heckley等人。论文使用RIF-CI-OLS进行分解,该工具从操作角度来看既简单又有吸引力。

(四)RIF回归分析结果

人口统计学特征、社会经济地位、医疗保险、生活方式和家庭环境对城乡社会经济相关健康不平等的影响不同。
对于城市人口,18-33岁的受访者以及已婚或单身的受访者与健康不平等呈负相关。收入的增加减少了城市人口的健康不平等。有医疗保险和接受中等教育与健康不平等呈负相关。被调查者为汉族,有工作,受过高等教育,饮酒,体重不足或肥胖,对健康不平等有积极影响。西部地区与健康不平等呈负相关。在研究期间,健康不平等加剧。性别、家庭规模、吸烟史、获得自来水和拥有抽水马桶对健康不平等没有影响。农村略。

另,(1)疑问:尽管我看到Feinian Chen(2010)等文章也讨论了自评健康的可靠性,但自评健康能否替代真实健康。(2)实操:RIF原理可参考再中心化影响函数RIF回归和分解的Stata操作程序,实操方法可以参考RIF regression and RIF decomposition following Heckley’s methodology。(3)更具体的讨论可参朱平芳,张征宇.无条件分位数回归:文献综述与应用实例[J].统计研究,2012,29(03):88-96.

(1)自从Koenker和Bassett(1978)提出分位数回归(quantile regression,QR)方法以来,其已发展成为经济学实证研究的常用方法之一。最初,QR方法仅被看作是用来替代最小二乘(OLS)估计的一种稳健(robust)估计。但基于微观数据的研究中青睐QR方法,并不在于它的稳健特性,而是可以借此方法了解解释变量对于被解释变量在扰动项的不同分位点上的异质性影响。通常,人们在评估一项经济政策对受众群体的影响时,不但希望了解政策对任一参与者的平均影响,更希望知道政策对位于特征分布不同位置(分布末端或顶端)人群的异质性作用。
(2)条件分位数(CQR)方法的结果,实际上只告诉我们对于具有相同观测特征的个人(例如,具有某一特定年龄、家庭背景的女性),不可观测的“能力差异”对于“收入”的异质性影响。
(3)但由于CQR的经济学意义阐释基于过多甚至是不必要的个体特征,其结果与政策制定者所关心的问题很有可能并不一致。例如,人们可能只想了解教育年限对于个人收入的一般边际影响,而无论个体的年龄,性别与家庭背景如何,这就是所谓收入关于教育程度的无条件分位数估计问题。

作者系多伦多大学经济学Jiaoli Cai & Peter C. Coyte。

------ End of this article ------

Copyright Notice 版权声明

Yuteng Yan by Yuteng Yan is licensed under a Creative Commons BY-NC-ND 4.0 International License.
闫誉腾创作并维护的Yuteng Yan博客采用创作共用保留署名-非商业-禁止演绎4.0国际许可证
本文首发于Yuteng Yan 博客(http://yanyuteng.github.io),转载请保留原文链接及作者。