第四节 数据来源

本书所使用的数据主要来自两个调查:全国老年人口健康状况调查(Chinese Longitudinal Healthy Longevity Survey,CLHLS)以及家庭动态社会调查。其中第二至第四章基于CLHLS数据,第五章和第六章基于CLHLS以及家庭动态社会调查的数据。

CLHLS的基线调查始于1998年,并于2000年、2002年、2005年及2008年进行了四次跟踪调查。1998年基线调查在全国22个省、自治区、直辖市[16]随机抽取了631个(约占50%)县、县级市和市辖区。调查区域总人口为9.85亿,覆盖了全国总人口的85.3%。调查对象是80岁及以上的高龄老人。调查方法为,在老人知情、自愿的前提下,尝试对调查区县中所有存活的百岁老人进行入户访问,并对事先按该百岁老人编号随机给定年龄与性别的80~89岁及90~99岁老人各一名作入户访问。样本选取的基本思路为,入户访问的80~89岁及90~99岁老人分别与百岁老人被访人数大致相同,而且80~99岁的各单岁男、女被访人数也大致相同。本调查未采取等比例抽样的方法,是为了避免因样本高度集中在80多岁这个相对年轻的年龄段,致使90多岁以及百岁老人,尤其是男性高龄老人由于样本量太小而无法满足研究需要。

此后的跟踪调查中,部分老人因失访或去世而退出调查,从而依据“同地域、同性别、同年龄”的原则对失访或去世样本进行替补,同时也新增一部分老人以扩大样本量。1998年与2000年调查的对象集中于80岁以上高龄老人,自2002年起,调查对象又新添加了65~79岁的低龄老人样本,丰富了研究内容。表1-2为各期CLHLS调查分年龄段的样本量。

表1-2 1998~2008年CLHLS调查分年龄段样本量统计

所有的入户访问均由一名调查员与一名医务人员共同进行,调查员询问问卷问题,医务人员对被访老人进行基本的健康体检。CLHLS调查的主要内容涉及如下几方面:①基本情况,包括年龄、性别、民族、居住地与居住安排;②性格特征,包括老人对自我性格特征的评判;③认知能力,包括定向能力、反应能力、注意力及计算能力、记忆以及语言、理解和自我协调能力;④生活方式,包括饮食、吸烟、喝酒、锻炼、家务劳动及社会活动参与等;⑤生活自理能力,包括日常生活自理能力以及器具性生活自理能力;⑥个人背景与家庭结构,包括受教育程度、婚姻史、经济状况、医疗支出、父母亲信息、兄弟姐妹信息和子女信息;⑦体检,在医务人员检查后由调查员填写,包括测量身高、体重、血压、心率以及老人自报的疾病史等。

CLHLS调查区别于其他跟踪调查数据的另一个特色是,它不仅跟踪存活老年人,也对去世老年人的亲属(通常是其配偶或子女)进行跟踪访问,从而了解到老人在临终前的一系列信息,包括婚姻状况、居住安排、医疗费用、照料者及照料天数、健康状况等。

与2002年和2005年CLHLS同期进行的家庭动态社会调查的对象是CLHLS调查中9个东部省份[17]被访老人的子女,被访子女的年龄跨度为35~65岁。研究将家庭社会动态调查中的老人ID与CLHLS的老人ID相匹配,则可以得到老人与子女的配对数据。当CLHLS被访老人仅有1个子女时,该子女则成为家庭社会动态调查的被访者;而当老人有多个子女时,则随机抽取1名子女进行访问。随机抽取的具体方式为:首先确定与老人居住在同一县、县级市或市辖区的子女个数。当有两个子女时,如果老人出生月份为1~6月则选择第一个子女,如果出生在7~12月则选择第二个子女。有三个子女时,如果老人出生在1~4月则选第一个,出生在5~8月选第二个,出生在9~12月选第三个,依此类推。家庭社会动态调查涵盖了该名子女的社会人口特征、工作经历、婚姻史与配偶、家庭决策与支出、居住安排与父母亲照料等信息。

2002年家庭社会动态调查时共访问4364个成年子女。2005年跟踪调查时,若被访老人因失访或者去世退出CLHLS调查,那么其子女也不再进入家庭社会动态调查;同时,老人的子女自身也有一定失访比例。因此2005年调查的样本量较2002年减少了一半多,仅为1934对。为了保证子女样本的随机性,本书使用了2002年的老人与子女配对数据。

这两套数据对于本研究有以下三点优势。

首先,有关居住模式的信息非常详尽。在CLHLS调查中,不仅询问了与老人当前同住者的人数,而且询问了每一位与老人同住者的年龄、性别以及与老人的关系。材料的详尽使得研究可以细化居住模式的分类:自己一人居住、仅与配偶居住、与儿子同住、与女儿同住、仅与孙子女同住等。这些细化的分类在探讨影响机制时可以发挥切实的作用。不仅如此,CLHLS调查还提供了老人在临终前的居住安排,这为我们对比存活老人与老人临终前居住模式的异同提供了宝贵的数据基础。

其次,CLHLS调查中有充足的高龄老人样本。高龄老人居住模式的综合分析在国内外研究中比较匮乏;而中国人口老龄化的一个特征便是老年人口高龄化,高龄老人的增长速度相对更快。CLHLS各期调查中80岁及以上的高龄老人均超过一半,这为研究提供了充足的高龄老人样本量,从而使研究者得以获悉高龄老人居住模式的影响因素及福利效应与低龄老人相比是否存在差异。

最后,家庭社会动态调查中老年人的成年子女选取的随机性。国外也有老年人口与其子女的匹配数据,但其子女的选取有时并非随机。比如Pezzin and Schone(1999)的研究基于1986年美国424对老年人及其成年女儿的样本。但其中选择哪个女儿接受访问是由老人自己指定的,通常老人会倾向于指定与其同住或者照料自己最多的女儿,从而导致样本中与老人合住的子女比例过高,样本缺乏代表性。反之,本研究中成年子女的选择是基于老人的出生月份,基本可以认定为随机,因此该样本更具备代表性,结论也更具有推广意义。


[1] 引自《2002年马德里老龄问题国际行动计划》。

[2] 引自世界银行数据库http://data.worldbank.org/indicator/NY.GDP.PCAP.CD。

[3] 数字由笔者计算而得。2008年末,农村养老保险参保人数为5595.1万人,乡村人口数为72135万人,依此计算出农村养老保险覆盖率为7.8%。2009年末,农村养老保险参保人数为7277.3万人,乡村人口数为71288万人,依此可得农村养老保险覆盖率为10.2%。2010年末,新农保参保人数为10276.8万人,乡村人口数为66280.5万人,依此可知新农保参保率为15.5%。

[4] 2006年,全国老龄工作委员会办公室组织实施,并委托中国老龄科研中心承担了“中国城乡老年人口状况追踪调查”任务。此次调查在全国20个省、自治区、直辖市开展,追踪调查的标准时点是2006年6月1日零时,抽样调查的个人问卷的有效样本为19947人,社区调查问卷为2847份。本次调查报告数据是按国家统计局2005年全国1%人口抽样调查数据加权后的结果。

[5] 本书中如果没有特殊说明,“与子女合住”中的“子女”也包含孙子女。

[6] 本书中“多代同堂的居住模式”,与“两代或三代同堂的居住模式”以及“与子女合住”的含义等价。

[7] 引自《〈中国城乡老年人口状况追踪调查〉研究报告》,http://www.china.com.cn/news/txt/2007-12/17/content_9392818.htm。

[8] 农村地区自2009年开始在10%的县市推行新型农村社会养老保险的试点,社会养老保险的覆盖率还很低。因此在本书中没有考虑农村地区。

[9] 因为多种因素可能均存在内生性问题,若同时分析,难以找到足够的工具变量。

[10] 引自1997年《国务院关于建立统一的企业职工基本养老保险制度的决定》。

[11] 2009年1月28日,《事业单位养老保险制度改革方案》正式下发,人力资源与社会保障部要求山西、上海、浙江、广东和重庆5个试点省市进行事业单位养老保险制度改革试点,力推事业单位养老保险制度向企业基本养老保险制度转轨。

[12] 中国于1997年正式实施社会统筹与个人账户相结合的养老保险制度,而截至2008年底,个人账户空账运行的规模已达到1.4万亿元,比2004年底的7400亿元增加了近一倍。而未来要做实个人账户主要由中央和地方财政资金承担。

[13] 这些政策包括:1991年《国务院关于企业职工养老保险制度改革的决定》,1995年《国务院关于深化企业职工养老保险制度改革的通知》,1997年《国务院关于建立统一的企业职工基本养老保险制度的决定》,2001年《关于完善城镇职工基本养老保险政策有关问题的通知》和2005年《关于完善企业职工基本养老保险制度的决定》。

[14] http://news.sina.com.cn/c/2007-05-11/121312965293.shtml.

[15] 2004年在珠三角地区也曾出现技术工人短缺的现象。

[16] 22个省、自治区和直辖市为辽宁、吉林、黑龙江、河北、北京、天津、山西、陕西、上海、江苏、浙江、安徽、福建、江西、山东、河南、湖北、湖南、广东、广西、四川、重庆。

[17] 9个东部省份为辽宁、北京、山东、江苏、上海、浙江、福建、广东和广西。