近日,经合组织发布了《2023年成人技能调查数据分析手册》(Survey of Adult Skills 2023 Data Analysis Manual),为研究人员和数据分析师提供了详尽的指导,以便他们能够更好地利用2023年成人技能调查所收集的数据。该手册详细介绍了数据集的构成、内容、分析方法和可用的分析工具,旨在促进对成人技能水平的深入理解,为政策制定者和社会各界提供有力的数据支持。
一、调查背景与目的
经合组织国际成人技能评估项目(Programme for the International Assessment of Adult Competencies,PIAAC),旨在通过家庭调查的方式,收集16至65岁成人人口在识字、算术和适应性问题解决方面的技能熟练度信息。这些技能是个人、经济和社会发展的基础,对于获得就业、提高工资和持续学习至关重要。PIAAC 2023的调查覆盖了31个参与国家和地区,收集了大量关于成人技能水平的数据。
二、数据集的构成与内容
1. 数据集类别
根据手册介绍,PIAAC数据集主要分为三类:国家数据集、国际数据库和公共使用文件(Public-use files,PUFs)。
(1)国家数据集:包含特定国家收集的全部信息,是构建国际数据库的基础。这些数据集由各国负责管理和存储,访问规则由各国自行决定;
(2)国际数据库:由经合组织管理和存储,包含所有参与国家按照国际标准收集的可比信息。该数据库不对外部用户开放,仅供经合组织工作人员分析使用;
(3)公共使用文件(PUFs):作为国际数据库的子集,PUFs免费提供给公众下载,包含各国同意公开的信息。为保护受访者隐私,PUFs中的某些变量可能已被粗化或抑制。
2. 数据内容
手册详细描述了不同数据集的内容,包括背景问卷、直接评估、调查管理和样本设计等方面的变量。背景问卷涵盖了个人的基本信息、教育背景、工作历史和非经济成果等多个方面。直接评估则通过一系列测试题目,评估受访者的识字、算术和适应性问题解决能力。调查管理变量记录了数据收集和准备过程中的关键信息,如样本权重和抽样方法等。
三、数据分析方法
1. 考虑复杂的调查设计
由于PIAAC采用了复杂的抽样设计,手册强调了在进行数据分析时必须考虑样本权重和抽样误差。全样本最终权重(Final full sample weight)必须用于所有分析,以确保估计结果能够代表目标总体。此外,手册还介绍了如何使用复制权重(Replicate weights)来计算标准误差,以正确反映抽样误差。
2. 评估技能熟练度
手册详细解释了如何使用可信值(Plausible values)来评估受访者的技能熟练度。可信值是基于项目反应理论(Item Response Theory,IRT)和潜在回归模型(Latent regression model)得出的,能够更好地反映受访者在总体中的位置。手册指出,每个技能领域(识字、算术和适应性问题解决)都提供了10个可信值,研究人员可以根据需要使用这些值进行估计。
3. 分析不同周期的数据
PIAAC是一个周期性调查项目,手册提供了分析不同周期数据的方法。由于调查工具和数据收集方法在不同周期之间可能存在差异,手册强调了在进行跨周期比较时需要谨慎。手册详细介绍了如何处理链接误差(linking error),即由于评估工具变化而导致的跨周期比较中的不确定性。
四、可用的分析工具
为了方便研究人员分析PIAAC数据,手册介绍了几种可用的分析工具和方法。
1. PIAAC数据探索器
PIAAC数据探索器是一个在线工具,允许用户计算简单的统计量和频率分布,而无需直接访问微观数据。该工具界面友好,用户可以通过简单的步骤生成统计报告,并导出为多种格式。
2. Stata和R工具
对于需要更深入分析的研究人员,手册介绍了Repest和RRepest等工具。Repest是为Stata用户开发的程序,用于处理加权复制样本和可信值估计。RRepest则是R语言的等效工具,提供了与Repest相似的功能。这些工具能够自动处理调查参数,生成复杂的估计表格,并考虑复制权重和可信值。
3. IDB分析器
IDB分析器(International Database Analyzer)是由国际教育成就评价协会(International Association for the Evaluation of Educational Achievement,IEA)开发的工具,支持SAS、SPSS和R等多种统计软件。该工具可以生成用于分析PIAAC数据的SAS、SPSS和R语法,支持从简单统计量到复杂模型的估计。
五、意义与影响
《2023年成人技能调查数据分析手册》的发布不仅为研究人员提供了详尽的数据分析指导,还促进了跨国家和跨领域的数据共享与合作。通过深入分析PIAAC数据,研究人员可以更好地理解成人技能水平的分布和变化趋势,为政策制定者提供科学依据。此外,手册还强调了数据隐私和保密的重要性,介绍了如何在保护受访者隐私的同时提供有用的数据分析结果。这对于建立公众对调查数据的信任至关重要,有助于推动更多高质量的社会科学研究。
更多信息请参阅:
编译自:经合组织,2025-03-31
编译者:上海师范大学国际与比较教育研究院 花萱子