位置: IT常识 - 正文

倾向得分匹配PSM案例分析(倾向得分匹配后怎么进行回归)

编辑:rootadmin
倾向得分匹配PSM案例分析

推荐整理分享倾向得分匹配PSM案例分析(倾向得分匹配后怎么进行回归),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:倾向得分匹配的结果怎么看,倾向得分匹配stata,倾向得分匹配法解决什么问题,倾向得分匹配p是什么意思,倾向得分匹配法原理,倾向得分匹配模型,倾向得分匹配法原理,倾向得分匹配stata,内容如对您有帮助,希望把文章链接给更多的朋友!

倾向得分匹配(PSM),是一种模仿RCT随机对照试验随机化分组,提高组间均衡性,进而达到降低混杂因素影响目的一种数据处理策略。PSM在计量研究,临床医学等领域有着广泛的应用。

1.案例背景与分析策略1.1 案例背景介绍

某企业想评价专项培训的效果,现收集到78位员工的个人及工作成绩信息,包括性别、年龄、教育年、初始工作成绩与当前工作成绩、工作经验、工作时间、职位类别、是否参加培训等数据。

数据上传SPSSAU后,在 “我的数据”中查看浏览原始数据,前5行数据如下:

图1 “我的数据”查看浏览数据集

1.2 明确目的与分析策略

已经参加过培训的有17人,其余61人没有参加过培训。研究培训的效果,我们似乎可以直接比较两组员工的工作成绩有无差异。

考虑到性别、年龄、工作经验、参加工作时间等本身会影响工作成绩,当两组人群不在一个起跑线起跑时,如果贸然直接对比当前工作成绩的差异,可能受到其他因素的干扰。

因此,我们应该寻找一批和参加培训员工基本情况类似,各关键指标特征接近的、未参加过培训的员工组成对照/控制组,然后进行组间差异的对比,从而判断培训效果。

倾向评分匹配,正是这样一种可以匹配对照,让处理组和对照组达到均衡的数据处理手段。SPSSAU在“计量经济研究”栏目下提供了【倾向得分匹配】功能。

完成匹配后,以当前工作成绩数据作为结果变量,是否培训为分组数据来探讨培训效果。

2.协变量选择与基线分析

倾向评分匹配PSM,首先需要构造PS评分概率数据,然后利用PS数据按某种匹配算法从所有待选的对照样本中选择合适对象完成匹配过程。

SPSSAU默认采用logistic回归模型构造PS数据,而用户则需要指定哪些数据作为协变量参与logistic回归计算PS值。

协变量的选择不是随意的,具体选择依据目前有多种观点。一般来说,协变量会影响结果变量,而且在干预组、对照组上也存在差异。当然专业知识、既往研究结论也可作为参考。

SPSSAU中协变量表述为特征项,本案例后面对协变量的描述统一采用特征项。

2.1 匹配前连续型特征项差异检验

已收集的特征项中,年龄、教育年、初始工作成绩、工作经验、工作时间,这5个为连续型数据。我们先考察培训组、未培训组在这些数据上是否基线无差异。

在SPSSAU“通用方法”栏目中执行【t检验】。结果如下:

图2 匹配前连续型数据t检验

由上表结果可知,两组员工在初始工作成绩、工作经验上存在统计学差异(均P值<0.05)。而在年龄、教育年、工作时间上无差异。

2.2 匹配前分类型特征项差异检验

同理,对性别、职位类别两个分类数据,做交叉表卡方检验,以考察匹配前两组员工在二者的分布差异。

在SPSSAU“通用方法”栏目中执行【交叉/卡方】。结果如下:

图3 匹配前分类型数据交叉表卡方检验

由上表结果可知,两组员工在职位类别的分布上存在统计学差异(P值<0.05),而性别分布上无差异。

2.3 特征项/协变量选择

综合基线分析、专业认知、既往研究结论,本案例拟将初始工作成绩、工作经验、职位类别共3个指标认定为本次PSM的特征项(协变量)。

以此3个特征项,通过logistic回归构造PS数据,从而实现匹配。

3.倾向得分匹配3.1 匹配算法选择

倾向评分匹配算法有很多种,较常用的是最近邻匹配。SPSSAU提供了两种匹配算法,分别是最近邻匹配和半径匹配。前者是指PS值距离最近的进行匹配,后者需先指定卡钳值,在卡钳值范围内进行匹配。

原则上两种算法的匹配结论大致一样,可以根据匹配均衡性来选择,本例选择半径匹配。卡钳值采用多次遍历的形式,最终确定为0.05。具体理由文末有总结说明。

3.2 SPSSAU具体操作

在SPSSAU“计量经济研究”栏目下选择【倾向得分匹配】,首先将“是否培训”拖拽至【研究变量】框内,它将作为logistic回归的二结局因变量,特别注意水平编码,要求是1表示处理组,0表示对照组。

“初始成绩”、“工作经验”、“职位类别”拖拽至【特征项】框。

图4 SPSSAU倾向评分匹配具体操作

倾向得分匹配PSM案例分析(倾向得分匹配后怎么进行回归)

同时,本例建议将结果变量“当前成绩”拖拽至【结果变量】框。此操作展现了SPSSAU的特有优势,可以帮我们一步到位,既实现匹配,同时也完成匹配后数据的效果分析。

匹配算法选择半径匹配,卡钳值0.05。为方便理解,采用不放回策略。同时勾选【保存信息】,即要求输出匹配指示数据。具体操作见图4,最后点击“开始分析”即可。

4.倾向评分匹配结果解读4.1 匹配概况

参加培训员工17人,因此需要匹配个数为17。采用卡钳值0.05的半径匹配后,匹配成功16人,SPSSAU此时进行的是1:1匹配,因此匹配后的数据总人数为32人。

通俗讲,匹配算法从未参加培训的61人中寻找到16人一一匹配给参加过培训的员工。

图5 PSM匹配概括

4.2 均衡性评价

匹配后,一定要进行均衡性、或平衡性评价,满足均衡条件后才表示匹配成功,如果均衡性不达标,应当返回重新进行匹配,直到满意为止。

在SPSSAU中,至少可以完成四项平衡性评价,本案例选择其中三项进行重点解读。

首先来看第一项:标准化偏差变化条形图

图6标准化偏差变化条形图

一般匹配后“标准化偏差”绝对值小于20%,则匹配效果较好。本例中,初始成绩、工作经验、职位类别匹配前的标准化偏差均在55%以上,匹配后,标准化偏差均低于20%,表明匹配后两组人群在这三个特征项上达到均衡。

第二项:核密度图

SPSSAU【倾向评分匹配】并未直接提供该图形,需要我们自己根据另存到原始数据中的匹配指示变量进行绘制。

新增的匹配指示变量中,Weight变量大于0,即匹配成功次数大于0,表明该样本为匹配成功的有效样本。

在SPSSAU的“可视化”栏目下,选择【核密度图】,打开【筛选样本】,输入条件:Weight > 0 ,这样做从数据集中筛选出匹配成功的32人数据,用于绘图。

图7 核密度前筛选匹配成功样本

“是否培训”拖拽至【定类X】框,其他特征项或其他变量可拖入【定类Y】框。

限于篇幅,本案例只展示“初始成绩”特征的匹配后核密度图。由图可见,匹配后两组密度曲线十分相似,能满足均衡要求。

图8 匹配后初始工作成绩核密度图

第三项:匹配后基线分析

匹配前我们已经讨论过基线比较,匹配后也可以继续做基线分析,以判断匹配后两组数据在各特征项上有无差异。

连续型特征项用t检验,类别性特征项用卡方检验,我们直接看结果(t检验、卡方检验汇总后):

图9 匹配后特征项基线分析

如上表所示,匹配后,两组人群在初始成绩、工作经验、职位类别上差异无统计学意义(均P值>0.05)。即,匹配后基线特征由有差异趋于一致、均衡。综合以上三项结果,本例认为匹配后培训组、未培训组两组在特征上达到均衡,匹配效果良好。

5.效果分析

我们已经为17人的培训组,匹配到了一批特征类似,基线一致的对照(未培训组)。

本例的分析目的是考察培训的效果,结果变量“当前工作成绩”为连续型数据,因此执行t检验即可评价培训的效果。

但是我们并不需要去单独做t检验,因为SPSSAU在【倾向评分匹配】中包含了这一项重要工作。我们此前将当前成绩移入【结果变量】框,就是为了直截了当获得该项结果。

在SPSSAU中,这项工作称之为ATT效应分析。本例的结果:

图10 匹配后ATT效应分析

“Unmatched匹配前”第1行数据是指在匹配之前,两组的当前工作成绩有统计学差异。

“ATT效应”第2行数据是指在匹配之后,两组的当前工作成绩存在显著差异(P值<0.05)。

说明在控制了干扰因素后,我们认为培训是有效果的。

6.总结

本例采用半径匹配算法,卡钳值多少合适呢?原则上并没有严格的规定或标准。

可以通过多次遍历的形式,比如第一次执行卡钳值0.3,然后评估匹配后平衡性及样本损失是否满足要求;如果不平衡,则返回调低卡钳值到0.1(或其他值)再进行同样操作,若仍不平衡,继续返回拉低卡钳值,比如0.05,或0.02,直至组间满足平衡要求,而且样本损失也在可接受水平。本例最终设定卡钳值为0.05。最近邻算法在没有卡钳值限定时,处理组样本通常会全部匹配成功,读者可以自行实践。

本文链接地址:https://www.jiuchutong.com/zhishi/300338.html 转载请保留说明!

上一篇:〖大前端 - 基础入门三大核心之CSS篇⑱〗- CSS中的背景(大前端最新)

下一篇:深度学习分析NASA电池数据(1 数据读取)

  • 笔记本自动关机是什么原因(华为笔记本自动关机)

    笔记本自动关机是什么原因(华为笔记本自动关机)

  • 抖币可以赠送给好友吗(抖币赠送给主播,主播可以用吗)

    抖币可以赠送给好友吗(抖币赠送给主播,主播可以用吗)

  • 腾讯会议的断开音频什么意思(腾讯会议的断开音频是什么)

    腾讯会议的断开音频什么意思(腾讯会议的断开音频是什么)

  • 抖音dou+推广审核不通过(抖音dou推广审核时间)

    抖音dou+推广审核不通过(抖音dou推广审核时间)

  • 支付宝怎么扫到敬业(支付宝怎么扫到生肖卡)

    支付宝怎么扫到敬业(支付宝怎么扫到生肖卡)

  • U盘中的歌会过期吗(u盘歌曲时间久了有杂音)

    U盘中的歌会过期吗(u盘歌曲时间久了有杂音)

  • 华为手机时间日期怎么设置(华为手机时间日历显示在桌面怎么设置?)

    华为手机时间日期怎么设置(华为手机时间日历显示在桌面怎么设置?)

  • 怎么注销手机号(怎么注销手机号注册的各种app)

    怎么注销手机号(怎么注销手机号注册的各种app)

  • 苹果无线耳机左耳失灵(苹果无线耳机左耳不响怎么修复)

    苹果无线耳机左耳失灵(苹果无线耳机左耳不响怎么修复)

  • 微星笔记本是哪国的(微星笔记本是哪个公司)

    微星笔记本是哪国的(微星笔记本是哪个公司)

  • ios用户是什么意思啊(ios用户是什么意思手机)

    ios用户是什么意思啊(ios用户是什么意思手机)

  • 怎么投诉卖家48小时未发货(怎么投诉卖家虚假发货)

    怎么投诉卖家48小时未发货(怎么投诉卖家虚假发货)

  • 闲鱼的钱多久到支付宝(闲鱼的钱多久到账)

    闲鱼的钱多久到支付宝(闲鱼的钱多久到账)

  • 淘宝申请售后时间限制(淘宝申请售后时间多久)

    淘宝申请售后时间限制(淘宝申请售后时间多久)

  • 9x支持人脸解锁吗(9x能不能人脸解锁)

    9x支持人脸解锁吗(9x能不能人脸解锁)

  • p9plus支持快充吗(华为p9可以快充吗)

    p9plus支持快充吗(华为p9可以快充吗)

  • 保险柜显示欠压是什么意思(保险柜显示欠压怎么办)

    保险柜显示欠压是什么意思(保险柜显示欠压怎么办)

  • 小米智能锁sn码在哪(小米智能锁sn码是什么意思)

    小米智能锁sn码在哪(小米智能锁sn码是什么意思)

  • 高级设置在哪里(高级设置在哪里找到)

    高级设置在哪里(高级设置在哪里找到)

  • 苹果6微信怎么加密码锁(苹果6微信怎么下)

    苹果6微信怎么加密码锁(苹果6微信怎么下)

  • 如何清除c盘无用文件(怎么清除c盘无用文件)

    如何清除c盘无用文件(怎么清除c盘无用文件)

  • oppo reno电池容量(opporeno电池容量多大)

    oppo reno电池容量(opporeno电池容量多大)

  • 【VUE3】ElementUI--el-date-picker下拉控件样式修改(高亮显示设置)(vue3 element-plus)

    【VUE3】ElementUI--el-date-picker下拉控件样式修改(高亮显示设置)(vue3 element-plus)

  • 做毕业设计,前端部分你需要掌握的6个核心技能(做毕业设计,前景如何)

    做毕业设计,前端部分你需要掌握的6个核心技能(做毕业设计,前景如何)

  • 投资性房地产采用成本模式计量
  • 计提印花税会计凭证怎么做
  • 转出未交增值税最终怎么转平
  • 存货的期末余额在借方还是贷方
  • 零星采购范围
  • 公司改名之前发工资吗
  • 医疗器械商贸企业成本核酸
  • 一般纳税人开红票怎么处理
  • 固定资产残值怎么处理什么时候处理
  • 养殖企业如何做销售
  • 地下车位未使用 要交物业服务费
  • 应交增值税明细科目如何结转
  • 个人承包业务是否合法
  • 自来水公司代收污水处理费账务处理
  • 收到外国的货款会计分录
  • 事业单位发票名称是原来的怎么办
  • 公司成立多久费用可进开办费
  • 2020年外资企业
  • 企业税收风险有哪些方面
  • 个人所得税的标准有几档
  • 联营与参股公司的关系
  • 发票税额小数点后面没打印上能用吗
  • 小规模纳税人申报表2023年怎么填写
  • 结转与结余
  • 售楼部沙盘制作价格一般多少一平
  • 小规模所得税表格模板
  • 房地产土地增值税计税依据
  • txp1atform.exe
  • 公司增资的方式有什么
  • 苹果电脑设置壁纸为什么重启就没了
  • 公司入股的钱怎么做账
  • 房屋建筑物改扩建税务处理
  • window10解压
  • 外籍人员个人所得税计算
  • 出口退税率的调整方法
  • php二维数组按某个键值排序
  • python怎样学
  • php获取用户信息
  • 企业缴纳水利建设基金的依据是什么
  • 个体户税率征收
  • 油票上没有公司名称可以报么
  • cms访问出错
  • 印花税减免优惠政策2019
  • 其他货币资金的明细科目有哪些
  • 劳动合同和劳务合同可以一起签吗
  • PostgreSQL教程(十六):系统视图详解
  • 增值税发票红冲的相关规定
  • 纳税人销售货物
  • 房地产开发企业分为几个等级
  • 代销手续费怎么做账
  • 进口关税,增值税是进口设备重置成本中的从属费用
  • 营业税金及附加包括哪些
  • 跨年跨月发票账务处理
  • 小企业会计准则会计科目表
  • 其他业务收入与其他业务成本的关系
  • 小微企业免征增值税优惠
  • 专栏设计模板
  • sql2005生成脚本
  • 灵活设置成员
  • centos7怎么查看进程名称吗
  • ubuntu20.04软件中心
  • 在cenots下使用iso光盘文件重新安装CentOS的方法步骤
  • centos安装nmtui
  • 系统配置运行命令
  • centos桌面切换到命令行有什么区别
  • win10周年纪念版
  • ssh permission denied password
  • mysql定时脚本
  • ubuntu20.04中文
  • python元组和数组
  • javascript运用
  • 置顶朋友圈所有人能看到吗
  • android保存文件到本地
  • shell 读取
  • JavaScript中关于模板字符串
  • python socket用法
  • 陕西省国家税务局刘峰
  • 关联企业签订劳动合同的次数可以累计吗
  • 残疾人就业有哪些选择
  • 国家实行什么制度鼓励电力用户合理调整用电负荷
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设