位置: IT常识 - 正文

Python统计学11——分位数回归(python 统计学包)

编辑:rootadmin
Python统计学11——分位数回归

推荐整理分享Python统计学11——分位数回归(python 统计学包),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python中的统计函数,python基本统计值计算解析,python 统计学,python 统计学包,python统计图教程,python中的统计函数,用python动手学统计学,python 统计学,内容如对您有帮助,希望把文章链接给更多的朋友!

分位数回归也是数理统计里面经典的模型,他相对于在最小二乘模型上进行了改进,虽然本身还是线性的参数模型,但对损失函数进行了改进。我们都知道最小二乘的损失函数是均方误差最小,分位数的损失函数是:

可以看到分位数损失函数会对高估的值和低估的值给予一个不同的权重,这样就可以做到‘’分位‘’。

该模型对于存在异方差的数据有很好的的效果。能准确计算出5%~95%的置信区间

具体看代码理解:

导入包,加载自带的案例数据

import numpy as npimport pandas as pdimport statsmodels.api as smimport statsmodels.formula.api as smfimport matplotlib.pyplot as pltdata = sm.datasets.engel.load_pandas().datadata.head()

 

 X是收入,y是食物支出,很经典的发散数据,因为不同收入区间的家庭的食物支出比例不一样,随着X增大,Y的波动也增大。存在异方差。

q=0.5时候的分位数回归

mod = smf.quantreg("foodexp ~ income", data)res = mod.fit(q=0.5)print(res.summary())

Python统计学11——分位数回归(python 统计学包)

 当q不一样是回归出来的系数是不一样的。我们计算0.05,0.15,0.25.....0.95分位数出来的回归系数,还有最小二乘的回归系数。

quantiles = np.arange(0.05, 0.96, 0.1)def fit_model(q): res = mod.fit(q=q) return [q, res.params["Intercept"], res.params["income"]] + res.conf_int().loc["income"].tolist()models = [fit_model(x) for x in quantiles]models = pd.DataFrame(models, columns=["q", "a", "b", "lb", "ub"])ols = smf.ols("foodexp ~ income", data).fit()ols_ci = ols.conf_int().loc["income"].tolist()ols = dict(a=ols.params["Intercept"], b=ols.params["income"], lb=ols_ci[0], ub=ols_ci[1])print(models)print(ols)

画图对比x = np.arange(data.income.min(), data.income.max(), 50)get_y = lambda a, b: a + b * xfig, ax = plt.subplots(figsize=(6, 4))for i in range(models.shape[0]): y = get_y(models.a[i], models.b[i]) ax.plot(x, y, linestyle="dotted", color="grey")y = get_y(ols["a"], ols["b"])ax.plot(x, y, color="red", label="OLS")ax.scatter(data.income, data.foodexp, alpha=0.2)ax.set_xlim((200, 3000))ax.set_ylim((200, 2000))legend = ax.legend()ax.set_xlabel("Income", fontsize=16)ax.set_ylabel("Food expenditure", fontsize=16)

 透明蓝色散点为样本点。蓝色虚线为不同分位数上的回归方程。

可以看出的几个结论:

'''粮食支出随着收入的增加而增加

粮食支出的分散度随着收入的增加而增加

最小二乘估计值与低收入观测值的拟合度相当差(即OLS线越过大多数低收入家庭)'''

而且5%~95%的回归方程区间涵盖了所有的真实样本点,置信区间很准确。

 画出回归系数随着分位数的变化图

n = models.shape[0]plt.plot(models.q, models.b, color="black", label="Quantile Reg.")plt.plot(models.q, models.ub, linestyle="dotted", color="black")plt.plot(models.q, models.lb, linestyle="dotted", color="black")plt.plot(models.q, [ols["b"]] * n, color="red", label="OLS")plt.plot(models.q, [ols["lb"]] * n, linestyle="dotted", color="red")plt.plot(models.q, [ols["ub"]] * n, linestyle="dotted", color="red")plt.ylabel(r"$\beta_{income}$")plt.xlabel("Quantiles of the conditional food expenditure distribution")plt.legend()plt.show()

 

#上图画出了回归系数随着分位数的变化而变化,OLS系数是恒定的,分位数回归的系数随着分位数变大而变大

#在大多数情况下,分位数回归点估计值位于OLS置信区间之外,这表明收入对食品支出的影响在整个分布区间内可能不是恒定的

本文链接地址:https://www.jiuchutong.com/zhishi/299819.html 转载请保留说明!

上一篇:前端项目性能优化方案有哪些(前端项目性能优势怎么写)

下一篇:第四季新星计划即将开启,博客之星取消拉票你怎么看?(新星计划片头好可爱啊)

  • 浅谈九种有效的免费推广方法(如何进行有效)

    浅谈九种有效的免费推广方法(如何进行有效)

  • 怎么看电脑配置好坏(怎么看电脑配置高不高)

    怎么看电脑配置好坏(怎么看电脑配置高不高)

  • iphonex型号mq开头的

    iphonex型号mq开头的

  • 发现个人电脑感染病毒断开网络的目的是什么(发现个人电脑感染病毒断开网络的)

    发现个人电脑感染病毒断开网络的目的是什么(发现个人电脑感染病毒断开网络的)

  • qq扩列为啥突然没了(为什么qq扩列一直显示0次)

    qq扩列为啥突然没了(为什么qq扩列一直显示0次)

  • 行距和行间距区别(行距行间距的区别)

    行距和行间距区别(行距行间距的区别)

  • 为什么自动生成目录,部分目录没有出现(为什么自动生成目录不全)

    为什么自动生成目录,部分目录没有出现(为什么自动生成目录不全)

  • qq语音麦克风白色是打开吗(qq麦克风是白色状态静音吗)

    qq语音麦克风白色是打开吗(qq麦克风是白色状态静音吗)

  • powerpoint中主要的编辑视图是(powerpoint中主要用于编辑幻灯片的内容)

    powerpoint中主要的编辑视图是(powerpoint中主要用于编辑幻灯片的内容)

  • 手机不吃卡是什么原因(手机不插卡会很卡吗)

    手机不吃卡是什么原因(手机不插卡会很卡吗)

  • 显卡待机50度正常吗(显卡待机五十度)

    显卡待机50度正常吗(显卡待机五十度)

  • 海鹦浏览器无法访问网络(海鹦浏览器无法上网)

    海鹦浏览器无法访问网络(海鹦浏览器无法上网)

  • pcrm00是啥手机(oppo pcrmoo是什么手机型号)

    pcrm00是啥手机(oppo pcrmoo是什么手机型号)

  • 电脑开机后黑屏显示英文(电脑开机后黑屏进入不了桌面怎么解决)

    电脑开机后黑屏显示英文(电脑开机后黑屏进入不了桌面怎么解决)

  • ypbpr是什么接口(ypbpr是什么接口,干什么的)

    ypbpr是什么接口(ypbpr是什么接口,干什么的)

  • 官换机和新机的区别(官换机和新机的区别华为的)

    官换机和新机的区别(官换机和新机的区别华为的)

  • 苹果6怎样不按键亮屏(苹果6不按主屏幕键如何唤醒siri)

    苹果6怎样不按键亮屏(苹果6不按主屏幕键如何唤醒siri)

  • 手机面对面快传怎么用(苹果手机面对面快传)

    手机面对面快传怎么用(苹果手机面对面快传)

  • 苹果就寝怎么删除(苹果就寝怎么删除不了)

    苹果就寝怎么删除(苹果就寝怎么删除不了)

  • 显示器acin是插什么的(显示器ac和dc电源)

    显示器acin是插什么的(显示器ac和dc电源)

  • 手机丢了绑定的银行卡怎么办(手机丢了绑定的东西怎么办)

    手机丢了绑定的银行卡怎么办(手机丢了绑定的东西怎么办)

  • 韩剧tv怎么看国产剧(韩剧tv怎么看国语版)

    韩剧tv怎么看国产剧(韩剧tv怎么看国语版)

  • 微信还原应用还能找回聊天记录吗(如果微信还原应用会怎么样)

    微信还原应用还能找回聊天记录吗(如果微信还原应用会怎么样)

  • 计提本月个人所得税
  • 个人给单位做事怎么开发票
  • 公允价值下降属于资产吗
  • 零申报印花税怎么填写
  • 房地产企业印花税税目
  • 增值税专用发票抵扣联
  • 银行汇票退回
  • 未取得发票的收入怎么做账
  • 原始凭证审核的内容
  • 购买工程款计入什么科目
  • 所得税退税未办理可以注销吗?
  • 外商投资企业退出条件
  • 税负的含义
  • 零售产品的进项税怎么算
  • 小规模收到专票要做进项税额转出吗
  • 开户许可证怎么下载电子版
  • 无偿提供服务需要交增值税吗
  • 报销抵扣联和发票联都需要吗
  • 税收筹划有哪些特点?
  • 以前年度亏损在哪个报表体现
  • 农民合作社扶持政策
  • 遗失发票如何处理好
  • 计提存货减值准备符合可靠性原则
  • 可以税前扣除的支出
  • 税控设备抵减增值税会计处理
  • win10系统修改密码
  • 购进来的样品怎么账务处理
  • php统计字符串长度
  • 纳税人转让旧房及建筑物
  • 工资应发数就是企业的成本
  • 工程的直接成本包括哪些
  • 赡养老人专项附加扣除标准2023年
  • 小规模拍卖公司怎么开票
  • 企业会计准则应用指南2023pdf
  • 删除命令rm rf
  • js工厂模式创建对象
  • 购进来的样品怎么账务处理
  • 对公账户怎么打印
  • 企业会计准则季报利润表填写
  • 织梦cms怎么样
  • 关于python序列类型
  • 采购成本和销售成本的核算
  • 记账凭证填错了怎么办还没有登记账簿
  • 个人所得税征税对象是什么
  • 已收款未开票未发货能确认收入吗
  • 材料会计的内容
  • 公司购买的空调
  • 如何理解出口退税的意义
  • 政府专项扶持资金
  • 商标无形资产摊销计入什么科目
  • 生育津贴申请流程
  • 批量修改 sql
  • mysql5.7.33安装配置教程
  • 关于月亮的诗句
  • mysql 大数据处理
  • win10警告
  • windows不能打开此文件result:31
  • win10系统无法开机怎么修复
  • windows xp设置屏保密码
  • mac 应用
  • sentstrt.exe - sentstrt进程是什么文件 有什么用
  • hyper-v win98
  • win8.1中文版
  • Win10最新版下载天翼云盘
  • win10打开iis管理器命令
  • win7电脑曝光度过高怎么调
  • win10系统怎么设置开机密码
  • 红石cpu教程
  • win8桌面不见了
  • cocos2dx开发的游戏有哪些
  • Unity3d OnApplicationPause与OnApplicationFocus 判断游戏暂停还是重新启动
  • javascript入门经典
  • 异步promise原理
  • jquery弹出提示框
  • jQuery.Uploadify插件实现带进度条的批量上传功能
  • 对于初学者的鼓励
  • 税务副科级干部交流
  • 增值税电子普通发票可以抵扣吗
  • 天津市东丽区军粮城派出所电话
  • 抄税失败是怎么回事
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设