位置: IT常识 - 正文

学习笔记:统计建模方法的比较分析(统计 α)

编辑:rootadmin
学习笔记:统计建模方法的比较分析 前言

推荐整理分享学习笔记:统计建模方法的比较分析(统计 α),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:统计烦吗,统计itt,统计tli,统计 ci,统计 ci,【统计 】,统计 α,统计 α,内容如对您有帮助,希望把文章链接给更多的朋友!

本文介绍了隐马尔可夫模型 (HMM)、最大熵马尔可夫模型 (MEMM) 和条件随机场 (CRF) 的比较分析。 HMM、MEMM 和 CRF 是三种流行的统计建模方法,通常应用于模式识别和机器学习问题。 让我们更详细地探讨每种方法。

一、隐马尔可夫模型 (HMM)

“隐藏”一词象征着只有系统发布的符号是可观察的,而用户无法查看状态之间的底层随机游走。 该领域的许多人将 HMM 视为有限状态机。

HMM的优势

HMM 具有强大的统计基础和高效的学习算法,可以直接从原始序列数据中进行学习。 它允许以本地可学习方法的形式一致地处理插入和删除惩罚,并且可以处理可变长度的输入。 它们是序列概况最灵活的概括。 它还可以执行多种操作,包括多重对齐、数据挖掘和分类、结构分析和模式发现。 它也很容易组合到库中。

HMM 的缺点

HMM 仅依赖于每个状态及其对应的观察对象:

序列标注,除了与单个词有关系外,还与观察到的序列长度、词上下文等方面有关。

目标函数和预测的目标函数不匹配:HMM得到的是状态和观测序列的联合分布P(Y, X),而在估计问题上,我们需要一个条件概率P(Y|X)。

二、最大熵马尔可夫模型 (MEMM)

MEMM 考虑了相邻状态和整个观察序列之间的依赖关系,因此具有更好的表达能力。 MEMM不考虑P(X),减少建模工作量,学习目标函数与估计函数的一致性。

MEMM 标签偏差

在上图 中,状态 1 倾向于转换为状态 2,同时状态 2 倾向于停留在状态 2。

P(1-> 1-> 1-> 1)= 0.4 x 0.45 x 0.5 = 0.09, P(2->2->2->2)= 0.2 x 0.3 x 0.3 = 0.018,

P(1->2->1->2)= 0.6 x 0.2x 0.5 = 0.06,P(1->1->2->2)= 0.4 x 0.55 x 0.3 = 0.066。

然而,最佳状态转换路径是 1 > 1 > 1 > 1。 为什么?

这是因为 State 2 的可转换状态比 State 1 多,从而降低了转换概率——MEMM 倾向于选择可转换状态较少的状态。 这种选择被称为标签偏差问题。 CRF 很好地解决了标签偏差问题。

三、条件随机场(CRF 模型)

CRF 模型解决了标注偏差问题,消除了 HMM 中两个不合理的假设。 当然,模型也变得更复杂了。MEMM采用局部方差归一化,CRF采用全局方差归一化。另一方面,MEMM 无法找到满足以下分布的相应参数,但是 CRF 可以:

1.生成模型或判别模型学习笔记:统计建模方法的比较分析(统计 α)

假设 o 是观测值,m 是模型。

a) 生成模型:无限样本>概率密度模型=生成模型>预测

如果你对 P(o|m) 建模,它就是一个生成模型。 其基本思想是,首先建立样本的概率密度模型,然后利用该模型进行推理预测。 样本无限大或尽可能大的要求是常识。 该方法借鉴了统计力学和贝叶斯理论。

HMM直接对转移概率和表型概率进行建模,计算共现概率。 因此,它是一个生成模型。

b) 判别模型:有限样本>判别函数=判别模型>预测

如果你在条件概率 P(m|o) 上建模,它就是判别模型。 其基本思想是以有限样本建立判别函数,不考虑样本的生成模型,直接研究预测模型。 其代表理论是统计学习理论。

CRF是一种判别模型。 MEMM 不是生成模型,而是基于状态分类的具有有限状态的模型。

2.拓扑结构

HMM和MEMM是有向图,而CRF是无向图。

3.全局最优或局部最优

HMM直接对转移概率和表型概率进行建模,计算共现概率。

MEMM 基于转移概率和表型概率建立共现概率。 它计算条件概率,只采用局部方差归一化,容易陷入局部最优。

CRF 在全局范围内计算归一化概率,而不是像 MEMM 那样在局部范围内计算。 它是一个最优的全局解决方案,解决了 MEMM 中的标签偏差问题。

4.CRF的优点和缺点

(1)优点

与HMM相比:由于CRF没有HMM那样严格的独立性假设,它可以容纳任何上下文信息。 其功能设计灵活(与ME相同)。

与MEMM相比:由于CRF计算的是全局最优输出节点的条件概率,因此克服了MEMM中label bias的弊端。

与ME相比:CRF计算的是在有待标记的观察序列时,整个标记序列的联合概率分布,而不是定义给定当前状态条件下下一个状态的状态分布。

(2)缺点

CRF 在算法的训练阶段具有高度的计算复杂性。 当更新的数据可用时,很难重新训练模型。

结论

这篇博客详细介绍了隐马尔可夫模型 (HMM)、最大熵马尔可夫模型 (MEMM) 和条件随机场 (CRF) 之间的比较分析。 在这篇文章中,我们明确了解到 CRF 和 MEMMS 主要是判别序列模型,而 HMM 主要是生成序列模型。 贝叶斯规则构成了 HMM 的基础。 相反,CRF 和 MEMM 基于过渡和可观察特征的 MaxEnt 模型。

本文链接地址:https://www.jiuchutong.com/zhishi/297679.html 转载请保留说明!

上一篇:【JavaScript】手撕前端面试题:对象参数浅拷贝 | 简易深拷贝 | 完整深拷贝(javascript手机版)

下一篇:【Python】ttkbootstrap的介绍与使用(/t python)

  • 怎样摆脱传统模式做网络推广(怎样摆脱传统模型)

    怎样摆脱传统模式做网络推广(怎样摆脱传统模型)

  • 淘宝保证金代扣能关闭吗(淘宝保证金代扣是什么意思)

    淘宝保证金代扣能关闭吗(淘宝保证金代扣是什么意思)

  • 微软商店下载路径更改(微软商店下载路径更改后还是在c盘)

    微软商店下载路径更改(微软商店下载路径更改后还是在c盘)

  • 微信账号被限制登录的原因(微信账号被限制与对方聊天怎么回事)

    微信账号被限制登录的原因(微信账号被限制与对方聊天怎么回事)

  • 手机长时间不用充不进电(手机长时间不用怎样存放最好)

    手机长时间不用充不进电(手机长时间不用怎样存放最好)

  • 荣耀畅玩7c怎么录屏(荣耀畅玩7c怎么破解激活锁)

    荣耀畅玩7c怎么录屏(荣耀畅玩7c怎么破解激活锁)

  • mate30开发人员选项怎么设置(华为mate30开发者选项在哪里)

    mate30开发人员选项怎么设置(华为mate30开发者选项在哪里)

  • 蓝牙耳机有一只不亮(蓝牙耳机有一只找不到了怎么办)

    蓝牙耳机有一只不亮(蓝牙耳机有一只找不到了怎么办)

  • 微信更换实名认证是不是就是新号了(微信更换实名认证有什么影响吗?)

    微信更换实名认证是不是就是新号了(微信更换实名认证有什么影响吗?)

  • 手机屏幕开胶 危险吗(手机屏幕开胶了是什么原因造成的)

    手机屏幕开胶 危险吗(手机屏幕开胶了是什么原因造成的)

  • 戴尔笔记本开机黑屏什么都不显示(戴尔笔记本开机滴滴响5声)

    戴尔笔记本开机黑屏什么都不显示(戴尔笔记本开机滴滴响5声)

  • 打印机没有usb端口选择(打印机没有usb端口选项)

    打印机没有usb端口选择(打印机没有usb端口选项)

  • 苹果数据线一面能充电一面不能用(苹果数据线一面可以充电一面不能充)

    苹果数据线一面能充电一面不能用(苹果数据线一面可以充电一面不能充)

  • 腾讯有个直播平台叫什么(腾讯app直播平台)

    腾讯有个直播平台叫什么(腾讯app直播平台)

  • 华为mate30怎么打开悬浮球(华为mate30怎么打开双系统)

    华为mate30怎么打开悬浮球(华为mate30怎么打开双系统)

  • 淘宝的历史订单从哪看(淘宝的历史订单消失了)

    淘宝的历史订单从哪看(淘宝的历史订单消失了)

  • 手机酷狗桌面歌词不显示(手机酷狗桌面歌词怎么横屏)

    手机酷狗桌面歌词不显示(手机酷狗桌面歌词怎么横屏)

  • ios13为什么闹钟有时没声音(ios13.3闹钟不响)

    ios13为什么闹钟有时没声音(ios13.3闹钟不响)

  • 华为p9有nfc功能吗(华为p9有nfc嘛)

    华为p9有nfc功能吗(华为p9有nfc嘛)

  • 苹果app内购买怎么扣费(苹果app内购买怎么下载)

    苹果app内购买怎么扣费(苹果app内购买怎么下载)

  • 教务系统账号被锁定了怎么办(教务系统账号被锁定)

    教务系统账号被锁定了怎么办(教务系统账号被锁定)

  • 强提醒对方能看到吗(给对方设置强提醒对方知道吗)

    强提醒对方能看到吗(给对方设置强提醒对方知道吗)

  • 美团怎么看好友(美团怎么看好友吃了什么)

    美团怎么看好友(美团怎么看好友吃了什么)

  • 天猫手机如何投诉卖家(天猫手机如何投屏电视)

    天猫手机如何投诉卖家(天猫手机如何投屏电视)

  • Windows11激活密钥/激活码/序列号分享 附激活工具(windows11激活密钥多少钱)

    Windows11激活密钥/激活码/序列号分享 附激活工具(windows11激活密钥多少钱)

  • 支付给法律顾问的钱
  • 现金流量表和其他表的勾稽关系
  • 咨询服务业涉及税费
  • 报废车残值款计入什么科目
  • 一般纳税人简易计税可以抵扣进项税额吗
  • 购进餐饮服务的会计分录
  • 新增资产额怎么计算
  • 全年一次性奖金税收计算器
  • 库存现金和银行存款的区别
  • 工会经费怎样申报
  • 公司购车按揭利息可以开票吗
  • 退回房租含税的情况怎么入账?
  • 企业所得税期末贷方余额怎么办
  • 股权转让如何避免缴纳个税
  • 统一员工行为规范
  • 红字发票通知单已经上传可以作废吗
  • 印花税多计提如何冲回
  • 去年管理费用多记账结账如何调账
  • 电子承兑汇票贴现怎么做账
  • 会计上金融资产包括哪些
  • 决算报表是财务报表吗
  • 网络不通怎么办苹果手机
  • safari浏览器怎么快进
  • win11无法安装程序包
  • 工程事故赔偿协议书怎么写
  • PHP:Memcached::getOption()的用法_Memcached类
  • php imagestring
  • 后台管理系统权限管理详解
  • php imagettftext
  • 非上市员工持股
  • 一般纳税人企业所得税如何计算
  • 大前端最新
  • php数组查询
  • h5与小程序交互
  • javascript中文手册
  • 员工持股平台合伙企业
  • wordpress文章保存在哪里
  • 企业年报未报会有什么后果
  • 主营业务成本可以设置二级科目吗
  • 如何查询去年企业所得税
  • 帝国cms使用手册
  • python中的装饰器的使用实战
  • 不确认递延所得税资产的特殊情况举例
  • 小企业会计准则调整以前年度费用分录
  • 不抵扣的进项税额用不用转出
  • 印花税购销合同计税依据
  • 医院累计折旧会计分录
  • sql2016异地备份
  • 预收账款和应收账款可以合并吗
  • 事故赔偿金分配
  • 商品流通企业应交那些税费
  • 电费发票上的数量是什么意思
  • 行政事业单位拨付给企业的财政补助款用交增值税吗
  • 给客户买的礼品要交税吗
  • 没有收到款项签认债有用吗
  • 质量赔款能冲减收入么
  • 赔偿给别人的钱还能要回来吗
  • 残疾人就业保障金上年职工工资总额
  • 制造费用和直接人工的区别
  • 买给员工吃的零食内容怎么写
  • 其他应付款的核算范围包括应付短期租赁
  • .NET Framework SQL Server 数据提供程序连接池
  • u盘装win8系统教程图解
  • linux如何安装rz和sz
  • win10系统自带的浏览器叫什么
  • win8系统怎么设置密码
  • 刻录ghost安装光盘
  • win8修改锁屏壁纸
  • ubuntu14.04.6安装教程
  • 在linux系统中,用来存放系统所需要的配置文件
  • jquery的实现原理
  • eclipse创建android项目
  • Linux 中的cat命令
  • linux常用命令及实例
  • 用python编写
  • jquery基本知识
  • 宁波鄞州区行政区划代码
  • 云南省国家税务局
  • 河南省人民医院和郑大一附院哪个好
  • 广东省税务登记网
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设