位置: IT常识 - 正文

MAE详解

编辑:rootadmin
MAE详解

目录

一、介绍

二、网络结构

1. encoder

2. decoder

3. LOSS

三、实验


推荐整理分享MAE详解,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

全文参考:论文阅读笔记:Masked Autoencoders Are Scalable Vision Learners_塔_Tass的博客-CSDN博客

masked autoencoders(MAE)是hekaiming大佬又一新作,其做法很简单,就是随机mask掉一部分patches并重建这部分丢失的像素,可看作是一个可扩展的(scalable)自监督学习器,能极大加速模型的训练速度并提升准确率。下游迁移性能优于有监督预训练,并有良好的的scaling(可扩展性)。

一、介绍

mask autoencoders是一种更一般的去噪方式。

语言的信息密度更高,mask掉部分文字可能使得语义完全不同,这个任务会导致更复杂的语言理解;而图像的冗余度就很高,因此mask掉部分patch,大大减少冗余信息。并创建一个很有挑战性的自监督创建任务,提升对图像的整体理解。

AE的decoder将潜在表示映射回输出,相比于语言的重建,图像像素的重建,语义级别更低。decoder往往仅需要轻量级即可,比编码器更浅更窄。但我们发现,对于图像,decoder的设计很大程度上影响着潜在表示的语义表达水平。

二、网络结构MAE详解

我们设计的是非对称的encoder decoder,encoder仅在未被mask的patch上进行编码,生成潜在表示,decoder再基于潜在表示和被mask的patch一起重建。

1. encoder

这里,encoder对于被mask的patch,并不是用0填充,而是直接忽略,因此patch数量的减少,能直接降低计算量,加快训练速度(75%的mask率就相当于加速3倍),且降低了内存消耗使得可以用更大模型。

2. decoder

而decoder仅在预训练阶段进行重构任务(即在下游任务finetune的时候是不需要decoder的),因此decoder的设计可以灵活。

encoder的加深有利于潜在表示能表达更抽象的语义信息,而decoder可以设计的更浅更窄,我们使用单个的transfomer这种小型解码器也可以表现出色,且速度快。

3. LOSS

我们使用原始图像与重构图像在mask patch部分的MSE损失(均方误差)。一个变体是,用每个patch的mean std进行归一化后,计算每一个patch的归一化像素的MSE,这个可以明显提高表示质量。

三、实验

(与有监督/无监督的预训练方法进行比较)

1)比MOCOv3的预训练finetune效果更好

2)在目标检测任务中,ViT与FPN搭配更好,与有监督的预训练相比,MAE要更优。

自己的总结:MAE是一种很好的自监督训练器,其训练的预训练模型,比有监督的、MOCO自监督的,在下游任务finetune上都取得更好的效果

本文链接地址:https://www.jiuchutong.com/zhishi/299587.html 转载请保留说明!

上一篇:less变量

下一篇:路由vue-route的使用(vue router 路由参数)

  • 为什么华为nfc用不了(为什么华为nfc为什么读不了卡)

    为什么华为nfc用不了(为什么华为nfc为什么读不了卡)

  • 语音控制怎么老跳出来(语音控制怎么老是断开)

    语音控制怎么老跳出来(语音控制怎么老是断开)

  • 淘宝618预售时间(淘宝618预售是什么时候)

    淘宝618预售时间(淘宝618预售是什么时候)

  • 苹果投屏电脑画面卡顿(苹果投屏电脑操作)

    苹果投屏电脑画面卡顿(苹果投屏电脑操作)

  • 钉钉连麦有回音怎么解决(钉钉连麦有回音对方声音特别小)

    钉钉连麦有回音怎么解决(钉钉连麦有回音对方声音特别小)

  • 腾讯课堂可以看在线时长吗(腾讯课堂可以看见学生观看时长吗)

    腾讯课堂可以看在线时长吗(腾讯课堂可以看见学生观看时长吗)

  • oppo手机gps信号弱怎么办(oppor15手机gps信号弱怎么办)

    oppo手机gps信号弱怎么办(oppor15手机gps信号弱怎么办)

  • 小米售后屏幕是否都为原装(小米售后屏幕是原装的吗)

    小米售后屏幕是否都为原装(小米售后屏幕是原装的吗)

  • iphone11刘海屏能隐藏吗(苹果11刘海屏)

    iphone11刘海屏能隐藏吗(苹果11刘海屏)

  • 无线摄像头复位没反应(无线摄像头复位后怎么连接)

    无线摄像头复位没反应(无线摄像头复位后怎么连接)

  • 苹果11怎么微信分身啊(苹果11怎么微信视频美颜)

    苹果11怎么微信分身啊(苹果11怎么微信视频美颜)

  • 电池泡水泡多久会有毒(电池泡水泡多久会没电)

    电池泡水泡多久会有毒(电池泡水泡多久会没电)

  • iphone之间一键换机(iphone如何一键换机)

    iphone之间一键换机(iphone如何一键换机)

  • 小爱触屏音箱怎么连接(小爱触屏音箱怎么使用)

    小爱触屏音箱怎么连接(小爱触屏音箱怎么使用)

  • 快手直播间为什么显示10w(快手直播间为什么不能微信支付)

    快手直播间为什么显示10w(快手直播间为什么不能微信支付)

  • 手机主题如何下载(手机主题如何下载到电脑)

    手机主题如何下载(手机主题如何下载到电脑)

  • 手机自动接听怎么设置(手机自动接听怎么设置关闭)

    手机自动接听怎么设置(手机自动接听怎么设置关闭)

  • 知道抖音号怎么登录(知道抖音号怎么查手机号)

    知道抖音号怎么登录(知道抖音号怎么查手机号)

  • 兼容机的优缺点(兼容机的概念是谁提出来的)

    兼容机的优缺点(兼容机的概念是谁提出来的)

  • 手机没内存卡能不能用(手机没内存卡能用吗)

    手机没内存卡能不能用(手机没内存卡能用吗)

  • 微信卸载后会失去什么(微信卸载后会失信吗)

    微信卸载后会失去什么(微信卸载后会失信吗)

  • 小米9pro支不支持4g(小米9pro支不支持全球通)

    小米9pro支不支持4g(小米9pro支不支持全球通)

  • 华为nova5pro支持电子身份证吗(华为nova5pro支持内存卡扩展吗)

    华为nova5pro支持电子身份证吗(华为nova5pro支持内存卡扩展吗)

  • 锤子TNT是什么系统(锤子tnt go测评)

    锤子TNT是什么系统(锤子tnt go测评)

  • 爱人老公有外遇怎么办(我老公有外遇了,我很爱他,我该怎么办)

    爱人老公有外遇怎么办(我老公有外遇了,我很爱他,我该怎么办)

  • 【Discuz】实现主题标题和正文同时显示

    【Discuz】实现主题标题和正文同时显示

  • 稳岗返还资金最新账务处理
  • 借款合同印花税最新政策2023年
  • 营业外收入影响所有者权益吗
  • 已交增值税如何做账
  • 出租车定额发票真伪查询
  • etc设备有区别吗
  • 收到别的公司的转账支票
  • 企业进货不收发票怎么做帐?
  • 企业结转已销产品的生产成本
  • 年内累计增量和年度增量计算公式
  • 文化传媒行业会计
  • 普通硅酸盐水泥和矿渣硅酸盐水泥的区别
  • 增值税2017年起征点
  • 关于7.1号增值税普通发票新规
  • 企业转让股权收入应于转让协议生效时确认收入的实现
  • 在建期间费用怎么处理?
  • 利润分配可以用现金吗
  • 社保公司返还多交的保险费会计分录怎么写?
  • 其他收益科目核算
  • 成本票要交税吗
  • 购进材料用于在建工程进项税
  • 怎么获取win10密钥
  • 开机速度慢是怎么回事
  • code inspections
  • 附加税异地预缴如何申报
  • 教育发展基金计提比例
  • linux 文件修改
  • 转销盘盈会计分录
  • 售后租回交易形成融资租赁会计处理
  • 境外付款
  • 房产自用或出租什么意思
  • kafka图形化界面
  • php通用分页类
  • 营改增后小规模纳税人标准
  • 车间使用的辅助材料
  • json解析漏洞
  • python中生成器的作用
  • python socket连接后发送数据被强行终止
  • 以前年度多计提折旧
  • 收支平衡表怎么做工厂表格
  • 未交增值税借方余额怎么调整
  • 员工食堂买菜账务流程
  • 其他应付款科目贷方登记发生的各种应付
  • 制造费用账户在月末一般没有余额
  • 发票入账的管理规定
  • 建筑行业小规模纳税人和一般纳税人
  • 专项储备 科目
  • 增加固定资产原值后折旧
  • 服务业有制造费用吗
  • 未抵扣机动车专票红字发票怎么填开
  • 转让厂房如何缴纳土地增值税
  • SQL order by ID desc/asc加一个排序的字段解决查询慢问题
  • mysql的三种查询方式
  • mysql中decimal对应java类型
  • Windows Server 2008的NPS策略应用
  • solaris 创建文件
  • win8系统怎样查看本机的ip地址
  • browsercore.exe是什么
  • win7如何删除网络上的其它计算机
  • linux操作系统b
  • 手把手教您安装软件
  • ssh远程登录设置
  • win8初始登录账号密码
  • win8设备管理器没有端口
  • kui血条插件设置
  • gridview用法
  • 网站渗透违法吗
  • 彻底弄懂js中的this指向
  • linux批量修改文件时间
  • 滚动的纸箱
  • jQuery 利用$.ajax 时获取原生XMLHttpRequest 对象的方法
  • Javascript & DHTML 实例编程(教程)基础知识
  • jquery选择器大全
  • python,web
  • python shutil
  • 税务局遴选能去什么单位
  • 税法 农产品增值税题目及答案
  • 税务检查的三种常用方法
  • 库尔勒市税务局领导简介
  • 河南工商年检网上申报APP
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设