位置: IT常识 - 正文

GCN经典论文笔记:Semi-Supervised Classification with Graph Convolutional Networks

编辑:rootadmin
GCN经典论文笔记:Semi-Supervised Classification with Graph Convolutional Networks 文章目录前言一、论文拟解决问题与思想二、正文1.标识概念2.快速卷积2.1 谱图卷积2.2 线性模型3.半监督节点分类4.实验5.结果总结前言

推荐整理分享GCN经典论文笔记:Semi-Supervised Classification with Graph Convolutional Networks,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

开始进入研究生生活啦~想研究的方向是图深度学习方向,现在对图卷积神经网络GCN进行相应的了解。这篇文章就是对《Semi-Supervised Classification with Graph Convolutional Networks》这篇发表在2017年ICLR上的会议论文。这是一篇经典的论文,对刚刚接触GCN的研究人员来说,是一个很好的开始。

一、论文拟解决问题与思想

《Semi-Supervised Classification with Graph Convolutional Networks》这篇论文受到谱图卷积的局部一阶近似可以用于对局部图结构与节点的特征进行编码从而确定卷积网络结构的启发,提出了一种可扩展的图卷积的实现方法,可用于具有图结构数据的半监督学习。

二、正文1.标识概念

首先需要对论文中所涉及到的基本概念进行相应的了解。 A(Adjacency Matrix)表示图的邻接矩阵。表示顶点之间相邻关系的矩阵。 A的上面在加一横线的计算方式为A + I,表示带自环的邻接矩阵。 D(Degree Matrix)表示图的度矩阵。为对角矩阵,对角上的元素为各个顶点的度。顶点vi的度表示和该顶点相关联的边的数量。(无向图中一般记录的是单纯的入度或者出度) L(Laplacian Matrix)表示图的拉普拉斯矩阵。其为半正定矩阵,运算规则是D-A。 Lsym(Symmetric Normalized Laplacian Matrix)表示对称归一化的拉普拉斯矩阵。表示为L左乘D的-1/2次方,再右乘D的-1/2次方;也可以表示为用单位矩阵I减去L左乘D的-1/2次方,再右乘D的-1/2次方。式子如下: 此矩阵还有一种计算方式:

2.快速卷积

首先必须理解卷积的概念:这个地方主要理解为:翻转->滑动->叠加->滑动->叠加… 连续情况下叠加是指乘积的积,离散情况下是加权求和。 在一张图中,我们可以知道每个节点都有自己的特征信息和结构信息,GCN是一种能对图数据进行深度学习的方法。可以通过以下三个步骤进行理解图卷积算法: 1.发射:每一个节点将自身的特征信息经过变换后发送给邻居节点。这是对节点的特征信息进行抽取变换。 2.接收:每个节点将邻居节点的特征信息聚集起来。这是对节点的局部结构信息进行融合。 3.变换:把前面的信息聚集之后做非线性变换,增加模型的表达能力。 论文中所提到的使用神经网络模型f(X,A)对所有带标签节点进行基于监督损失的训练。其中X为输入数据,A为图的邻接矩阵。 f (⋅)表示一个运算或者代表一个神经网络函数,可以允许模型从监督损失L0中分配梯度信息,可以学习所有节点包括带标签的和不带标签的表示。 本文在快速卷积方面提出了多层图卷积网络的规则,其中公式如下: 上面式子所涉及到的W (l)表示为特定层可训练的权重矩阵。值得注意的是,在多层GCN中,带自环的邻接矩阵是固定不变的,它依赖于最开始拓扑图的构建,我们需要学习的只有权重矩阵的参数。此处插入几个疑问: Q:为什么需要添加自环? A:如果不添加自环,在汇集邻居信息的时候,不管使用平均法还是加权平均法都忽略了自身节点的特征。所以在更新自身节点时,一般需要添加一个自环,把自身特征和邻居特征结合起来更新节点。 Q:为什么使用对称归一化? A:一张图中,不同节点,其边的数量和权重幅值都不一样,比如有的节点特别多的边,这就导致了多边或者权重很大的节点在聚合后的特征值远远大于少边或者边权重小的节点。这可能导致网络训练过程中梯度爆炸或者梯度消失的问题。所以需要在节点更新自身前,对邻居传来的信息(包括自环信息)以及邻居节点所传播的信息进行归一化消除这样的问题。总结来说,可以将归一化的矩阵看作是对邻接矩阵的一种横、纵向归一化。 Q:为什么会引入拉普拉斯矩阵? A:因为拉普拉斯矩阵是一个对称矩阵,可以进行特征分解。在谱域研究图,需要对图进行傅里叶变换将图投影到傅里叶域。一个域之所以称之为“域”,起码应该包含一组正交基,使得该域的各个位置或者各个状态都可以由这组正交基的线性组合来表示。其中拉普拉斯矩阵的特征向量恰好可以组成一组正交基,所以可以使用矩阵形式来表示图的傅里叶变换。 Q:为什么要对拉普拉斯矩阵进行特征分解? A:卷积在傅里叶域的计算相对简单,因此我们需要将图由空域变换到谱域,而在这一变换中,需要找到图的连续正交基以对应于傅里叶变换的基,因此需要使用拉普拉斯矩阵的特征向量。

引入激活函数的目的:如果在神经网络中不引入激活函数,那么在该网络中,每一层的输出都是上一层输入的线性函数,无论最终的神经网络有多少层,输出都是输入的线性组合,这样更深层次的网络便没有了存在的意义,并且在非线性的问题中无法发挥优势。于是添加激活函数引入非线性因素,引入了非线性表达能力,不仅使得神经网络的适用范围更广泛,而且提高了模型的鲁棒性、缓解梯度消失的问题、将特征输入映射到新的特征空间、加速模型的收敛。

2.1 谱图卷积

借助图谱的理论来实现拓扑图上的卷积操作,也是利用图的拉普拉斯矩阵的特征值和特征向量来研究图的性质。 第一种卷积公式如下: 其中x表示图节点的特征向量;gθ=diag(θ)为卷积核,其中θ为参数;U为图的拉普拉斯矩阵L的特征向量矩阵。 在论文中提到,此公式计算过于复杂、卷积核的选取也不合适,于是提出了以下内容。

第二种卷积公式: 这里提出了一种卷积核的设计方法,即gθ(Λ)可以用切比雪夫多项式T k(x)到第K代的截断展开来近似。 第一类的切比雪夫(Chebyshev)多项式,由以下递推式得到: 于是新的卷积核表示为: 其中Λ横 = 2Λ / λmax - In,λmax为L的最大特征值;θ’ ∈ Rk表示为切比雪夫系数的向量。 进而得到卷积公式如下: 其中L横的计算方式和上面的Λ横计算方式一样。 注意这个公式是拉普拉斯算子中的K阶多项式,仅仅依赖于离中央节点最大K步的节点。

GCN经典论文笔记:Semi-Supervised Classification with Graph Convolutional Networks

第二种卷积公式将参数化简到了K个,不再需要做特征分解,直接使用L进行变换,解决了最为耗时的一步,利用切比雪夫多项式去拟合卷积核方法降低了复杂度。 Q:为什么要引入切比雪夫多项式? A:因为切比雪夫多项式可以用来逼近函数。

2.2 线性模型

GCN可视为对ChebNet的进一步简化,当卷积操作K = 1时,关于L是线性的,因此在拉普拉斯谱上有线性函数。在此基础上,假设λmax ≈ 2,可以预测GCN的参数在训练过程中可以适应这样的变化,当ChebNet一阶近似时, 那么ChebNet卷积公式简化近似为如下公式:

其中此公式中包含两个自由参数θ0’和θ1’,滤波器的参数可以被整个图片共享。 连续使用这种形式的滤波器,可以有效的卷积节点K阶邻域,K为模型中连续滤波操作或者卷积层的数目。

为了限制参数的数量以解决过度拟合, 并最小化每层的计算操作, 1-st ChebNet假设 ,图卷积的定义就近似为(简单一阶模型),在实际运用中,我们采用以下简化操作: 我们令θ = θ0’ = - θ1’,则可以得到以下的公式: 而 的特征值范围在 [0,2], 所以在深度神经网络中反复使用该算子将导致数值消失或爆炸问题(梯度爆炸或消失问题). 所以引入归一化技巧(renormalization trick),即拓扑图加上自环: 所以论文中的快速卷积公式就是: 其中 是参数 矩阵, 为节点的特征向量. 计算复杂度也大大降低。

上述的标识符号已在本文前面介绍过,这里不再赘述。 当此定义推广到具有C个输入通道的信号X和F个滤波器中,则特征映射的式子如下: 其中Θ是滤波参数矩阵,Z是卷积后的信号矩阵。

3.半监督节点分类

在解决完了模型f ( X , A ) 可以在图中有效传播信息之后,我们回归到半监督节点分类的问题上来。一个整体的多层半监督GCN模型如下图所示: 左图(a)是一个GCN的网络示意图,输入层拥有C个通道,中间包含若干隐藏层,输出层有F个特征映射,图的结构在层之间共享,标签用Yi表示。 右图(b)是一个两层GCN在Cora数据集上训练得到的隐藏层激活值的形象表示,颜色代表文档的类别。

预处理出A横,则可以使模型更加简洁: 其中W(0)为输入层到隐藏层的权重矩阵;W(1)为隐藏层到输入层的权重矩阵 softmax函数的定义为:softmax函数可以将多分类的输出值转换为范围在[0, 1]和为1的概率分布,作用在每一行上 之后,需要评估所有标记标签的交叉熵误差,交叉熵损失函数刻画了实际输出概率与期望输出概率之间的相似度,若交叉熵的值越小,两个概率分布就越接近。式子如下图所示: Yl是所有带标签节点的索引集合, Y 是真实标签, Z 是网络输出。将标签传给交叉熵就可以让网络进行学习了,经过训练后, 便可以得到无标签节点的标签。

最后使用梯度下降算法进行训练网络中的权重W(0)和W(1),对每个完整的数据集执行批量梯度下降算法。

4.实验

论文中提到该模型在实验中得到了测试,主要有引文网络中的半监督的文档分类、知识图中提取二分图的半监督实体分类。 使用到的数据集如下表所示: 简单分析一下cora数据集:该数据集共2708个样本点,每个样本点都是一篇科学论文,所有样本点被分为7个类别。每篇论文都由一个1433维的词向量表示,所以,每个样本点具有1433个特征。词向量的每个元素都对应一个词,且该元素只有0或1两个取值。取0表示该元素对应的词不在论文中,取1表示在论文中。所有的词来源于一个具有1433个词的字典。

每篇论文都至少引用了一篇其他论文,或者被其他论文引用,也就是样本点之间存在联系,没有任何一个样本点与其他样本点完全没联系。如果将样本点看做图中的点,则这是一个连通的图,不存在孤立点。

5.结果

实验结果如下表所示: 论文中对比了其他方法所作出的实验结果,可以看出,本篇论文的图卷积方法有较高的准确性。

总结

花了一些时间精读和领会,确实有了不小的收获。花了大量的时间在基本概念和计算公式的查阅和理解上,初次阅读当然也不会完全理解,还需要多次精细阅读,在实践中将理论充分运用。继续加油吧。如果有一些新的发现和收获,还会继续补的~

本文链接地址:https://www.jiuchutong.com/zhishi/299931.html 转载请保留说明!

上一篇:【相机标定】相机内参(什么叫相机标定)

下一篇:box-sizing:border-box的理解和作用

  • 比特彗星有安卓版没(比特彗星安卓版下载官网)

    比特彗星有安卓版没(比特彗星安卓版下载官网)

  • 苹果xr相机如何设置更清晰(苹果xr相机如何调焦)

    苹果xr相机如何设置更清晰(苹果xr相机如何调焦)

  • 魔百盒怎么进入开发者(魔百盒怎么进入家庭专区)

    魔百盒怎么进入开发者(魔百盒怎么进入家庭专区)

  • 微信视频不提示怎么设置(微信视频不提示怎么回事)

    微信视频不提示怎么设置(微信视频不提示怎么回事)

  • 屏幕怎么查京东方还是三星的(京东怎么看有没有碎屏险)

    屏幕怎么查京东方还是三星的(京东怎么看有没有碎屏险)

  • 佳明手表怎么开机(佳明手表怎么开始跑步)

    佳明手表怎么开机(佳明手表怎么开始跑步)

  • 华为nova5特殊功能(华为nova5功能)

    华为nova5特殊功能(华为nova5功能)

  • 淘宝投诉程序怎么走(淘宝投诉的方法如下)

    淘宝投诉程序怎么走(淘宝投诉的方法如下)

  • qq音乐绿钻刚开通可以退嘛(qq音乐绿钻还要付费)

    qq音乐绿钻刚开通可以退嘛(qq音乐绿钻还要付费)

  • 手机型号代表什么意思(手机型号?)

    手机型号代表什么意思(手机型号?)

  • 华为手机清除cache分区是什么意思(华为手机清除cache分区闪退怎么办)

    华为手机清除cache分区是什么意思(华为手机清除cache分区闪退怎么办)

  • 携程抢票要先付款吗(携程抢票先付款还是后付款)

    携程抢票要先付款吗(携程抢票先付款还是后付款)

  • aicde主要包含什么(aicd的意义)

    aicde主要包含什么(aicd的意义)

  • 微博怎么获得铁粉头衔(微博怎么获得铁粉标)

    微博怎么获得铁粉头衔(微博怎么获得铁粉标)

  • qqwifi在线就在玩手机吗(qq显示wifi在线)

    qqwifi在线就在玩手机吗(qq显示wifi在线)

  • 小米mi4lte是什么型号(小米4td-lte)

    小米mi4lte是什么型号(小米4td-lte)

  • 为什么浏览器看视频网速慢(为什么浏览器看视频没有声音)

    为什么浏览器看视频网速慢(为什么浏览器看视频没有声音)

  • 苹果手机一晚上掉电多少正常(苹果手机一晚上没充上电是怎么回事)

    苹果手机一晚上掉电多少正常(苹果手机一晚上没充上电是怎么回事)

  • 手机卡业务如何取消(手机卡业务如何退订)

    手机卡业务如何取消(手机卡业务如何退订)

  • qq音乐桌面壁纸怎么弄(qq音乐壁纸怎么设置)

    qq音乐桌面壁纸怎么弄(qq音乐壁纸怎么设置)

  • 电话卡上显示hd是啥意思(电话卡上显示E是什么意思)

    电话卡上显示hd是啥意思(电话卡上显示E是什么意思)

  • 华为nova5耳机插孔在哪里(华为nova5耳机插哪里)

    华为nova5耳机插孔在哪里(华为nova5耳机插哪里)

  • 电话小号怎么申请(小号码怎么弄的)

    电话小号怎么申请(小号码怎么弄的)

  • Rietvlei自然保护区内的布氏斑马母子,南非 (© Richard Du Toit/Minden Pictures)(自然保护绘画)

    Rietvlei自然保护区内的布氏斑马母子,南非 (© Richard Du Toit/Minden Pictures)(自然保护绘画)

  • BEV(Bird’s-eye-view)三部曲之二:方法详解

    BEV(Bird’s-eye-view)三部曲之二:方法详解

  • python中series排序的两种方法(python列表排序sorted)

    python中series排序的两种方法(python列表排序sorted)

  • 织梦dede数据库内容替换,正则去掉文章内容中的img标签(织梦数据库连接失败的原因)

    织梦dede数据库内容替换,正则去掉文章内容中的img标签(织梦数据库连接失败的原因)

  • 个税手续费返还交增值税,但是6%的那行是灰色的
  • 税收管辖权是指
  • 固定资产盘亏计入什么科目
  • 营业成本占营业收入比重较低的原因
  • 减免教育费附加和地方教育费附加
  • 企业审计费入什么科目
  • 公司代个人收承兑汇票
  • 新公司注册资金需要实缴吗
  • 网上代购收取手机费吗
  • 交易性金融资产有哪些
  • 电影院场地出租价格
  • 公司往来款现金流量表
  • 冲减预提费用
  • 公司报销学费属于 薪酬还是福利呢
  • 营改增后还有消费税吗
  • 股票收益收税吗
  • 给出含税货款会计分录
  • 银行定期存款账户
  • Win11文件资源管理器将更新
  • 进项票未认证怎么入账
  • 辅助生产车间照明用电计入哪个科目
  • 中秋福利费会计分录
  • 退税需要怎么操作
  • PHP开发之归档格式
  • 行政单位如何将资产年报导入财报里
  • 检验费用会计分录
  • 企业所得税计提会计分录怎么做
  • 增值税加计扣除最新政策
  • 前端项目如何部署到服务器
  • php json 对象
  • 车船税发票丢失
  • 6372056181电子退库收入
  • php连接redis集群
  • 2023年第十一批专项债
  • javascript 高级教程
  • css如何应用
  • php使用oci8扩展连接oracle
  • urlparse安装
  • pythongui库
  • phpcms程序
  • 安装sql server 2005,安装不成功怎么设置
  • sqlserver远程连接失败
  • 直接计入所有者权益的利得和损失
  • 小企业会计准则适用于哪些企业
  • 红冲上月发票都附什么附件
  • 企业现金清查的主要内容有什么
  • 投资收益影响营业额吗
  • 投资性房地产出租收入计入什么科目
  • 出口应纳增值税
  • 为什么借贷平台借不到钱了
  • 小规模纳税人预交增值税率
  • 上年度会计凭证怎么填
  • 电子监控系统安装与维修
  • 安全生产费计提和使用的账务怎么处理
  • 什么是预收账款的正常余额
  • 外汇账户具体包括哪些
  • 收到银联商务客户短信
  • sqlserver的sql文件导入mysql
  • sql多表连接查询(详细实例)
  • win10如何查看系统日志
  • os x 10.10.5
  • macbookpro安装双系统win7系统
  • scsiaccess.exe - scsiaccess是什么进程 有什么用
  • 如何设置windows hello
  • ubuntu安装指南
  • win7如何变快
  • win80xc0000001怎么修复
  • Win10 Mobile RedStone预览版14267已知问题与修复内容汇总
  • 事件委托机制的三个主要组件
  • bootstrap怎么用
  • 简单的jquery插件实例
  • unity shader视频教程
  • 福建省国家税务局网
  • 贵州省地方税务局税源管理平台(二次)招标合同公告
  • 税务官网怎么登录账号
  • 济南个税起征点是多少2021
  • 内蒙地税个人所得税标准
  • 个人所得税必须企业代扣代缴吗
  • 征地税税率是多少
  • 薰衣草商业价值
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设