GCN之邻接矩阵标准化

GCN每一层的输入都是节点特征矩阵H和邻接矩阵A，直接将这两个做内积，再乘以一个参数矩阵W，用激活函数激活，就形成一个简单的神经网络层。

1. 邻接矩阵标准化

import numpy as np import scipy.sparse as sp if FLAGS.model == 'gcn': support = [preprocess_adj(adj)] num_supports = 1 model_func = GCN

1.1 邻接矩阵+单位矩阵

但是因为邻接矩阵的对角都是0，和特征矩阵内积相当于将邻接矩阵做了加权和，节点特征的值成为了邻接矩阵的权，自身的特征被忽略。为避免这种情况，可以先给A加上一个单位矩阵I,单位矩阵。它是个方阵，从左上角到右下角的对角线（称为主对角线）上的元素均为1。除此以外全都为0。这样，使得邻接矩阵的对角元素变成1。

def preprocess_adj(adj): """Preprocessing of adjacency matrix for simple GCN model and conversion to tuple representation.""" adj_normalized = normalize_adj(adj + sp.eye(adj.shape[0])) # 给A加上一个单位矩阵 return sparse_to_tuple(adj_normalized)

1.2 归一化处理

就算如此，因为邻接矩阵A没有经过归一化处理，这样难以将数据限制在我们需要的范围内。通过归一化处理，可以将数据变得具有可比性，但又相对保持数据之间的关系。使得原来很难在一张纸上做出的图更方便给出图上的相对位置。因此，为了避免邻接矩阵和特征矩阵内积相乘改变特征原本的分布，需要我们对A做一个标准化处理。首先，给A乘以度矩阵 $D^{-1}$ ，进一步将其拆为两个 $D^{-1/2}$ ，得到对称且归一化的矩阵——（ $D^{-1/2}$ ）*（对称矩阵A） *（ $D^{-1/2}$ ）。

通过以上处理后，即使不训练，完全用随机初始化的参数W，GCN提取出来的特征就十分优秀了。

def normalize_adj(adj): """Symmetrically normalize adjacency matrix.""" adj = sp.coo_matrix(adj) # 采用三元组(row, col, data)的形式存储稀疏邻接矩阵 rowsum = np.array(adj.sum(1)) # 按行求和得到rowsum, 即每个节点的度 d_inv_sqrt = np.power(rowsum, -0.5).flatten() # (行和rowsum)^(-1/2) d_inv_sqrt[np.isinf(d_inv_sqrt)] = 0. # isinf部分赋值为0 d_mat_inv_sqrt = sp.diags(d_inv_sqrt) # 对角化; 将d_inv_sqrt 赋值到对角线元素上, 得到度矩阵^-1/2 return adj.dot(d_mat_inv_sqrt).transpose().dot(d_mat_inv_sqrt).tocoo() # (度矩阵^-1/2)*邻接矩阵*(度矩阵^-1/2)

2. 切比雪夫多项式近似

def chebyshev_polynomials(adj, k): """Calculate Chebyshev polynomials up to order k. Return a list of sparse matrices (tuple representation).""" print("Calculating Chebyshev polynomials up to order {}...".format(k)) adj_normalized = normalize_adj(adj) laplacian = sp.eye(adj.shape[0]) - adj_normalized # L=I-D^{-1/2} A D^{-1/2} largest_eigval, _ = eigsh(laplacian, 1, which='LM') # 得到laplacian矩阵的最大特征值  scaled_laplacian = (2. / largest_eigval[0]) * laplacian - sp.eye(adj.shape[0]) # 对laplacian矩阵进行scale处理 t_k = list() t_k.append(sp.eye(adj.shape[0])) t_k.append(scaled_laplacian) def chebyshev_recurrence(t_k_minus_one, t_k_minus_two, scaled_lap): s_lap = sp.csr_matrix(scaled_lap, copy=True) return 2 * s_lap.dot(t_k_minus_one) - t_k_minus_two for i in range(2, k+1): t_k.append(chebyshev_recurrence(t_k[-1], t_k[-2], scaled_laplacian)) return sparse_to_tuple(t_k)

3. 一阶近似

参考博客:https://blog.csdn.net/u012856866/article/details/108258564

《GCN之邻接矩阵标准化.doc》

下载本文的Word格式文档，以方便收藏与打印。

GCN之邻接矩阵标准化

1. 邻接矩阵标准化

1.1 邻接矩阵+单位矩阵

1.2 归一化处理

2. 切比雪夫多项式近似

3. 一阶近似

相关推荐

【bzoj1009】: [HNOI2008]GT考试字符串-kmp-矩阵乘法-DP

2021-04-01：给定一个正方形矩阵matrix，原地调整成顺时针90度转动的样子。[[a,b,c],[d,e,f],[g,h,i]]变成[[g,d,a],[h,e,b],[i,f,c]]。

2022-06-11：注意本文件中，graph不是邻接矩阵的含义，而是一个二部图。在长度为N的邻接矩阵matrix中，所有的点有N个，matrix[i][j]表示点i到点j的距离或者权重，而在二部

MKL稀疏矩阵运算示例及函数封装

大规模 Transformer 模型 8 比特矩阵乘简介 - 基于 Hugging Face Transformers、Accelerate 以及 bitsandbytes

矩阵的行主序与列主序的分析

利用sklearn对MNIST手写数据集开始一个简单的二分类判别器项目（在这个过程中学习关于模型性能的评价指标，如accuracy，precision，recall，混淆矩阵）

GCN和GCN在文本分类中应用

GCN之邻接矩阵标准化

1. 邻接矩阵标准化

1.1 邻接矩阵+单位矩阵

1.2 归一化处理

2. 切比雪夫多项式近似

3. 一阶近似

相关推荐

【bzoj1009】: [HNOI2008]GT考试 字符串-kmp-矩阵乘法-DP

2021-04-01：给定一个正方形矩阵matrix，原地调整成顺时针90度转动的样子。[[a,b,c],[d,e,f],[g,h,i]]变成[[g,d,a],[h,e,b],[i,f,c]]。

2022-06-11：注意本文件中，graph不是邻接矩阵的含义，而是一个二部图。 在长度为N的邻接矩阵matrix中，所有的点有N个，matrix[i][j]表示点i到点j的距离或者权重， 而在二部

MKL稀疏矩阵运算示例及函数封装

大规模 Transformer 模型 8 比特矩阵乘简介 - 基于 Hugging Face Transformers、Accelerate 以及 bitsandbytes

矩阵的行主序与列主序的分析

利用sklearn对MNIST手写数据集开始一个简单的二分类判别器项目（在这个过程中学习关于模型性能的评价指标，如accuracy，precision，recall，混淆矩阵）

GCN和GCN在文本分类中应用

【bzoj1009】: [HNOI2008]GT考试字符串-kmp-矩阵乘法-DP

2022-06-11：注意本文件中，graph不是邻接矩阵的含义，而是一个二部图。在长度为N的邻接矩阵matrix中，所有的点有N个，matrix[i][j]表示点i到点j的距离或者权重，而在二部