论文解读 | GraphText —— 图到文本的映射

Yuyao Ge 葛钰峣

Nov 14, 2023 1 min read 论文分享

Title: GraphText: Graph Reasoning in Text Space

Institute: Université de Montréal

Authors: Jianan Zhao, Le Zhuo, Yikang Shen, Meng Qu, Kai Liu, Michael Bronstein, Zhaocheng Zhu, Jian Tang

link: https://arxiv.org/abs/2310.01089

Date: 2023.10.02

介绍

之前我们介绍过使用大模型来解决图问题的两篇论文，两篇文章的作者将LLM Reasoning领域的Prompt引入到图问题上进行实验并提出BenchMark。尽管两文成果颇丰，但是并没有针对图的特点提出新的Prompt生成方式。在本文，作者跟据图结构的特点提出了一种将图映射到文本空间的框架GRAPHTEXT。

GRAPHTEXT为每个图创建其对应的图语法树，图语法树同时封装了节点属性和节点间关系。通过遍历这棵树，可以产生图文序列，然后通过大型语言模型（LLM）处理，将图形任务视为文本生成任务。

除了将图空间映射到文本空间这一最大的优点外，本文还有如下贡献:

传统的GNN方式需要针对每一个图训练一个GNN模型，而本文只需要通用的LLM通过上下文学习就可以了
GRAPHTEXT是一套通用框架，在普通图和文本属性图上都可以使用
可交互

方法论

概述

本方法可用如下公式概括:

{\tilde{y}}_{i} = h (f_{L L M} (g (G)_{i}; ϕ))

参数表:

$G$ 图
$g (G)_{i} = T_{i n} [i]$ $i$ 节点的文本表述
$ϕ$ LLM参数
$f_{LLM} (\cdot; ϕ) : T \to T$ 基于LLM的映射函数，在输入和输出上都处于文本空间
$h : T_{o u t} \mapsto \tilde{Y}$ 将LLM的输出映射至label

图语法树的构建

首先需要明确的是在本文，图由两个部分构成，分别是节点的属性。

图语法树的根节点是空节点，叶子节点 ${\tilde{T}}_{L}$ 是图节点的文本属性，中间节点 ${\tilde{T}}_{I}$ 是自然语言序列。

图语法树的构建可由三部分构成

首先构建自我子图（ego-subgraph）
选择叶子节点
构建中间节点和边

如上图(c) 所示，图中的属性为 $F = F_{X} [i], F_{Y} [i] | \forall v_{i} \in V$ ，关系被定义为最短路 : center-node, 1st-hop, and 2nd-hop，即 $R = R_{SPD = 0}, R_{SPD = 1}, R_{SPD = 2}$ 。以0为中心点，自我子图被构建了起来。然后构建叶子节点 $\tilde{T_{L}} = F_{X} [0], F_{X} [1], F_{X} [2] F_{X} [3], F_{X} [4], F_{Y} [1], F_{Y} [3]$ 、中间节点 ${\tilde{T}}_{I} = {“center-node",“ 1 st- hop",“2nd-hop”,“label”,“feature”}$ 和树的边。最后遍历图语法树即可生成自然语言序列。

LLM Graph

论文解读 | GraphText —— 图到文本的映射

介绍

方法论

概述

图语法树的构建

Yuyao Ge 葛钰峣

Ph.D Student