论文解读 | GraphText —— 图到文本的映射

Title: GraphText: Graph Reasoning in Text Space

Institute: Université de Montréal

Authors: Jianan Zhao, Le Zhuo, Yikang Shen, Meng Qu, Kai Liu, Michael Bronstein, Zhaocheng Zhu, Jian Tang

link: https://arxiv.org/abs/2310.01089

Date: 2023.10.02

介绍

之前我们介绍过使用大模型来解决图问题的两篇论文,两篇文章的作者将LLM Reasoning领域的Prompt引入到图问题上进行实验并提出BenchMark。尽管两文成果颇丰,但是并没有针对图的特点提出新的Prompt生成方式。在本文,作者跟据图结构的特点提出了一种将图映射到文本空间的框架GRAPHTEXT

GRAPHTEXT为每个图创建其对应的图语法树,图语法树同时封装了节点属性和节点间关系。通过遍历这棵树,可以产生图文序列,然后通过大型语言模型(LLM)处理,将图形任务视为文本生成任务。

除了将图空间映射到文本空间这一最大的优点外,本文还有如下贡献:

  • 传统的GNN方式需要针对每一个图训练一个GNN模型,而本文只需要通用的LLM通过上下文学习就可以了

  • GRAPHTEXT是一套通用框架,在普通图和文本属性图上都可以使用

  • 可交互

方法论

概述

本方法可用如下公式概括:

y~i=h(fLLM(g(G)i;ϕ))

参数表:

  • G

  • g(G)i=Tin[i] i节点的文本表述

  • ϕ LLM参数

  • fLLM(;ϕ):TT 基于LLM的映射函数,在输入和输出上都处于文本空间

  • h:ToutY~ 将LLM的输出映射至label

图语法树的构建

首先需要明确的是在本文,图由两个部分构成,分别是节点的属性。

图语法树的根节点是空节点,叶子节点 T~L是图节点的文本属性,中间节点T~I是自然语言序列。

图语法树的构建可由三部分构成

  1. 首先构建自我子图(ego-subgraph)

  2. 选择叶子节点

  3. 构建中间节点和边

如上图(c) 所示,图中的属性为 F=FX[i],FY[i]|viV,关系被定义为最短路 : center-node, 1st-hop, and 2nd-hop,即 R=RSPD=0,RSPD=1,RSPD=2。以0为中心点,自我子图被构建了起来。然后构建叶子节点 TL~=FX[0],FX[1],FX[2]FX[3],FX[4],FY[1],FY[3]、中间节点 T~I={“center-node",“1st-hop",“2nd-hop”,“label”,“feature”}和树的边。最后遍历图语法树即可生成自然语言序列。