Gremlin基本使用

article/2025/10/7 17:13:17

Gremlin简介

Gremlin是Apache TinkerPop 框架下的图遍历语言。Gremlin是一种函数式数据流语言,可以使得用户使用简洁的方式表述复杂的属性图(property graph)的遍历或查询。每个Gremlin遍历由一系列步骤(可能存在嵌套)组成,每一步都在数据流(data stream)上执行一个原子操作。

Gremlin包括三个基本的操作:

  • map-step
    对数据流中的对象进行转换;
  • filter-step
    对数据流中的对象就行过滤;
  • sideEffect-step
    对数据流进行计算统计;

以下是Gremlin在一些场景中的具体应用:

  • 1.查找Gremlin朋友的朋友

    g.V().has("name","gremlin").out("knows").out("knows").values("name")
  • 2.查找那些由两个朋友共同创建的项目

    g.V().match(as("a").out("knows").as("b"),as("a").out("created").as("c"),as("b").out("created").as("c"),as("c").in("created").count().is(2)).
    select("c").by("name")
  • 3.给出Gremlin的所有上司,直至CEO

    g.V().has("name","gremlin").repeat(in("manages")).
    until(has("title","ceo")).path().by("name")
  • 4.获得Gremlin合作者的头衔分布

    g.V().has("name","gremlin").as("a").out("created").in("created").
    where(neq("a")).groupCount().by("title")
  • 5.获取Gremlin购买产品的相关产品列表并排序

    g.V().has("name","gremlin").out("bought").aggregate("stash").in("bought").out("bought").
    where(not(within("stash"))).groupCount().order(local).by(values,decr)
  • 6.获取排名前十的中心人物

    g.V().hasLabel("person").pageRank().
    by("friendRank").
    by(outE("knows")).order().by("friendRank",decr).limit(10)

OLTP 和 OLAP遍历

  • 一次编写,到处运行
    Gremlin遵循“一次编写,到处运行”的设计哲学。这意味着不仅所有的TinkerPop启用的图形系统都能执行Gremlin遍历,而且每个Gremlin遍历都可以被评估为实时数据库查询或批处理查询。(前者被称为在线交易流程(OLTP),后者被称为在线分析流程(OLAP))。

  • 协调多种图遍历
    这种普遍性是由Gremlin遍历机实现的。这种分布式、基于图形的虚拟机了解如何协调多机器图遍历的执行。好处是,用户不需要学习数据库查询语言和域特定的BigData分析语言(例如Spark DSL,MapReduce等)。Gremlin是构建基于图的应用程序所必要的,其余一切都交给Gremlin遍历机处理。

命令式和声明式遍历

Gremlin遍历可以以命令式(程序式)方式,声明性(描述性)方式编写,也可以包含命令性和声明性的混合方式编写。

  • 命令式编写方式
    获得Gremlin合作者的上司名字分布:

    g.V().has("name","gremlin").as("a").out("created").in("created").
    where(neq("a")).in("manages").groupCount().by("name")

    一个命令式的Gremlin遍历告诉运行器如何执行遍历中的每一步;然后,遍历器分裂到所有的“Gremlin”的合作者(去除Gremlin自己);下一步,遍历器走到“Gremlin”合作者的上司(managers),最终根据上司的名字进行统计分发。

之所以是命令式的Gremlin遍历,就是它明确地、程序化地告诉遍历器“去这里,然后去那里”。

  • 声明式编写方式
    以下使用声明式编写方式实现了同样的结果:

    g.V().match(as("a").has("name","gremlin"),as("a").out("created").as("b"),as("b").in("created").as("c"),as("c").in("manages").as("d"),
    where("a",neq("c"))).select("d").groupCount().by("name")

    声明式的Gremlin遍历并不能告诉遍历器执行它们的步骤的顺序,而是允许每个遍历器从一个(可能嵌套的)模式的集合中选择一个模式来执行。

然而,声明遍历具有额外的好处,它不仅利用了编译时查询计划器(如命令式遍历),而且还是一个运行时查询计划器,根据每个模式的历史统计信息选择下一个执行哪个遍历模式 - 有利于那些倾向于减少/过滤大多数数据的模式。

用户可以选择上述提出的方式编写自己的遍历语句。不管怎样,用户的遍历语句都会根据具体的执行引擎和遍历策略traversal strategies被重写。Gremlin为用户提供灵活性表达自己的查询的;图系统也针对具体启用TinkerPop的数据系统进行有效地评估图遍历提供了灵活性。

无缝嵌入主语言

  • 统一主开发语言和图查询语言
    经典数据库查询语言(如SQL)被认为与最终在生产环境中使用的编程语言截然不同。因此,经典数据库要求开发人员既要编写主编程语言,还要编写数据库相应的查询语言。Gremlin统一了这个划分,因为遍历可以用支持功能组合和嵌套(主要编程语言都支持)的任何编程语言编写。因此,用户的Gremlin遍历可以使用应用程序语言(主语言,Host language)编写,并受益于主语言及其工具(例如类型检查,语法高亮,点完成等)所提供的优点。目前存在各种Gremlin语言变体,包括:Gremlin-Java,Gremlin-Groovy,Gremlin-Python,Gremlin-Scala等。

  • 示例程序
    比较以下两种方式,高低立判:

    public class GremlinTinkerPopExample {public void run(String name, String property) {Graph graph = GraphFactory.open(...);
    GraphTraversalSource g = graph.traversal();double avg = g.V().has("name",name).out("knows").out("created").values(property).mean().next();System.out.println("Average rating: " + avg);}
    }
public class SqlJdbcExample {public void run(String name, String property) {Connection connection = DriverManager.getConnection(...)Statement statement = connection.createStatement();ResultSet result = statement.executeQuery("SELECT AVG(pr." + property + ") as AVERAGE FROM PERSONS p1" +"INNER JOIN KNOWS k ON k.person1 = p1.id " +"INNER JOIN PERSONS p2 ON p2.id = k.person2 " +"INNER JOIN CREATED c ON c.person = p2.id " +"INNER JOIN PROJECTS pr ON pr.id = c.project " +"WHERE p.name = '" + name + "');System.out.println("Average rating: " + result.next().getDouble("AVERAGE")}
}

参考资料

The Gremlin Graph Traversal Machine and Language


http://chatgpt.dhexx.cn/article/FL1Vgamf.shtml

相关文章

Gremlin语法学习笔记

hugegraph查询使用Gremlin语法,打开 hugegraph-studio http://10.0.0.50:18088,更详细的方法参考 http://kelvinlawrence.net/book/Gremlin-Graph-Guide.html#fuzzyregs 导入数据,jar包参考 https://git.gtapp.xyz/ml/graph-user&#xff0c…

从零开始Gremlin学习

从零开始Gremlin学习 创建schema和图 以下面这个ThinkerPop关系图为例 在建图之前,首先需要创建schema,创建的schema有属性、节点、和边缘,正常情况下是按照属性->节点->边缘,因为在定义及节点label的时候需要有属性&…

基于Gremlin语言图数据库查询的优化

图谱结构: 其中query标签的结构: 列名类型说明idinteger唯一主键classstring类别 a_[a|b|c|d|e|f]标签的结构 列名类型说明idinteger唯一主键classstring类别,关联到query的类别namestring名称 b_[a|b|c|d|e|f]标签的结构 列名类型说明id…

Gremlin学习笔记

前言 本文基于HugeGraph提供的HugeGraph-Studio编写示例代码,下图是示例关系图,示例数据在文末 基本概念 Gremlin是Apache TinkerPop框架下规范的图语言,相当于SQL之于关系型数据库 节点Vertex:一般指实体,如&#xf…

gremlin图查询插件

gremlin是一个通用的图查询插件,尽管在neo4j上可以使用Cypher语言进行查询,但我仍想调研一下通过gremlin查询neo4j。 1. 安装 插件下载地址:https://archive.apache.org/dist/tinkerpop/,这里下载了3.4.4版本的console和server压…

gremlin语法详解

初步认识 点:蓝色的圈代表顶点(查询语句中的V()),圈中的person代表顶点的名称,name和age为顶点的属性。 边:黑色的线代表边(查询语句中的E()),线上的knows代表边的名称,weight为边…

gremlin语句详解

到了新公司用到了tinkerPop的gremlin语句,由于是全英文的文档。为了杜绝我鱼记忆,决定整理一下以后查看方便。嗯嗯~ o(* ̄▽ ̄*)o 附图:语句来源于图片 初步认识: 点:蓝色的圈代表顶点&#xff…

图数据库入门教程-深入学习Gremlin(1):图基本概念与操作

前言:Gremlin语言是图数据库最主流的查询语言,是Apache TinkerPop框架下规范的图语言,相当于SQL之于关系型数据库。为了图数据库使用者更好的掌握Gremlin这门图语言,我们对Gremlin Steps进行了分类与总结,接下来将会出…

Gremlin:图遍历语言

Gremlin简介 Gremlin是Apache TinkerPop 框架下的图遍历语言。Gremlin是一种函数式数据流语言,可以使得用户使用简洁的方式表述复杂的属性图(property graph)的遍历或查询。每个Gremlin遍历由一系列步骤(可能存在嵌套)…

TWR双边测距

本篇承接UWB那篇,专门介绍下双边测距的原理。 1.单侧双边测距 如上图所示,设备A发起交换,设备B响应完成交换,每个设备精确地记录发送和接收时间戳信息。设备B在收到设备A的信号后,延迟固定的时间回发信号&#xff0…

Java 7 - TWR 和 多异常捕获 示例

为什么80%的码农都做不了架构师?>>> package interview.blob_clob;import java.io.FileInputStream; import java.io.IOException; import java.io.InputStream; import java.sql.Connection; import java.sql.DriverManager; import java.sql.Prepared…

TWR_MPC8309调试日志

版权声明:本文为博主原创文章,未经博主允许不得转载。 TWR_MPC8309调试日志 --------By Moresung Chan , At 12:00 ,Sep 16,2012 一、软硬件: PC机操作系统:Microsoft Windows Server 2003 R2 开发板:TWR_MPC8309、…

DWM1000 测距原理简单分析 之 SS-TWR代码分析2 -- [蓝点无限]

蓝点DWM1000 模块已经打样测试完毕,有兴趣的可以申请购买了,更多信息参见 蓝点论坛 正文: 首先将SS 原理介绍中的图片拿过来,将图片印在脑海里。 对于DeviceA 和 DeviceB来说,初始化代码都一样,而后面部分…

Java 处理资源的try语句 (try-with-resources, TWR)

JAVA中try块的标准形式很通用,但有些常见的情况需要开发者小心编写catch和finally块。这些情况是清理或关闭不再需要使用的资源。 正常情况下,我们用try-catch-finally语句来实现打开文件资源,最后再关闭清理文件资源。例如下面的代码&#…

DWM1000 测距原理简单分析 之 SS-TWR

蓝点DWM1000 模块已经打样测试完毕,有兴趣的可以申请购买了,更多信息参见 蓝点论坛 正文: DWM1000 超宽带测距,使用的TOF(time of fly) 的方式,也就是计算无线电磁波传输时间,通过传输的时间换算成距离。 电磁波传输速率和光速一样,速度是299792.458km/s,可参见百度百…

完成“LPS node 与Crazyflie在TWR协议下的成功双向测距”实现心路历程总结

完成“LPS node 与Crazyflie在TWR协议下的成功双向测距”实现心路历程总结 1.初识TWR协议2. TWR进阶1.03.TWR协议进阶2.04.TWR协议进阶3.05.TWR协议进阶4.06.总结 说来惭愧,这一点点东西做了快3个月[手动狗头.jpg] 但是这个协议的深入学习让我真正认识到研究生该怎样…

惠普台式机EliteDesk TWR安装双系统

关于HP EliteDesk 800 G4 TWR安装双系统 磁盘分区BIos界面操作Linux系统安装 由于需要在Linux系统下跑ros,但电脑有安装win10系统,为了不破坏Win10系统内的资料,所以就选择安装双系统,根据我之前的安装经验,装个双系统…

24C02 Twr

连续写24C02,只有第一次能够成功,后面写都失败了。这次调整写的时间间隔。调成了5ms,才成功。 查看datasheet,发现有一个tWR参数。表示写的最小时间间隔。这个时间应该是内部写入所需要的时间,如果连续写的时间过短,就会失败。 但…

DWM1000 测距原理简单分析 之 SS-TWR代码分析1 -- [蓝点无限]

蓝点DWM1000 模块已经打样测试完毕,有兴趣的可以申请购买了,更多信息参见 蓝点论坛 正文: 这一篇内容主要是通过官方源码理解SS-TWR 细节 代码下载链接:https://download.csdn.net/download/duanfei255/10787882 所有代码使用方法:复制example 中的main.c到Keil MDK工…

UWB定位算法比较TDOA和TWR究竟哪个好

使用UWB技术进行定位时,有两种基本定位算法:基于差分飞行时间(TDOA)和双向测距(TWR)的UWB定位算法,这两种算法各有优劣,下面将进行比较。 超宽带是一种可用于室内定位的短距离无线电…