《一起学图数据库》之一:图数据库介绍
发布时间:2022-09-29 14:41:22 所属栏目:Asp教程 来源:
导读: 声明:本系列文章是《图数据库(第二版)》的读书笔记,内容是笔者消化之后多转述。需要阅读原书的可以自己购买,或者从网站(graphdbs.com)/公众号(graphdbs)下载高清扫描版电子书。
一、图是什么
一、图是什么
|
声明:本系列文章是《图数据库(第二版)》的读书笔记,内容是笔者消化之后多转述。需要阅读原书的可以自己购买,或者从网站(graphdbs.com)/公众号(graphdbs)下载高清扫描版电子书。 一、图是什么 形式上,图是点和边的组合;术语上,图是「一些节点」和「关联这些节点的联系」的组合。 图广泛存在于世界之中,从人与人之间的联系、工厂与消费者之间的联系到电话与数据中心网络节点之间的关系、基因和蛋白质之间的关联,都会涉及大量的高度关联数据。这些数据构成了庞大的图,图数据库就是呈现和查询这些关联的做好的方式。 如图中的小型社交网络图,「点」被标记为用户,每个用户有一个名字(微博名字不允许重复);用户之间的关注关系就是他们之间的联系,也就是「边」。 实际场景中的图要比上图复杂的多的多,一个节点只有一个名字属性,一个边只有一个关注标签是不可能满足需求的,所以带标签的属性图(labeled property graph)是目前最流行的图模型形式。带标签的属性图有几个特点: 二、图数据库发展趋势 从2013年开始,图数据库(neo4j为例)和大数据(Hive) 都开始进入增长阶段,相对来说,neo4j的增长趋势更为强烈;到了2016年,二者都开始进入稳定期。可见,图数据库的应用领域其实是非常可观的。而相对来说,国内图数据库领域刚刚开始起步,而且不管是应用还是技术都在摸索阶段。这正是一个非常合适的学习图数据库,迎合技术发展趋势的时机。 三、图数据库的领域概览 这部分大部分直接引用书中内容。 按照「应用场景」,图领域主要分为2部分: (1)图数据库 图数据库,是图数据库管理系统的简称,它是一种在线的图数据库管理系统,支持对图数据模型的增、删、改、查(CRUD)方法。图数据库一般应用于事务(OLTP)系统中asp数据库,所以在研究图数据库技术时需要多加考虑2个特性: 相比于传统的关系型数据库和其他NoSQL数据库,免索引邻接带了了非常巨大的性能优势,而且我们得到的模型更简单,更具表现力。 (2)图计算引擎 图计算引擎技术,偏重于全局查询,通常都对与批处理大规模数据做过优化。只有一部分图计算引擎有自己的存储层,其他的都只关注与如果处理外部传入的数据,然后返回结果到其他地方保存。图计算引擎以Giraph为代表。 大多数的图计算引擎都是基于Google发布的Pregel白皮书,白皮书中主要介绍了Google如何使用图计算引擎计算网页排名,白皮书地址:people.apache.org/~edwardyoon/documents/pregel.pdf 四、图数据库的优势 事实上,我们可以将任何东西都建模成图,但是现实世界中的技术选型时需要很多考量(预算、排期、技术难度、企业标准、商业化等等),所以图数据库的推广,除了合适的应用场景(社交、推荐、网络和数据中心等),必需还要保证强大的性能、灵活的数据模型。 五、现实中的图 这部分是原书第五章的内容,因为涉及到很多模型,查询语法等。所以这里只有简述,描述一下应用场景。 (1)社交和推荐 推测社交关系(相似用户推荐)、寻找有特定爱好的人、加入校友/同事联系 (2)授权和访问控制 寻找管理员可以访问的全部资源、判断管理员是否可以访问某一资源、找到一个账号的管理员 (3)地理空间和物流 路由计算、最短路径 六、书之外的 除了书中介绍了,目前在国内,图数据库的主要应用领域是知识图谱和欺诈检测。 知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。比如百度搜索“邓超的老婆”,百度的知识图谱技术会之间高速你答案“孙俪”。 反欺诈是风控中非常重要的一道环节。基于大数据的反欺诈的难点在于如何把不同来源的数据(结构化,非结构)整合在一起,并构建反欺诈引擎,从而有效地识别出欺诈案件(比如身份造假,团体欺诈,代办包装等)。而且不少欺诈案件会涉及到复杂的关系网络,这也给欺诈审核带来了新的挑战。 图数据库,作为关系的直接表示方式,可以很好地解决这两个问题。 (编辑:云计算网_汕头站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
站长推荐


浙公网安备 33038102330478号