百度自研国内首个开源图数据库:Apache HugeGraph1.0.0版本发布

据百度安全官方消息,日前,Apache HugeGraph (incubating) 第一个 Apache Release 版本 1.0.0 已正式发布。

D840D2215C589EC8D81A0493F154CB7F81A160A2_size19_w962_h548

HugeGraph 是百度安全于 2017 年自主研发的国内首个开源图数据库,提供了一站式的千亿级大规模图数据的存储、在线查询、离线分析能力,广泛应用于社交网络、广告推荐、网络安全、金融风控、智能机器人等场景。

HugeGraph 于 2018 年开源,2022 年 1 月正式通过世界顶级开源组织 Apache 软件基金会的投票决议,以全票通过的优秀表现正式成为全球首个加入 Apache 孵化的图数据库项目,同年 5 月正式入驻 Apache 开启孵化,促使国产图数据库走向世界。

截至IT之家发文,HugeGraph 在 GitHub 上具有 2200+ Stars。此外,项目总 Contributors 数量超过 80 名,社区版本下载量超过 2 万,并有超过 100 个社区用户、组织在使用,包括网商银行、网易游戏、360 安全、滴滴、科大讯飞、虎牙直播、CVTE、货拉拉等。

485BE7FE39AC8FD7799572D36B9030496E83758B_size73_w623_h1129

据介绍,Apache HugeGraph 1.0.0 版本在性能和实用性、易用性上做了大量改进和修复,包含 25000+ 行 Pull Request 代码变更提交:

在系统语言上,图数据库与图计算等组件均升级适配 Java 11,已覆盖所有子项目,并新增支持 Cypher 图查询语言,目前已同时支持 Gremlin 与 Cypher 两大主流图查询语言;

在服务器上支持更多内置图算法,包括 16 个 OLAP 算法包括:LPA、 Louvain、 PageRank、 Betweenness / Closeness / Eigencentrality Centrality、 RingsDetect 等,2 个 OLTP 算法,包括:adamic-adar 和 resource-allocation;

在大规模并行图计算框架 (Computer) 上,支持海量图数据的 MPP 计算,尤其是扩散性 / 中心性等空间消耗大的算法,支持 K8s Standalone (单机) 模式,预留 Yarn 接口可实现直接对接;

在大数据组件支持上,新增支持 Flink CDC 数据流式与同步导入、 Spark 批量导入数据、支持 Bypass Server 模式,大幅提高了图数据库的在线 / 离线场景下的导入 / 导出 / 图迁移性能和方便性;

2260F662C1CD74E697BB05AA664BB4C6CA098239_size71_w1258_h600

在易用性上,提供一键 Server / Hubble 容器化 Docker 支持,重构整合图周边工具链为 HugeGraph Toolchain 等 120 多项细节版本更新。

via ithome

订阅评论
提醒
guest的头像

0 评论
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x